NLP 領域最優秀的 8 個預訓練模型（附開源地址）

2019-03-27 11:58:10 InfoQ

介紹

如今，自然語言處理（Natural Language Processing，NLP）應用已經變得無處不在。我似乎總是不經意間發現一些網站和應用程序，以這樣的或那樣的形式利用了自然語言處理技術。簡而言之，現在就是涉足自然語言處理領域的絕佳時機。

自然語言處理應用能夠快速增長，很大程度上要歸功於通過預訓練模型實現遷移學習的概念。在自然語言處理的背景下，遷移學習本質上是在一個數據集上訓練模型，然後對該模型進行調整，以在不同的數據集上執行不同的自然語言處理功能。

這一突破，使得每個人都能夠輕鬆地完成任務，尤其是那些沒有時間、也沒有資源從頭開始構建自然語言處理模型的人們。對於想要學習或過渡到自然語言處理的初學者來講，它也堪稱完美。

為什麼要使用預訓練模型？

作者已盡其所能設計了基準模型。我們可以在自己的自然語言處理數據集上使用預訓練模型，而不是從頭構建模型來解決類似的自然語言處理問題。
儘管仍然需要進行一些微調，但它已經為我們節省了大量的時間和計算資源。

在本文中，我將介紹一些頂級的預訓練模型，你可以用它們來開始你的自然語言處理之旅，並複製該領域的最新研究成果。

如果你是自然語言處理的初學者，我建議你參加我們的熱門課程：《NLP using Python》（《使用 Python 進行自然語言處理》）：https://courses.analyticsvidhya.com/courses/natural-language-processing-nlp?utm_source=blog&utm_medium=top-pretrained-models-nlp-article*

本文介紹的預訓練自然語言處理模型

我根據應用，將預處理模型分為三類：

多用途自然語言處理模型
ULMFiT
Transformer
Google BERT
Transformer-XL
OpenAI GPT-2
詞嵌入
ELMo
Flair
其他預訓練模型
StanfordNLP

多用途自然語言處理模型

多用途模型是自然語言處理領域的熱門話題。這些模型為機器翻譯、問答系統、聊天機器人、情緒分析等我們感興趣的自然語言處理應用提供了動力。這些多用途自然語言處理模型的核心組件是語言建模的概念。

簡單來說，語言模型的目的是預測序列中的下一個單詞或字符。我們在這裡看到每種模型時，都會理解這一點。

如果你是自然語言處理的愛好者，那麼你將會喜歡這一節。現在，讓我們深入研究這 5 個最先進的多用途自然語言處理模型框架吧。對於每個模型，我都提供了研究論文和預訓練模型的鏈接。讓我們繼續探索吧！

ULMFiT

GitHub 項目地址：https://github.com/fastai/fastai/tree/master/courses/dl2/imdb_scripts

ULMFiT 由 fast.ai 的 Jeremy Howard 和 DeepMind 的 Sebastian Ruder 提出並設計。你可以說 ULMFiT 是去年啟動遷移學習派對的發行版。

正如我們在本文中所述，ULMFiT 使用新的自然語言生成技術實現了最先進的結果。該方法包括在 Wikitext 103 數據集上訓練的預處理語言模型進行微調，使其不會忘記以前所學的內容，從而將其微調為一個新的數據集。

在文本分類任務方面，ULMFiT 的性能優於許多最先進的技術。我喜歡 ULMFiT 的原因是，它只需要很少的例子就可以產生這些令人印象深刻的結果。讓像你我這樣的人更容易理解，並在我們的機器上實現它！

如果你好奇 ULMFiT 為什麼叫這個名，我會告訴你，ULMFiT 其實就是 Universal Language Model Fine-Tuning（通用語言模型微調）的縮寫。“Universal”（通用）這詞用在這裡非常貼切，因為這個框架幾乎可以應用於任何自然語言處理任務。

有關 ULMFiT 的更多信息，請參閱以下資源：

《Tutorial on Text Classification (NLP) using ULMFiT and fastai Library in Python》（《在 Python 中使用 ULMFiT 和 fastai 庫的文本分類（自然語言處理）教程》）：
https://www.analyticsvidhya.com/blog/2018/11/tutorial-text-classification-ulmfit-fastai-library/?utm_source=blog&utm_medium=top-pretrained-models-nlp-article
ULMFiT 的預訓練模型：https://www.paperswithcode.com/paper/universal-language-model-fine-tuning-for-text
研究論文：https://arxiv.org/abs/1801.06146

Transformer

GitHub 項目地址：https://github.com/tensorflow/models/tree/master/official/transformer

Transformer 架構是自然語言處理領域最近幾乎所有主要發展的核心，2017 年由 Google 推出。當時，RNN 遞歸神經網絡被用於語言任務，如機器翻譯和問答系統。

這種 Transformer 架構的性能優於 RNN 和 CNN（卷積神經網絡）。而且訓練模型所需的計算資源也大為減少。對自然語言處理的每個人來講，這種結果是雙贏的局面。看看下面的對比：

根據 Google 的說法，Transformer“應用了一種自注意力（self-attention）機制，可以直接模擬句子中所有單詞之間的關係，無論這些單詞的位置如何”。它使用固定大小的上下文（也就是前面的單詞）來實現這一點。是不是覺得太複雜了？讓我們舉個例子來簡化這個。

“She found the shells on the bank of the river.”模型需要理解這裡的“bank”是指河岸，而不是金融機構。Transformer 只需一步就能理解這一點。我建議你閱讀下面給出鏈接的完整論文，以瞭解 Transformer 的工作原理。它會讓你大吃一驚。

下面的動圖很好地說明了 Transformer 是如何處理機器翻譯任務的：

Google 去年發佈了一款 Universal Transformer 的改進版。還有一個更新、更直觀的版本，叫做 Transformer-XL，我們將稍後予以介紹。

有關 Transformer 的更多信息，請參閱以下資源：

Google 的官方博客文章：https://ai.googleblog.com/2017/08/transformer-novel-neural-network.html
Transformer 的預訓練模型：https://www.paperswithcode.com/paper/attention-is-all-you-need
研究論文：https://arxiv.org/abs/1706.03762

Google BERT

GitHub 項目地址：https://github.com/google-research/bert

自 Google 公佈他們的結果以來，BERT 就一直在掀起波瀾，然後 Google 開源了它背後的代碼。我們可以討論這是否標誌著“自然語言處理領域的新時代”，但毫無疑問的是，BERT 是一個非常有用的框架，可以很好地推廣到各種自然語言處理任務。

BERT，是 Bidirectional Encoder Representations（雙向編碼器表示）的縮寫，它從單詞的兩邊（左邊和右邊）來考慮上下文。以前所有的努力方向，都是一次只考慮單詞的一邊，要麼是左邊，要麼是右邊。這種雙向性有助於模型更好地理解使用單詞的上下文。此外，BERT 的設計目標是能夠進行多任務學習，也就是說，它可以同時執行不同的自然語言處理任務。

BERT 是第一個無監督、深度雙向的自然語言處理模型預訓練系統。它只使用純文本語料庫進行訓練。

在發佈的時候，BERT 在 11 個自然語言處理任務上取得了最先進的結果。這真是相當了不起的成就！你可以在短短几個小時內（在單個 GPU 上）使用 BERT 訓練自己的自然語言處理模型（例如問答系統）。

有關 BERT 的更多信息，請參閱以下資源：

Google 官方博客文章：https://ai.googleblog.com/2018/11/open-sourcing-bert-state-of-art-pre.html

BERT 預訓練模型：https://www.paperswithcode.com/paper/bert-pre-training-of-deep-bidirectional#code
研究論文：https://arxiv.org/pdf/1810.04805.pdf

Google Transformer-XL

GitHub 項目地址：https://github.com/kimiyoung/transformer-xl

從長遠來看，Google 的這一發行版對自然語言處理領域來說可能是一個非常重要的版本。如果你是一名菜鳥，這個概念可能會變得有點棘手，所以我建議你多讀幾遍來掌握它。我還會在這一節中提供一些資源，幫助你開始入門 Transformer-XL。

想象一下，你正在讀一本書，讀到一半的時候，書中突然出現了某個單詞或句子，而這些在這本書的開頭都提到過。這時候，你我都能回憶起那些單詞或句子指的是什麼意思。但機器很難建立模擬長期依賴（long-term dependency）的模型，這是可以理解的。

如上所述，實現這一點的一種方法是使用 Transformer。但它們是在固定長度的上下文實現的。換句話說，如果使用這種方法，就沒有多少靈活性而言。

而 Transformer-XL 很好地彌補了這一缺陷。它由 Google AI 團隊開發，是一種新型的自然語言處理架構，可以幫助機器理解超出固定長度限制的上下文。Transformer-XL 比普通的 Transformer 要快上 1800 倍。

你可以通過 Google 發佈的兩個動圖來了解這一區別：

普通 Transformer

Transformer-XL

正如你現在所預測的，Transformer-XL 在各種語言建模基準 / 數據集上實現了最新的、最先進的結果。下面是他們網頁上的一張表，展示了這一點：

Methodenwiki8text8One Billion WordWT-103PTB (w/o finetuning)Previous Best1.061.1323.720.555.5Transformer-XL0.991.0821.818.354.5

上面的鏈接和下面提到的 Transformer-XL GitHub 存儲庫包含 PyTorch 和 TensorFlow 中的代碼。

有關 Transformer-XL 的更多信息，請參閱以下資源：

Google 官方博客文章：https://ai.googleblog.com/2019/01/transformer-xl-unleashing-potential-of.html
Transformer-XL 的預訓練模型：https://www.paperswithcode.com/paper/transformer-xl-attentive-language-models
研究論文：https://arxiv.org/abs/1901.02860

OpenAI GPT-2

GitHub 項目地址：https://github.com/openai/gpt-2

目前這是一個頗有爭議的條目。一些人可能會認為 GPT-2 的發佈就是 OpenAI 的營銷噱頭。我當然理解他們的想法。然而，我還是認為，至少嘗試一下 OpenAI 發佈的代碼還是很重要的。

首先，我得為那些不知道我在說什麼的人們提供一些背景信息。OpenAI 在 2 月份的時候發表了一篇博文，聲稱他們已經設計了一個自然語言處理模型，表現非常出色，以至於他們擔心被惡意使用，而沒有選擇發佈完整版本。這當然引起了社區的關注。

GPT-2 經過訓練後，可以預測 40GB 互聯網文本數據的下一個出現的單詞。這個框架也是基於 Transformer 的模型，該模型在 800 萬個 Web 頁面的數據集進行訓練。他們在網站公佈的結果令人震撼。這個模型能夠根據我們輸入的寥寥可數的句子就編織出一個完全清晰的故事，請看看下面的這個例子：

難以置信，對吧？

為了供研究人員和工程師測試，開發人員發佈了一個小得多的 GPT-2 版本。原始模型有 15 億個參數，而開源的示例模型僅有 1.17 億個。

有關 GPT-2 的更多信息，請參閱以下資源：

OpenAI 官方博客文章：https://openai.com/blog/better-language-models/
GPT-2 的預訓練模型：https://github.com/openai/gpt-2
研究論文：https://d4mucfpksywv.cloudfront.net/better-language-models/language-models.pdf

詞嵌入

我們使用的大多數機器學習和深度學習算法都無法直接處理字符串和純文本。這些技術要求我們必須先將文本數據轉換為數字，然後才能執行任何任務（如迴歸和分類）。

因此，簡單來說，詞嵌入就是為了將文本塊轉換為用於執行自然語言處理任務的數字。詞嵌入格式通常嘗試使用字典將單詞映射到向量。

你可以在下面的文章中，更深入地理解詞嵌入、它的不同類型以及如何在數據集中使用它們。如果你不熟悉這個概念的話，我認為這份指南對你來說是必讀的：

《An Intuitive Understanding of Word Embeddings: From Count Vectors to Word2Vec》（《直觀理解詞嵌入：從計數向量到 Word2Vec》https://www.analyticsvidhya.com/blog/2017/06/word-embeddings-count-word2veec/?utm_source=blog&utm_medium=top-pretrained-models-nlp-article

在這一節中，我們將介紹自然語言處理領域中兩個最先進的詞嵌入。我還提供了教程的鏈接，這樣你就可以對每個主題有實際的理解。

ELMo

GitHub 項目地址：https://github.com/allenai/allennlp/blob/master/tutorials/how_to/elmo.md

不，這個 ELMo 可不是《Sesame Street》（《芝麻街》，美國芝麻街工作制坐坐的一檔著名的兒童教育電視節目）的角色。但這個 ELMo（是Embedding from Language Models 的縮寫）在構建自然語言處理模的上下文非常有用。

ELMo 是一種用向量和嵌入表示單詞的新方法。這些 ELMo 詞嵌入有助於我們在多個自然語言處理任務上獲得最先進的結果，如下所示：

讓我們花點時間來理解 ELMo 的工作原理。回憶一下我們之前討論過的雙向語言模型。從本文中得到的提示：“ELMo 詞向量是在雙層雙向語言模型（bidirectional language model，biLM）智商計算的。這個 biLM 模型有兩層堆疊在一起。每層有兩個通道：前向通道和後向通道。

ELMo 詞向量表示（word representations）考慮用於計算詞嵌入的完整輸入語句。因此“read”這個詞在不同的上下文中有不同的 ELMo 向量。這點與舊詞嵌入截然不同，對舊詞嵌入而言，無論單詞在什麼上下文中使用，這個單詞都會分配到相同的向量。

有關 ELMo 更多的信息，請參閱以下資源：

《Step-by-Step NLP Guide to Learn ELMo for Extracting Features from Text》（《自然語言處理入門指南：學習 ELMo 從文本中提取特徵》https://www.analyticsvidhya.com/blog/2019/03/learn-to-use-elmo-to-extract-features-from-text/?utm_source=blog&utm_medium=top-pretrained-models-nlp-article
用於預訓練模型的 GitHub 存儲庫：https://github.com/allenai/allennlp/blob/master/tutorials/how_to/elmo.md
研究論文：https://arxiv.org/pdf/1802.05365.pdf

Flair

GitHub 項目地址：https://github.com/zalandoresearch/flair

Flair 並不完全是詞嵌入，而是詞嵌入的組合。我們可以稱 Flair 更多的是一個自然語言處理程序庫，它結合了 GloVe、BERT、EMLo 等嵌入。Zalando Research 的優秀人員開發並開源了 Flair。

該團隊已經為以下自然語言處理任務發佈了幾個預訓練模型：

Name-Entity Recognition （NER，名稱 - 實體識別）
Parts-of-Speech Tagging (PoS，詞性標註)
文本分類
訓練自定義模型

還不確定？那麼，看下面這張比較表就會讓你明白：

“Flair Embedding”是封裝在 Flair 庫中的簽名嵌入。它由上下文字符串嵌入提供支持。你應該自詡閱讀這篇文章《Introduction to Flair for NLP: A Simple yet Powerful State-of-the-Art NLP Library》（《Flair 簡介：簡單而強大的，最先進的自然語言處理庫》）來了解支持 Flair 的核心組件：https://www.analyticsvidhya.com/blog/2019/02/flair-nlp-library-python/?utm_source=blog&utm_medium=top-pretrained-models-nlp-article

我特別喜歡 Flair 的地方就是它能夠支持多種語言。如此多的自然語言處理版本都只做英語方面的任務。如果自然語言處理想在全球範圍內獲得吸引力的話，我們就必須超越這一點！

有關 Flair 更多的信息，請參閱以下資源：

《Introduction to Flair for NLP: A Simple yet Powerful State-of-the-Art NLP Library》（《Flair 簡介：簡單而強大的，最先進的自然語言處理庫》）：https://www.analyticsvidhya.com/blog/2019/02/flair-nlp-library-python/?utm_source=blog&utm_medium=top-pretrained-models-nlp-article
Flair 的預訓練模型：https://github.com/zalandoresearch/flair

其他預訓練模型

StanfordNLP

GitHub 項目地址：https://github.com/stanfordnlp/stanfordnlp

說到將自然語言處理擴展到英語之外，現在有一個已設置基準的庫了。據作者聲稱，StandfordNLP 支持超過 53 種語言，這當然引起了我們的關注。

我們的團隊是第一批使用該庫並在真實數據集上發佈結果的團隊之一。我們研究了一下，發現 StandfordNLP 確實為非英語語言中應用自然語言處理技術提供了很多可能性，比如印地語、漢語和日語。

StandfordNLP 是一個經過預訓練的、最先進的自然語言處理模型的集合。這些模型並不只是僅在實驗室內測試——在 2017 年、2018 年的 CoNLL 競賽作者就曾使用 StandfordNLP 參賽。在 StandfordNLP 中打包的所有預訓練自然語言處理模型都是基於 PyTorch 構建的，並且可以在你自己的註釋數據上進行訓練和評估。

我們認為，你應該考慮 StandfordNLP 的兩個主要原因是：

用於執行文本分析的完整神經網絡管道，包括：
標記化（Tokenization）
多詞標記擴展（Multi-word token (MWT) expansion）
詞性還原（Lemmatization）
詞性和詞形特徵標記（Parts-of-speech (POS) and morphological feature tagging）
依存句法分析（Dependency Parsing）
一個穩定的官方維護的 CoreNLP Python 接口

有關 StandfordNLP 的更多信息，請參閱以下資源：

《Introduction to StanfordNLP: An Incredible State-of-the-Art NLP Library for 53 Languages (with Python code)》（《StandfordNLP 簡介：令人難以置信的、最先進的自然語言處理庫，支持 53 種語言（使用 Python 實現）》）：https://www.analyticsvidhya.com/blog/2019/02/stanfordnlp-nlp-library-python/?utm_source=blog&utm_medium=top-pretrained-models-nlp-article

StandfordNLP 預訓練模型：https://github.com/stanfordnlp/stanfordnlp

尾注

本文絕不是預訓練自然語言處理模型的詳盡清單。還有更多可用的模型，你可以在這個網站上查看其中的一些：https://paperswithcode.com

下面是學習自然語言處理的一些有用資源：

《Natural Language Processing (NLP) Using Python》（《課程：使用 Python 進行自然語言處理（NLP）》）：https://courses.analyticsvidhya.com/courses/natural-language-processing-nlp?utm_source=blog&utm_medium=top-pretrained-models-nlp-article
Certified Program: NLP for Beginners（認證項目：NLP 初學者)：https://courses.analyticsvidhya.com/bundles/nlp-combo?utm_source=blog&utm_medium=top-pretrained-models-nlp-article
關於自然語言處理的文章集：https://www.analyticsvidhya.com/blog/category/nlp/?utm_source=blog&utm_medium=top-pretrained-models-nlp-article

原文鏈接：

https://www.analyticsvidhya.com/blog/2019/03/pretrained-models-get-started-nlp/

分享到:

閱讀更多 InfoQ 的文章

關鍵字: 機器人設計地址

開源：仿網易雲音樂的安卓應用

開源：仿網易雲音樂Android客戶端

開源：一個極好的講解算法的開源項目

開源：一個能讓你學會算法的開源項目

清華深度學習框架 Jittor 開源

【NLP】圖文並茂帶你細緻瞭解ELMo的各種細節

【NLP】一文完全搞懂序列標註算法

【NLP】從Transformer到BERT模型

IEEE2019編程語言排行榜:趨勢、開源、職位需求，Python都是第一

一文看懂 NLP 神經網絡發展歷史中最重要的 8 個里程碑[轉]

完勝 BERT，谷歌最佳 NLP 預訓練模型開源

白話 NLP，3 個因果告訴你 Mask 矩陣因何而產生？

「NLP」NLP的12種後BERT預訓練方法

「NLP」一文彙總自然語言處理主要研究方向

「NLP」BERT詳解，論文筆記

03.05 「NLP」如何匹配兩段文本的語義？

03.05 Syncthing：開源 P2P 文件同步工具

03.01 「NLP」初次BERT使用者的可視化指南

最簡單linux文件系統源碼開源

NeuNet2020:BRDNet(開源)使用深度CNN和批量歸一化進行圖像去噪

「開源」Golang實現的分佈式WebSocket微服務

開源、輕量、簡潔的商城小鋪系統

一文看懂 NLP 裡的模型框架 Encoder-Decoder 和 Seq2Seq

開源、強大的工作流引擎：camunda入門介紹

Gubernator 開源：高性能分佈式限速微服務項目

【開源】類似百度文庫的文庫網站系統

觀點｜當下 NLP 研究最棘手的 4 個問題

「開源」分佈式單點登錄框架XXL-SSO

「開源」一大波開源微信小程序

「開源」秒殺系統設計與實現

「開源」SpringCloud+vue搭建的商城項目

「開源」mall：一個完整的電商系統，前臺+後臺都有

「開源-前端」vue全家桶製作一個精緻的仿美團項目

「開源」springboot快速開發框架推薦，接私活利器

「開源」阿里巴巴重要開源項目彙總——前端篇（二）

「開源」阿里巴巴重要開源項目彙總——前端篇（一）

好用、開源、性能強大、自定義功能多的免費文件管理器

NLP-第十七期-神經網絡翻譯Seq2Seq代碼實踐 Keras

Facebook 開源 Skip，面向對象+函數式程式語言

Facebook 開源 Skip 面向對象函數式程式語言

機器不學習：NLP(5) TextCNN 調參，調包高手來了

GitHub Python數據科學聚焦：AutoML、NLP、可視化、ML工作流

收藏｜200個精選ML、NLP、Python及數學最佳教程（附連結）

超過 100 個最佳機器學習，NLP 和 Python高效教程

06.26 老司機都開火箭了！Cython 助力 Python NLP 實現百倍加速

小程序UI組件庫iView Weapp發布，開源、免費、分分鐘上手！

禁不了的開源——駁「開源『閉源』論」

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"