最全機器學習種類講解：監督、無監督、在線和批量學習都講明白了

2018-10-19 20:55:00 華章科技

導讀：現有的機器學習系統種類繁多，根據以下內容將它們進行分類有助於我們理解：

是否在人類監督下訓練（監督式學習、無監督式學習、半監督式學習和強化學習）
是否可以動態地進行增量學習（在線學習和批量學習）
是簡單地將新的數據點和已知的數據點進行匹配，還是像科學家那樣，對訓練數據進行模式檢測，然後建立一個預測模型（基於實例的學習和基於模型的學習）

這些標準之間互相併不排斥，你可以以你喜歡的方式將其任意組合。例如，現在最先進的垃圾郵件過濾器可能是使用深度神經網絡模型對垃圾郵件和常規郵件進行訓練，完成動態學習。這使其成為一個在線的、基於模型的、監督式學習系統。

作者：奧雷利安·傑龍（Aurélien Géron）

本文摘編自《機器學習實戰：基於Scikit-Learn和TensorFlow》，如需轉載請聯繫我們

我們來看看這幾個標準。

01 監督式/無監督式學習

根據訓練期間接受的監督數量和監督類型，可以將機器學習系統分為以下四個主要類別：監督式學習、無監督式學習、半監督式學習和強化學習。

1. 監督式學習

在監督式學習中，提供給算法的包含所需解決方案的訓練數據，稱之為標籤或標記（圖1-5）。

▲圖1-5：監督式學習中被標記的訓練集（例如，垃圾郵件分類）

分類任務是一個典型的監督式學習任務。垃圾郵件過濾器就是個很好的例子：通過大量的電子郵件示例及其所屬的類別（垃圾郵件或是常規郵件）進行訓練，然後學習如何對新郵件進行分類。

還有典型的任務，是通過預測變量——也就是一組給定的特徵（里程、使用年限、品牌等）——來預測一個目標數值，例如汽車的價格。這種類型的任務被稱為迴歸任務（圖1-6）。要訓練這樣一個系統，你需要提供大量的汽車示例，包括它們的預測變量和它們的標籤（也就是它們的價格）。

在機器學習裡，屬性是一種數據類型（例如“里程”）；而特徵取決於上下文，可能有多個含義，但是通常狀況下，特徵意味著一個屬性加上其值（例如，“里程=15,000”）。儘管如此，許多人還是會交替使用屬性和特徵這兩個名詞。

▲圖1-6：迴歸任務

值得注意的是，一些迴歸算法也可以用於分類任務，反之亦然。例如，邏輯迴歸就被廣泛地用於分類，因為它可以輸出“屬於某個給定類別的概率”的值（例如，20%的機率是垃圾郵件）。

這裡是一些最重要的監督式學習的算法：

K-近臨算法（k-Nearest Neighbors）
線性迴歸（Linear Regression）
邏輯迴歸（Logistic Regression）
支持向量機（Support Vector Machines，簡稱SVMs）
決策樹和隨機森林（Decision Trees and Random Forests）
神經網絡（Neural networks）

2. 無監督式學習

無監督式學習，顧名思義，你可能已經猜到，訓練數據都是未經標記的（圖1-7）。系統會在沒有老師的情況下進行學習。

▲圖1-7：無監督式學習的未標記訓練集

這裡有一些最重要的無監督式學習的算法：

聚類算法

k-平均算法（k-Means）
系統聚類分析（Hierarchical Cluster Analysis，簡稱HCA）
最大期望算法（Expectation Maximization）

可視化和降維

主成分分析（PCA）
核主成分分析（Kernel PCA）
局部線性嵌入（LLE）
t-分佈隨機近臨嵌入（t-SNE）

關聯規則學習

Apriori
Eclat

例如，假設你現在擁有大量的自己博客訪客的數據。你想通過一個聚類算法來檢測相似訪客的分組（圖1-8）。你不大可能告訴這個算法每個訪客屬於哪個分組——而是要它自己去尋找這種關聯，無需你的幫助。

比如說，它可能會注意到40%的訪客是喜歡漫畫的男性，並且通常是在夜晚閱讀你的博客，20%的訪客是年輕的科幻愛好者，通常是在週末訪問，等等。如果你使用的是層次聚類的算法，它還可以將每組細分為更小的組。這可能有助於你針對不同的分組來發布博客內容。

▲圖1-8：聚類

可視化算法也是無監督式學習算法的好例子：你提供大量複雜的、未標記的數據，得到輕鬆繪製而成的2D或3D的數據呈現作為輸出（圖1-9）。這些算法會盡其所能地保留儘量多的結構（譬如，嘗試保持讓輸入的單獨集群在可視化中不會被重疊），以便於你理解這些數據是怎麼組織的，甚至識別出一些未知的模式。

▲圖1-9：一個使用t-SNE算法的可視化示例，突顯了各種語義叢

與之相關的另一種任務是降維，降維的目的是在不丟失太多信息的前提下簡化數據。方法之一是將多個相關特徵合併為一個。例如，汽車的里程與其使用年限存在很大的相關性，所以降維算法會將它們合併成一個代表汽車磨損的特徵。這個過程被稱之為特稱提取。

通常比較好的做法是，先使用降維算法減少訓練數據的維度，再將其提供給另一個機器學習算法（例如監督式學習算法）。這會使它運行得更快，數據佔用的磁盤空間和內存都會更小，在某些情況下，執行性能也會更好。

另一個很重要的無監督式任務是異常檢測——例如，檢測異常信用卡交易從而防止欺詐，捕捉製造缺陷，或者是在提供數據給一種機器學習算法之前，自動從數據集中移除異常值。系統用正常實例進行訓練，然後當它看到新的實例時，它就可以判斷出這個新實例看上去是正常還是異常（見圖1-10）。

▲圖1-10：異常檢測

最後，還有一個常見的無監督式任務是關聯規則學習，其目的是挖掘大量數據，發現屬性之間的有趣聯繫。比如說，假設你開了一家超市，在銷售日誌上運行關聯規則之後發現買燒烤醬和薯片的人，也傾向於購買牛排。那麼，你可能會將這幾樣商品擺放得更為靠近一些。

3. 半監督式學習

有些算法可以處理部分標記的訓練數據——通常是大量未標記數據和少量的標記數據。這被稱為半監督式學習（圖1-11）。

有些照片託管服務（例如 Google 相冊）就是很好的例子。一旦你將所有的家庭照片上傳到服務後，它會自動識別出人物A出現在照片1、5和11中，另一個人B出現在照片2、5和7中。這是算法中無監督的部分（聚類）。現在系統需要你做的只是，告訴它這些人都是誰。給每個人一個標籤之後，它就可以給每張照片中的每個人命名，這對於搜索圖片非常重要。

▲圖1-11：半監督式學習

大多數半監督式學習算法是無監督和監督式算法的結合。例如深度信念網絡（DBNs），它基於一種互相堆疊的無監督式組件，這個組件叫做受限玻爾茲曼機（RBMs）。受限玻爾茲曼機以無監督的方式進行訓練，然後使用監督式學習對整個系統進行微調。

4. 強化學習

強化學習則是一個非常與眾不同的巨獸。它的學習系統（在其語境中被稱為智能體）能夠觀察環境，做出選擇，執行操作，並獲得回報（rewards），或者是以負面回報的形式獲得懲罰，見圖1-12。所以它必須自行學習什麼是最好的策略 (policy)，從而隨著時間推移獲得最大的回報。策略代表智能體在特定情況下應該選擇的操作。

▲圖1-12：強化學習

例如，許多機器人通過強化學習算法來學習如何行走。DeepMind的AlphaGo項目也是一個強化學習的好例子——2016年3月，AlphaGo在圍棋比賽中擊敗世界冠軍李世乭而聲名鵲起。通過分析數百萬場比賽，然後自己跟自己下棋，它學到了它的制勝策略。要注意，在跟世界冠軍對弈的時候，AlphaGo處於關閉學習狀態下，它只是應用它所學到的策略而已。

02 批量學習和在線學習

還有一個給機器學習系統分類的標準，是看系統是否可以從傳入的數據流中進行增量學習。

1. 批量學習

批量學習中，系統無法進行增量學習——即必須使用所有可用數據進行訓練。這需要大量時間和計算資源，所以通常情形下，都是離線完成的。離線學習就是先訓練系統，然後將其投入生產環境，這時學習過程停止，它只是將其所學到的應用出來。

如果你希望批量學習系統學習新數據（例如新型垃圾郵件），你需要在完整數據集（不僅僅是新數據，還要包括舊數據）的基礎上重新訓練一個新版本的系統，然後停用舊系統，用新系統取而代之。

幸運的是，整個訓練、評估和啟動機器學習系統的過程可以很輕易地實現自動化（如圖1-13所示），所以即使是批量學習系統也能夠適應變化。只是需要不斷地更新數據，以及根據需要，頻繁地訓練新版本的系統。

▲圖1-13：在線學習

這個解決方法比較簡單，通常情況下也都能正常工作，只是每次都使用全套數據集進行訓練可能需要花上好幾個小時，所以，你很有可能會選擇每天甚至每週訓練一次新系統。如果你的系統需要應對快速變化的數據（例如，預測股票價格），那麼你需要一個更具響應力的解決方案。

此外，使用完整數據訓練需要耗費大量的計算資源（CPU、內存空間、磁盤空間、磁盤I/O、網絡I/O等等）。如果你的數據量非常大，並且每天自動執行重新訓練系統，那最終你將為此花費大量的金錢。而假如數據量更海量一些，你甚至可能無法再應用批量學習算法。

所以如果你的資源有限（例如，智能手機應用程序或者是火星上的漫遊器），而系統需要實現自主學習，那麼像這樣攜帶大量訓練數據，佔用大量資源，動輒每天耗費幾小時來進行訓練的方式，肯定是心有餘而力不足。

幸運的是，在所有這些情況下，我們有了一個更好的選擇——也就是能夠進行增量學習的算法。

2. 在線學習

在在線學習中，你可以循序漸進地給系統提供訓練數據，逐步積累學習成果。這種提供數據的方式可以是單獨地，也可以採用小批量（mini-batches）的小組數據來進行訓練。每一步學習都很快速並且便宜，所以系統就可以根據飛速寫入的最新數據進行學習（見圖1-13）。

對於這類系統——需要接收持續的數據流（例如股票價格）同時對數據流的變化做出快速或自主的反應，使用在線學習系統是一個非常好的方式。如果你的計算資源有限，它同樣也是一個很好的選擇：新的數據實例一旦經過系統的學習，就不再需要，你可以將其丟棄（除非你想要回滾到前一個狀態，再“重新學習”數據），這可以節省大量的空間。

對於超大數據集——超出一臺計算機的主存儲器的數據，在線學習算法也同樣適用（這被稱為out-of-core核外學習）。算法每次只加載部分數據，並針對這部分數據進行訓練，然後不斷重複這個過程，直到完成所有數據的訓練（見圖1-14）。

▲圖1-14：使用在線學習處理超大數據集

整個過程通常是離線完成的（也就是不在live系統上），因此在線學習這個名字很容易讓人產生誤解。可以將其視為增量學習。

在線學習系統的一個重要參數，是看它能夠多快適應不斷變化的數據，這就是所謂的學習率。如果設置的學習率很高，那麼系統將會迅速適應新數據，但同時也很快忘記舊數據（你肯定不會希望垃圾郵件過濾器只對最新顯示的郵件進行標記）。

反過來，如果學習率很低，系統會有更高的惰性，也就是說，它學習會更緩慢，同時也會對新數據中的噪聲或者非典型數據點的序列更不敏感。

在線學習面臨的一個重大挑戰是，如果給系統輸入不良數據，系統的性能將會逐漸下降。現在某些實時系統的客戶，說不定已經注意到了這個現象。不良數據的來源可能是，例如，機器上發生故障的傳感器，或者是有人對搜索引擎惡意刷屏以提高搜索結果排名等等。

為了降低這種風險，你需要密切監控你的系統，一旦檢測到性能下降，要及時中斷學習（可能還需要恢復到之前的工作狀態）。當然，你同時還需要監控數據輸入，並對異常數據做出響應（例如，使用異常檢測算法）。

03 基於實例與基於模型的學習

另一種對機器學習系統進行分類的方法是看它們如何泛化。大多數機器學習任務是要做出預測。這意味著，系統需要通過給定的訓練示例，在它此前並未見過的示例上進行泛化。在訓練數據上實現良好的性能指標固然重要，但是還不夠充分；真正的目的是要在新的對象實例上表現出色。

泛化的主要方法有兩種：基於實例的學習和基於模型的學習。

1. 基於實例的學習

我們最司空見慣的學習方法就是簡單的死記硬背。如果你以這種方式創建一個垃圾郵件過濾器，那它可能只會標記那些跟已被用戶標記為垃圾郵件完全相同的郵件——這雖然不是最差的解決方案，但肯定也不是最好的。

除了完全相同的，你還可以通過編程讓系統標記與已知的垃圾郵件非常相似的郵件。這裡需要兩封郵件之間的相似度

度量。有一種（基本的）相似度度量方式，是計算它們之間相同的單詞數目。如果一封新郵件與一封已知的垃圾郵件有許多字句相同，系統就可以將其標記為垃圾郵件。

這便是基於實例的學習：系統先完全記住學習示例（examples），然後通過某種相似度度量方式將其泛化到新的實例（圖1-15）。

▲圖1-15：基於實例的學習

2. 基於模型的學習

從一組示例集中實現泛化的另一種方法，是構建這些示例的模型，然後使用該模型進行預測。這就是基於模型的學習（圖1-16）。

▲圖1-16：基於模型的學習

舉例來說，假設你想知道金錢是否讓人感到快樂，你可以從經合組織（OECD）的網站上下載“幸福指數”的數據，再從國際貨幣基金組織（IMF）的網站上找到人均GDP的統計數據，將數據併入表格，按照人均GDP排序，你會得到如表1-1顯示的摘要。

▲表1-1：金錢是否讓人感到快樂？

讓我們隨機繪製幾個國家的數據（圖1-17）。

▲圖1-17：看出趨勢了麼？

這裡似乎有一個趨勢！雖然數據包含噪聲（即部分隨機），但是仍然可以看出隨著國內生產總值的增加，生活滿意度或多或少呈現線性上升的趨勢。所以你可以把生活滿意度建模成一個關於人均GDP的線性函數。這個過程稱之為模型選擇：你為生活滿意度選擇了一個線性模型，該模型只有一個屬性，就是人均GDP（見以下公式）。

生活滿意度＝θ₀+θ₁×人均GDP

這個模型有兩個參數，θ₀和θ₁。通過調整這兩個參數，你可以用這個模型來代表任意線性函數，如圖1-18所示。

▲圖1-18：可能的線性模型

在使用模型之前，需要先定義參數θ0和 θ1的值。怎麼才能知道什麼值可以使得模型表現最佳呢？要回答這個問題，需要先確定怎麼衡量模型的性能表現。要麼定義一個效用函數（或適應度函數）來衡量模型有多好，要麼定義一個成本函數來衡量模型有多差。

對於線性迴歸問題，通常的選擇是使用成本函數來衡量線性模型的預測與訓練實例之間的差距，目的在於儘量使這個差距最小化。

這正是線性迴歸算法的意義所在：通過你提供的訓練樣本，找出最符合所提供數據的線性模型的參數，這就是訓練模型的過程。在我們這個案例中，算法找到的最優參數值為θ₀ = 4.85，θ₁ = 4.91× 10^-5

現在，模型基本接近訓練數據（對於線性模型而言），如圖1-19所示。

▲圖1-19：對訓練數據擬合最佳的線性模型

現在終於可以運用模型來進行預測了。例如，你想知道塞浦路斯的人民有多幸福，但是經合組織的數據沒有提供答案。幸好你有這個模型可以做出預測：先查查塞浦路斯的人均GDP是多少，22,587美元，然後應用到模型中，發現生活滿意度可能在4.85 + 22587 × 4.91 × 10

^-5 = 5.96。

為了激發你的興趣，下面的示例是一段加載數據的Python代碼，包括準備數據，創建一個可視化的散點圖，然後訓練線性模型並作出預測。

示例：使用Scikit-Learn訓練並運行一個線性模型

import matplotlib

import matplotlib.pyplot as plt

import numpy as np

import pandas as pd

import sklearn

# Load the data

oecd_bli = pd.read_csv("oecd_bli_2015.csv", thousands=',')

gdp_per_capita = pd.read_csv("gdp_per_capita.csv",thousands=',',delimiter='\t',

encoding='latin1', na_values="n/a")

# Prepare the data

country_stats = prepare_country_stats(oecd_bli, gdp_per_capita)

X = np.c_[country_stats["GDP per capita"]]

y = np.c_[country_stats["Life satisfaction"]]

# Visualize the data

country_stats.plot(kind='scatter', x="GDP per capita", y='Life satisfaction')

plt.show()

# Select a linear model

lin_reg_model = sklearn.linear_model.LinearRegression()

# Train the model

lin_reg_model.fit(X, y)

# Make a prediction for Cyprus

X_new = [[22587]] # Cyprus' GDP per capita

print(lin_reg_model.predict(X_new)) # outputs [[ 5.96242338]]

如果使用基於實例的學習算法，那麼你會發現斯洛文尼亞的人均GDP最接近塞浦路斯（20,732美元），而經合組織的數據告訴我們，斯洛文尼亞人民的生活滿意度是5.7，因此你很可能會預測塞浦路斯的生活滿意度為5.7。

如果稍微拉遠一些，看看兩個與之最接近的國家——葡萄牙和西班牙的生活滿意度分別為5.1和6.5。取這三個數值的平均值，得到5.77，這也非常接近你基於模型預測所得的值。這個簡單的算法被稱為k-近臨迴歸算法（在本例中，k = 3）。

要將前面代碼中的線性迴歸模型替換為k-近臨迴歸模型非常簡單，只需要將下面這行代碼：

clf = sklearn.linear_model.LinearRegression()

替換為：

clf = sklearn.neighbors.KNeighborsRegressor(n_neighbors=3)

如果一切順利，你的模型將能做出很棒的預測。如果不行，你可能需要使用更多的屬性（例如就業率、健康、空氣汙染等等），或者是獲得更多或更高質量的訓練數據，再或者是選擇一個更強大的模型（例如，多項式迴歸模型）。

簡而言之：

學習數據。
選擇模型。
使用訓練數據進行訓練（即前面學習算法搜索模型參數值，從而使成本函數最小化的過程）。
最後，應用模型對新示例進行預測（這稱之為推斷），祈禱模型的泛化結果不錯。

以上就是一個典型的機器學習項目。到目前為止，我們已經介紹了多個領域，你已經知道了機器學習系統最常見的類別有哪些，以及典型的項目工作流程。

關於作者：奧雷利安·傑龍（Aurélien Géron）是機器學習方面的顧問。他曾是Google軟件工程師，在2013年到2016年主導了YouTube視頻分類工程。2002年和2012年，他還是Wifirst公司（一家法國的無線ISP）的創始人和首席技術官，2001年是Ployconseil公司（現在管理電動汽車共享服務Autolib）的創始人和首席技術官。

本文摘編自《機器學習實戰：基於Scikit-Learn和TensorFlow》，經出版方授權發佈。

機器學習——Linear Regression 線性迴歸

機器學習：降維技術完整指南

機器學習——詳解KD-Tree來龍去脈

機器學習-數據降維

機器學習—CER字錯率計算

機器學習——詳解經典聚類算法Kmeans

機器學習：潛在語義分析

機器學習：主成分分析

機器學習 KNN 算法之手寫數字識別

機器學習：隱馬爾可夫模型（HMM）

機器學習：支持向量機

機器學習：初始點對優化的影響

03.06 機器學習：初始點對優化的影響

機器學習-SVM實例

03.04 機器學習—主成分分析（PCA）實戰演練

機器學習、深度學習入門教材課程

機器學習：概述

03.01 機器學習：概述

機器學習-聚類分析代碼解析

機器學習：如何在Kafka應用程序中部署一個分析模型進行實時預測

機器學習-淺談神經網絡和Keras的應用

12.13 機器學習：AutoGluon介紹及示例

機器學習——正則化

機器學習&深度學習基礎（tensorflow版本實現的算法概述0）

機器學習-Faster RCNN中的RPN網絡

機器學習-目標檢測(Object Detection)的評估指標mAP

機器學習-Faster RCNN的損失函數(Loss Function)

機器學習：感知機學習算法

機器學習-邏輯迴歸

機器學習-廣義線性模型

機器學習 — 最大似然估計的應用

機器學習：什麼是預測模型性能評估

機器學習：處理不平衡數據的5個重要技術

AI 機器學習、深度學習模型調優方法及方向

機器學習：Logistic迴歸背後的數學

機器學習：帶你瞭解決策樹

機器學習：梯度下降和正規方程

機器學習：Word嵌入和Word2Vec簡介

機器學習：使用TensorFlow構建LSTM模型詳細教程

機器學習：葡萄酒質量預測模型教程

「機器學習」權重初始化的幾個方法

前輩說先學會了這些Python知識點，再談學習人工智慧、機器學習

機器學習：TensorFlow中的L1正則化

機器學習：使用時間序列預測的Bitcoin Price預測模型

機器學習：如何計算CNN中的參數數量？

機器學習-模型的評估和選擇

05.15 機器學習-我媽媽也能看懂的入門篇

數據科學家基礎能力——機器學習

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"