深度學習入門教程:學好機器學習所需的數學知識

本教程由深度學習中文社區(dl.tustcs.com)持續發佈與更新, ,
關注我頭條號,回覆"花書"可直接獲取深度學習聖經即花書電子書資源.

前言

要理解和掌握絕大部分機器學習算法和理論,尤其是對做工程應用的人而言,所需要的數學知識大學數學老師已經給你了:

  1. 微積分
  2. 線性代數
  3. 概率論
  4. 最優化方法

關鍵知識點

微積分

先說微積分/高等數學。在機器學習中,微積分主要用到了微分部分,作用是求函數的極值,就是很多機器學習庫中的求解器(solver)所實現的功能。在機器學習裡會用到微積分中的以下知識點:

  • 導數和偏導數的定義與計算方法梯度向量的定義極值定理,可導函數在極值點處導數或梯度必須為0雅克比矩陣,這是向量到向量映射函數的偏導數構成的矩陣,在求導推導中會用到Hessian矩陣,這是2階導數對多元函數的推廣,與函數的極值有密切的聯繫凸函數的定義與判斷方法泰勒展開公式拉格朗日乘數法,用於求解帶等式約束的極值問題

其中最核心的是記住多元函數的泰勒展開公式,根據它我們可以推導出機器學習中常用的梯度下降法,牛頓法,擬牛頓法等一系列最優化方法:

深度學習入門教程:學好機器學習所需的數學知識

深度學習入門教程:學好機器學習所需的數學知識

線性代數

相比之下,線性代數用的更多。在機器學習的幾乎所有地方都有使用,具體用到的知識點有:

  • 向量和它的各種運算,包括加法,減法,數乘,轉置,內積向量和矩陣的範數,L1範數和L2範數矩陣和它的各種運算,包括加法,減法,乘法,數乘逆矩陣的定義與性質行列式的定義與計算方法二次型的定義矩陣的正定性矩陣的特徵值與特徵向量矩陣的奇異值分解線性方程組的數值解法,尤其是共軛梯度法

機器學習算法處理的數據一般都是向量、矩陣或者張量。經典的機器學習算法輸入的數據都是特徵向量,深度學習算法在處理圖像時輸入的2維的矩陣或者3維的張量。掌握這些知識會使你遊刃有餘。

深度學習入門教程:學好機器學習所需的數學知識

概率論

如果把機器學習所處理的樣本數據看作隨機變量/向量,我們就可以用概率論的觀點對問題進行建模,這代表了機器學習中很大一類方法。在機器學習裡用到的概率論知識點有:

  • 隨機事件的概念,概率的定義與計算方法隨機變量與概率分佈,尤其是連續型隨機變量的概率密度函數和分佈函數條件概率與貝葉斯公式常用的概率分佈,包括正態分佈,伯努利二項分佈,均勻分佈隨機變量的均值與方差,協方差隨機變量的獨立性最大似然估計

這些知識不超出普通理工科概率論教材的範圍。

深度學習入門教程:學好機器學習所需的數學知識

最優化方法

最後要說的是最優化,因為幾乎所有機器學習算法歸根到底都是在求解最優化問題。求解最優化問題的指導思想是在極值點出函數的導數/梯度必須為0。因此你必須理解梯度下降法,牛頓法這兩種常用的算法,它們的迭代公式都可以從泰勒展開公式中得到。如果能知道座標下降法、擬牛頓法就更好了。

凸優化是機器學習中經常會提及的一個概念,這是一類特殊的優化問題,它的優化變量的可行域是凸集,目標函數是凸函數。凸優化最好的性質是它的所有局部最優解就是全局最優解,因此求解時不會陷入局部最優解。如果一個問題被證明為是凸優化問題,基本上已經宣告此問題得到了解決。在機器學習中,線性迴歸、嶺迴歸、支持向量機、logistic迴歸等很多算法求解的都是凸優化問題。

拉格朗日對偶為帶等式和不等式約束條件的優化問題構造拉格朗日函數,將其變為原問題,這兩個問題是等價的。通過這一步變換,將帶約束條件的問題轉換成不帶約束條件的問題。通過變換原始優化變量和拉格朗日乘子的優化次序,進一步將原問題轉換為對偶問題,如果滿足某種條件,原問題和對偶問題是等價的。這種方法的意義在於可以將一個不易於求解的問題轉換成更容易求解的問題。在支持向量機中有拉格朗日對偶的應用。

KKT條件是拉格朗日乘數法對帶不等式約束問題的推廣,它給出了帶等式和不等式約束的優化問題在極值點處所必須滿足的條件。在支持向量機中也有它的應用。

如果你沒有學過最優化方法這門課也不用擔心,這些方法根據微積分和線性代數的基礎知識可以很容易推導出來。如果需要系統的學習這方面的知識,可以閱讀《凸優化》,《非線性規劃》兩本經典教材。

深度學習入門教程:學好機器學習所需的數學知識

各種算法和理論用到的數學知識

下面我們來看典型算法和理論結論所用到的數學知識:

深度學習入門教程:學好機器學習所需的數學知識

除流形學習需要簡單的微分幾何概念之外,深層次的數學知識如實變函數,泛函分析等主要用在一些基礎理論結果的證明上,即使不能看懂證明過程,也不影響我們使用具體的機器學習算法。概率圖模型、流形學習中基於圖的模型會用到圖論的一些基本知識,如果學習過離散數學或者數據結構,這些概念很容易理解。

最後,如果大家覺得從課本中學習比較麻煩, 也可以直接使用深度學習聖經即花書中數學部分來學習入門深度學習,關注我頭條號,回覆"花書"獲取花書電子書資源.


分享到:


相關文章: