機器學習中的數學,這是一份新鮮出爐的熱門草稿

選自 mmlbook,作者:Marc Peter Deisenroth、A Aldo Faisal、Cheng Soon Ong,機器之心編譯,參與:路雪、王淑婷。

近日,Marc Peter Deisenroth、A Aldo Faisal 和 Cheng Soon Ong 所著書籍《Mathematics for Machine Learning》的全部草稿已放出,機器之心整理了這本書的簡要概述。感興趣的讀者可從以下鏈接獲取全文(英文版)。

書籍地址:https://mml-book.github.io/

以下是這本書的部分序言。

機器學習是捕捉人類知識、對適合構建機器和工程化自動系統的格式進行推理的最新嘗試。隨著機器學習越來越普遍,軟件包越來越易用,自然而然地,從業者不會注意低級技術細節。但是,這帶來了一些風險,即從業者不瞭解設計決策,更容易忽略機器學習算法的侷限性。對成功的機器學習算法的背後機制感興趣的從業者需要學習如下必備知識:

  • 編程知識和數據分析工具;
  • 大規模計算和相關框架;
  • 數學和統計學知識,以及機器學習如何在其上構建。

在大學裡,機器學習的基礎課程會先花時間介紹部分必備知識。由於歷史原因,機器學習課程通常屬於計算機科學系,學生通常接受過前兩項必備知識領域的訓練,但對數學和統計學知識可能涉獵不多。目前的機器學習教科書嘗試用一兩章的篇幅覆蓋背景數學知識,可能在書的開頭或者是附錄。而本書將介紹基礎機器學習概念的數學基礎,並收集相關信息。

為什麼要再寫一本關於機器學習的書?

機器學習構建於數學語言之上,以表達看似直觀實則難以形式化的概念。一旦得到恰當的形式化,我們就可以使用數學工具推導出機器學習算法設計的選擇結果。這幫助我們理解正在解決的任務,同時瞭解智能的本質。全球數學專業的學生常見的一種抱怨是數學話題似乎與實際問題沒有什麼相關。我們認為機器學習是促使人們學習數學的直接動力。

本書旨在作為構建現代機器學習基礎的大量數學文獻的指南。我們通過直接指出數學概念在基礎機器學習問題中的有用性來促進對數學概念學習的需求。為使書籍儘量簡短,我們省略了很多細節和高級概念。本書主要介紹基礎數學概念及其在機器學習語境中的意義,讀者可在章節最後找到進一步學習的大量資源。對於具備數學背景的讀者,本書提供簡潔但表述準確的機器學習概覽。與主要介紹機器學習方法和模型或編程知識的書籍不同,本書僅提供四個代表性機器學習算法。我們主要關注模型背後的數學概念,並描述其抽象之美。我們希望所有讀者能夠通過數學模型中的基礎選擇更加深入地瞭解機器學習應用中出現的機器學習基礎問題和相關的實際問題。

目標讀者

隨著機器學習應用在社會中的廣泛應用,我們認為每個人都應該瞭解其背後的原則。本書以學術數學風格寫成,可以幫助讀者準確理解機器學習背後的概念。我們鼓勵不熟悉這一風格的讀者堅持閱讀本書,並牢記每個話題的目標。我們將在文本中插入大量評論,希望可以幫助讀者獲取對全局的理解。本書假設讀者具備中學數學和物理知識。例如,讀者應該瞭解過導數和積分,以及二維三維幾何向量。因此,本書的目標讀者包括本科大學生、夜校學生和參與機器學習在線課程的人們。

本書結構如下所示:

第一部分:數學基礎

1. 引言和動機

2. 線性代數

3. 解析幾何

4. 矩陣分解

5. 向量微積分

6. 概率和分佈

7. 連續優化

第二部分:機器學習核心問題

1. 當模型遇到數據

2. 線性迴歸

3. 利用主成分分析進行降維

4. 利用高斯混合模型進行密度估計

5. 利用支持向量機進行分類

我們可以用以下兩種策略來理解機器學習中的數學:

按從基礎到高級的順序構建概念。這通常是偏技術性領域(如數學)的首選方法。該策略的優點是,讀者可以隨時依賴自己以前學過的定義,不會遇到那些晦澀難懂、難以接受的觀點。但對於從業者來說,許多基礎概念本身並不怎麼有趣,因此大多數基礎定義會被他們很快遺忘。

從實際需求向下挖掘出更基礎的要求。這種目標驅動方法的優點是,讀者隨時都知道為什麼他們需要研究特定的概念,並且清晰地知道自己需要哪些知識。這種策略的缺點是知識的基礎並不穩固,讀者必須記住一組自己並不理解的單詞。

本書分為兩部分,第一部分講數學基礎,第二部分將第一部分的概念應用於基本的機器學習問題中,繼而形成了圖 1.1 中闡述的「機器學習四大支柱」。


機器學習中的數學,這是一份新鮮出爐的熱門草稿

圖 1.1:機器學習的基礎和四大支柱。

第一部分關於數學

我們將數值數據表示為向量,並將這些數據的表格表示為矩陣。向量和矩陣的研究被稱為線性代數,見本書第 2 章。

我們經常認為數據是一些真實潛在信號的噪聲觀測結果,並希望通過機器學習從噪聲中識別出信號。為此我們需要一種語言來量化噪聲的含義。我們也經常希望能有預測因子來表達某種不確定性,例如,量化我們對特定測試數據概率預測值的置信度。對不確定性的量化屬於概率論的領域,在本書第 6 章有所涉及。

為了把爬山法(hill-climbing)應用於訓練機器學習模型,我們需要形式化梯度的概念,它會告訴我們尋找解的方向。搜索方向這個想法是通過微積分來形式化的,我們在第 5 章介紹了這一點。如何使用這些搜索方向序列來找到山頂被稱為優化,見本書第 7 章。

第二部分關於機器學習

本書第二部分介紹了機器學習的四大支柱,如下表所示。表中的每一行區分了問題的相關變量是連續還是類別。我們解釋瞭如何將本書第一部分介紹的數學概念應用於機器學習算法的設計中。

機器學習中的數學,這是一份新鮮出爐的熱門草稿

表 1.1:機器學習的四大支柱。


機器學習中的數學,這是一份新鮮出爐的熱門草稿

圖 2.2:該思維導圖展示了本章介紹的概念及其與其他章節的關聯。


分享到:


相關文章: