機器學習數學–線性代數

如果您最終決定深入研究機器學習模型的實現,那麼您會迷失在正確的位置。所有人工智能專家都建議您通過建立基礎知識來開始這一領域。在使用框架和編程模型之前,必須掌握一些數學概念。為了幫助您,我們開始撰寫一系列有關機器學習數學的文章。

機器學習數學的目的是使您熟悉算法的基礎工作,現在您可以僅通過某些庫輕鬆構建這些算法。但是瞭解基礎將幫助您瞭解問題出在哪裡以及如何避免。

第一部分由線性代數組成。我們將介紹您在處理數據時以及在嘗試從中找出一些東西時經常遇到的一些基本概念。

為什麼選擇線性代數:

首先,讓我們看看使用線性代數的動機是什麼。在使機器學習時,我們要解決的許多任務將使用線性代數概念。一個常見的例子是價格發現。假設一次去商店,您花8元買了2條麵包和3個雞蛋。

2b + 3e = 8

在下一次旅行中,您以13元購買了1麵包和10雞蛋。

1b + 10e = 13

兩次總輸出不同。一個麵包的價格是多少?還是雞蛋?現在,解決方案似乎很簡單。解聯立方程。但是,當數據數量增加時,解決方案變得有些棘手。在這種情況下,每次去雜貨店的行程都會增加。最好將這項任務交給機器!

現在,我們知道可以使用不同的數學對象表示數據。在上面的示例中,我們有一些係數,例如2、3、1和10。輸出值為8和13。我們可以將它們寫為:

機器學習數學–線性代數

以矩陣和向量的形式。因此,進一步,我們將看到如何使用這些數學模型。

我們嘗試使用機器學習算法完成的另一個非常重要的任務是在數據中擬合方程。我們嘗試找出最適合數據的方法。因此,需要研究的另一點是如何選擇和調整參數以最適合機器學習模型。

我們現在有兩個問題。通過考慮擬合參數的某些方程,求解聯立方程以進行數據發現和擬合數據的優化。

向量:

現在讓我們看看線性代數中的向量是什麼。假設我們有一個人口高度,我們想在此數據中擬合一個方程。現在,擬合一個方程將為我們提供一個通用的解決方案,我們將使我們擺脫攜帶原始數據的負擔。

我們繪製人口曲線。最低值為1.5米,最高值為2米。我們在這裡考慮的兩個擬合參數分別是由µ給出的平均值和由σ給出的標準偏差。平均值描述分佈的中心,標準偏差描述曲線的寬度。

機器學習數學–線性代數

我們可以形成正態分佈和高斯分佈形式的方程。

機器學習數學–線性代數

我們如何處理均值和標準差的擬合參數?假設我們有一個比以前寬的圖。所以平均值是一樣的,但是圖看起來像這樣。

機器學習數學–線性代數

現在,我們可以將所有實際值和估計值的平方差相加。低估和高估並獲得有關擬合優缺點的想法。

善度如何隨著擬合參數的變化而變化。我們選擇不同的µ和σ值,看看是否有更好的擬合度。假設我們從大µ和小σ開始。現在我們可能意識到我們已經考慮了比實際高的人口。現在,我們要移動µ和σ,看它如何影響結果。

如果結果良好,則繼續沿該方向移動。µ和σ的變化可以由µ'和σ'給出。向著中心​​的最小點移動將使我們最適合。

要注意的一件事是,我們可以用向量的形式描述這些參數。

機器學習數學–線性代數

此外,我們看到這些矢量對象在空間中移動。趨於平息或遠離平息,這給了我們最佳的契合度。愛因斯坦用向量提出了相對論。他說,空間具有三個維度:x,y,z和時間。

機器學習數學–線性代數

我們可以說,向量只是在空間中移動的參數的列表。

向量運算:

因此,我們瞭解了向量是什麼以及它如何在空間系統中移動時如何擬合參數。現在讓我們看看可以對向量執行的操作。

在數據科學中,我們將向量視為對象屬性的列表。因此,假設有一所房子。描述其屬性的向量將是

機器學習數學–線性代數

向量上的運算實際上只是標量的加法和乘法。

機器學習數學–線性代數

假設我們有一個向量r和一個向量s。將它們相加得出另一個向量r + s。

同樣,r + s = s + r。不管我們如何添加它們。

機器學習數學–線性代數

接下來是標量乘法。所以2r就像

機器學習數學–線性代數

看起來像什麼?可能會朝相反的方向前進。

機器學習數學–線性代數

現在,讓我們開始在座標空間中表示向量。

考慮座標軸i和j。同樣,向量r移至3 i和2 j。

機器學習數學–線性代數

因此,s + r意味著簡單地添加座標。這使

機器學習數學–線性代數

在上面我們看到,r + s與s + r相同。如果我們有第三個向量t。將(r + s)+ t之類的三個向量相加就等於r +(s + t)。此屬性是關聯性

現在,讓我們詳細看一下將向量乘以標量值的含義。從座標系和向量r開始。

機器學習數學–線性代數

2r將r的分量與2相乘得到6和4。

機器學習數學–線性代數

同樣,我們可以對向量執行sr操作。它是向量r和向量s的負數的簡單加法。

機器學習數學–線性代數

現在,這些矢量加,減和乘標量值的操作可以應用於實際數據。像房屋矢量一樣,我們在上面定義。

機器學習數學–線性代數

向量的屬性:

接下來,讓我們看一下向量的一些屬性。

我們要考慮的兩件事是向量的大小(也稱為向量的長度)和向量的點積(也稱為投影乘積)。向量的點積或內標量積在線性代數中具有大量應用。

如果不考慮座標系,我們可以說向量是兩件事。它的長度和方向。

現在考慮兩個座標空間中的向量。

機器學習數學–線性代數

現在我們可以說r = ai + bj,其中a和單位長度為1。這樣的單位長度座標也稱為î和ĵ。î帽子和帽子。

根據畢達哥拉斯定理,我們知道斜邊給出了r的長度。

讓我們來看看。

機器學習數學–線性代數

r的大小可以表示為

機器學習數學–線性代數

無論矢量定義了什麼。價格,高度等。長度始終是其組成部分的平方和。

接下來是向量的點積。

機器學習數學–線性代數

rs = ri.si + rj.sj = 3。(-1)+ 2.2 = -3 +4 = 1

點積的一些屬性

可交換的:rs = sr

分配式加法:r。(s + t)= rs + rt

標量乘法的關聯:r。(as)= a。(rs)

點積與向量的模數或長度之間有什麼關係?讓我們來看看。

rr = r 1 r 1 + r 2 r 2 .. = r 1 2 r 2 2

這意味著點積是向量大小的兩倍

機器學習數學–線性代數

因此,要找到向量的大小,我們可以將向量與其自身的點積取平方根。

向量投影:

現在轉到矢量投影。考慮下圖。

機器學習數學–線性代數

現在,如果這些角度構成一個假想的直角。我們可以得到cos角為

機器學習數學–線性代數

因此,相鄰實際上是

機器學習數學–線性代數

向量r上的投影或陰影的排序。

改變s的方向會在r上給出不同的投影。假設s垂直於r。這樣在r上將沒有陰影。將為90度,cos 90為0。

如果將點積除以mod r,則繼續上述方程式,我們將得到標量投影。

機器學習數學–線性代數

我們在這裡採用了標量投影。方向r的向量s。然後將此投影乘以矢量除以其長度。那就是向量r方向上的向量。

總結:

在機器學習數學的第一部分中,讓我們一直保持到這裡為止。我們從線性代數開始。我們瞭解了在機器學習中使用線性代數的動機。我們詳細看到了什麼是向量?我們可以對其執行的操作以及向量的屬性。我們可以得出結論,向量只是為了更好地擬合數據而在空間中移動的參數列表。向量的大小和投影是向量的重要屬性。


分享到:


相關文章: