深入瞭解機器學習:線性迴歸

人們早就知曉,相比涼爽的天氣,蟋蟀在較為炎熱的天氣裡鳴叫更為頻繁。數十年來,專業和業餘昆蟲學者已將每分鐘的鳴叫聲和溫度方面的數據編入目錄。Ruth 阿姨將她喜愛的蟋蟀數據庫作為生日禮物送給您,並邀請您自己利用該數據庫訓練一個模型,從而預測鳴叫聲與溫度的關係。

首先建議您將數據繪製成圖表,瞭解下數據的分佈情況:

深入瞭解機器學習:線性迴歸

圖 1. 每分鐘的鳴叫聲與溫度(攝氏度)的關係

毫無疑問,此曲線圖表明溫度隨著鳴叫聲次數的增加而上升。鳴叫聲與溫度之間的關係是線性關係嗎?是的,您可以繪製一條直線來近似地表示這種關係,如下所示:

深入瞭解機器學習:線性迴歸

圖 2. 線性關係

事實上,雖然該直線並未精確無誤地經過每個點,但針對我們擁有的數據,清楚地顯示了鳴叫聲與溫度之間的關係。只需運用一點代數知識,您就可以將這種關係寫下來,如下所示:

深入瞭解機器學習:線性迴歸

其中:

  • y指的是溫度(以攝氏度表示),即我們試圖預測的值。
  • m指的是直線的斜率。
  • x指的是每分鐘的鳴叫聲次數,即輸入特徵的值。
  • b指的是 y 軸截距。

按照機器學習的慣例,您需要寫一個存在細微差別的模型方程式:

深入瞭解機器學習:線性迴歸

其中:

  • y′指的是預測標籤(理想輸出值)。
  • b指的是偏差(y 軸截距)。而在一些機器學習文檔中,它稱為 w0。
  • w1指的是特徵 1 的權重。權重與上文中用 m表示的“斜率”的概念相同。
  • x1指的是特徵(已知輸入項)。

要根據新的每分鐘的鳴叫聲值 x1推斷(預測)溫度 y′,只需將 x1值代入此模型即可。

下標(例如 w1和 x1)預示著可以用多個特徵來表示更復雜的模型。例如,具有三個特徵的模型可以採用以下方程式:

深入瞭解機器學習:線性迴歸

-END-

簡單AI實驗室簡介

  • 簡單AI實驗室提供在線編程實驗環境和豐富有趣的實驗內容。
  • 登錄www.easyailab.cn ,加入專欄課程可在線完成實驗。
  • 加入討論群,請加微信fancyfreeman ,入群口令:簡單AI實驗室。


分享到:


相關文章: