如何通過TF實現線性回歸，通讀本文幫你節省不必要的時間技术頭條網

2018-07-02 17:54:00 AI中國

大多數人學習算法，首先學到的基本都是線性迴歸。線性迴歸多被用來計算梯度下降和損耗。

線性迴歸是利用數理統計中迴歸分析，來確定兩種或兩種以上變量間相互依賴的定量關係的一種統計分析方法，運用十分廣泛。其表達形式為y = w'x+e，e為誤差服從均值為0的正態分佈。迴歸分析中，只包括一個自變量和一個因變量，且二者的關係可用一條直線近似表示，這種迴歸分析稱為一元線性迴歸分析。如果迴歸分析中包括兩個或兩個以上的自變量，且因變量和自變量之間是線性關係，則稱為多元線性迴歸分析。

本教程主要講述如何使用TensorFlow實現線性迴歸。目的是能給你啟發，教你如何在TensorFlow中使用TensorFlow封裝評估模型來節省你的時間。TensorFlow封裝評估模型是一種高級API，不同於需要你自己編程的低級API。

我們將從導入所需的庫開始。

在這裡，我們導入的數據集來自Kaggle提供的對波士頓住房價格預測。讓我們導入我們的訓練數據集。鏈接：

你需要檢查DataFrame以查找列表名稱和類型。

使用TensorFlow時引入的一個概念是Feature Columns（功能列）。我們需要將我們的功能列傳遞給我們的TensorFlow封裝評估模型。這樣我們才能成功創建我們的功能列。

在實例化過程中，我們需要將功能列作為列表傳遞。所以,讓我們創建下面的內容。

與往常一樣，在處理數據時，我們會創建一個訓練集和一個測試集。所以，在這裡我們也會這樣做。

如果你一直在使用sklearn，那麼你一定養成了習慣將數據傳遞到訓練函數的能力。在TensorFlow中，使用的是輸入函數。所以我們需要為訓練和測試創建輸入函數。

在這裡，創建_DataSet的方法有很多。因為我們之前是用Pandas來加載數據，所以（圖中）我們有一個DataFrame。因此，我們將使用from_tensor_slices（）來創建數據集。需要補充的是，此工具在隨TensorFlow 1.8發佈的tf.data模塊中提供。不要小瞧它，它作為一件工具對我們的數據處理有著很大的作用。這裡會涉及兩個參數。第一個參數是字典。你需要將所運行的以系列數據作為字典中的值進行傳遞。第二個參數是表示訓練數據中標籤的類別。