在瀏覽器中進行深度學習：TensorFlow.js (二）線性迴歸

2019-11-03 00:26:29 聞數起舞

筆者在上一篇文章中介紹了TensorFlow.js中的基本概念，以及機器學習的數學基礎，線性代數的基本知識。在這一遍文章裡，我們來看一看如何利用TensorFlow.js來構建數學模型，以及進行學習的基本過程。

學習的過程基本如下：

準備訓練數據
構建一個模型
利用訓練數據和模型，進行迭代的學習
模型訓練完畢，用這個模型對新的數據進行預測（這裡我們先略過對模型的驗證部分）

好了，我們以最簡單的線性迴歸為例子，看看這個過程。

準備數據

如上圖所示，我在二維座標系中生成了7個點，讓它們在我假想的某條直線附近。我以這幾個點作為我的訓練數據。

訓練數據的初始化代碼如下，這裡tx是所有點數據的x座標，ty是所有點數據的座標。

const train_x = tf.tensor1d(tx);
const train_y = tf.tensor1d(ty);

模型選擇

所有的模型都是錯的，有的模型更好。

所謂的模型，也就是一個函數f，對應於某個輸入數據，計算出某些輸出數據。模型可以複雜，可以簡單。簡單的模型不一定不好，複雜的模型也不一定好。

我們用線性模型舉例，數學上就是假定 Y = wX + b

在這個模型中，有兩個參數需要確定，w和b。

模型既然是個函數，那麼它的代碼也就很容易理解了：

const f = x => w.mul(x).add(b);

當然你也可以這樣寫：

const f = function(x){
 return w.mul(x).add(b);
 }
}

迭代學習

學習的過程我們稱作訓練，訓練通常是一個迭代的過程，這個過程中，通常需要這幾樣東西：

一個損失函數（loss function），損失函數定義了模型是不是足夠好，通常loss越小越好。
一個優化器（optimizer），優化器通過某種算法來決定如何改變參數的值，使得損失函數最小化。
迭代循環，通過循環 -> 調用優化器，得到新的參數，計算損失, 最終當損失足夠小時，可以認為訓練結束了。

訓練代碼如下：

初始化參數，這裡使用隨機數來作為參數的初始值。（注意，初始參數並不總是隨機選擇的。）

const w = tf.variable(tf.scalar(Math.random()));
const b = tf.variable(tf.scalar(Math.random()));

初始化學習參數，

numIterations是迭代的次數，一般次數越多，模型的擬合就越好，但是就需要花費越多的計算
learningRate是學習率，這個值越大，學的速度就越快，但是也會更加容易錯過極值點。

const numIterations = 200;
const learningRate = 1;

選擇一個優化器，這裡我選擇了adam。TensorFlow.js提供了多種優化器，例如sgd，momentum等等，大家可以根據自己的需要來選擇。

const optimizer = tf.train.adam(learningRate);

對於損失函數，我們採用的是均方差

const loss = (pred, label) => pred.sub(label).square().mean();

或者可以寫作：

function loss(predictions, labels) {
 const meanSquareError = predictions.sub(labels).square().mean();
 return meanSquareError;
}

然後就是訓練的過程啦：

for (let iter = 0; iter < numIterations; iter++) {
 optimizer.minimize(() => {
 const loss_var = loss(f(train_x), train_y);
 loss_var.print();
 return loss_var;
 })
}

在訓練過程中，我們調用tensor的print()方法打印出損失的值，看看訓練過程是不是收斂。當選擇的模型，參數，優化器不合適的時候，有可能訓練過程並不收斂。

訓練的結果我們就等到了w和b的值。也就是確定了直線的斜率和截距。

我們可以看到學習過程中是如何慢慢收斂到最後的結果的直線。

總結

本文描述了一個使用tensoflow.js來進行最簡單的線性迴歸模型的學習的過程。希望大家可以通過這個簡單的例子瞭解機器學習的基本思路。

分享到:

閱讀更多 聞數起舞 的文章

關鍵字: 數學算法文章

【瀏覽器】HTML、CSS和JS如何變成頁面的？

127個常用的JS代碼片段，每段代碼花30秒就能看懂

HTTP協議講解

03.06 Springboot下的WebSocket開發

輕量級流量複製實踐

03.05 輕量級流量複製實踐

使用Vue 自定義文件選擇器組件(基礎雖簡單，但思路我們要掌握)

Spring Security基於Oauth2的SSO單點登錄怎樣做？一個註解搞定

03.02 Spring Security基於Oauth2的SSO單點登錄怎樣做？一個註解搞定

03.02 LocalStorage 如何實現過期時間功能

Angular用 Interceptors 來統一處理 HTTP請求和響應比如加token

02.26 介紹Vue UI管理Vue項目

02.23 127個常用的JS代碼片段，每段代碼花30秒就能看懂（四）

Javascript加密算法標準庫，支持Nodejs+瀏覽器——crypto-js

詳解瀏覽器分段請求基礎——Range，助你瞭解斷點續傳基礎

前端系列課程（4）-HTTP 協議

Vue 中如何讓 input 聚焦？(包含視頻講解)

SAP UI5 Web Component的圖標實現

介紹一個非常好用的文件服務器

阿里的一道筆試題，錯誤率極高，但瞭解堆棧機制後，秒變送分題

搭建前端監控系統（二）JS錯誤監控篇

和prototype到底有什麼區別？

Spring Boot 集成 Ehcache 緩存，三步搞定

什麼是$nextTick？為什麼需要它？異步更新隊列有什麼好處？

「防抖與節流」每個請求必須發送，平滑地獲取最後一個返回值

為什麼需要cookie和session，cookie和session 又是什麼？

Spring Boot項目中如何定製攔截器

10.22 （乾貨）HTTP響應狀態碼參考

CAS 單點登錄簡介

10.19 由淺入深：瀏覽器資源緩存機制總結

SpringBootSecurity學習（23）前後端分離版之OAuth2.0 其它模式

10.12 webpack 中比較難懂的幾個變量名稱

koa2項目1

OAuth 系列(三)簡化模式 Implicit

OAuth 系列(六)對比總結

手把手搭建WebSocket多人在線聊天室，就是這麼強

08.25 什麼是Token驗證？驗證的流程是什麼？優點是什麼？缺點是什麼？

一句話解釋箭頭函數裡的This

設置RabbitMQ遠程ip登錄

IT兄弟連 JavaWeb教程 Servlet會話跟蹤 Cookie常用方法

淺談瀏覽器的緩存機制？

webpack四個核心概念

計算機網絡自學筆記:FTP和SMTP

Eureka Server啟用 https服務，讓微服務註冊更安全

var和let、const的區別

01.10 跨域+Cookie+Token+Web+APP均支持的分佈式單點登錄框架開箱即用

前後端分離，你真的懂什麼意思麼？

10.17 瀏覽器HTTP緩存原理分析

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"