深度學習實踐：使用TensorFlow訓練WDL模型性能問題定位與調優

2018-04-04 20:15:23 美團技術團隊

簡介

TensorFlow是Google研發的第二代人工智能學習系統，能夠處理多種深度學習算法模型，以功能強大和高可擴展性而著稱。TensorFlow完全開源，所以很多公司都在使用，但是美團點評在使用分佈式TensorFlow訓練WDL模型時，發現訓練速度很慢，難以滿足業務需求。

經過對TensorFlow框架和Hadoop的分析定位，發現在數據輸入、集群網絡和計算內存分配等層面出現性能瓶頸。主要原因包括TensorFlow數據輸入接口效率低、PS/Worker算子分配策略不佳以及Hadoop參數配置不合理。我們在調整對TensorFlow接口調用、並且優化系統配置後，WDL模型訓練性能提高了10倍，分佈式線性加速可達32個Worker，基本滿足了美團點評廣告和推薦等業務的需求。

術語

TensorFlow - Google發佈的開源深度學習框架

OP - Operation縮寫，TensorFlow算子

PS - Parameter Server 參數服務器

WDL

- Wide & Deep Learning，Google發佈的用於推薦場景的深度學習算法模型

AFO - AI Framework on YARN的簡稱 - 基於YARN開發的深度學習調度框架，支持Tensorflow，MXNet等深度學習框架

TensorFlow分佈式架構簡介

為了解決海量參數的模型計算和參數更新問題，TensorFlow支持分佈式計算。和其他深度學習框架的做法類似，分佈式TensorFlow也引入了參數服務器（Parameter Server，PS），用於保存和更新訓練參數，而模型訓練放在Worker節點完成。

圖1 TensorFlow分佈式架構

TensorFlow支持圖並行（in-graph）和數據並行（between-graph）模式，也支持同步更新和異步更新。因為in-graph只在一個節點輸入並分發數據，嚴重影響並行訓練速度，實際生產環境中一般使用between-graph。

同步更新時，需要一個Woker節點為Chief，來控制所有的Worker是否進入下一輪迭代，並且負責輸出checkpoint。異步更新時所有Worker都是對等的，迭代過程不受同步barrier控制，訓練過程更快。

AFO架構設計

TensorFlow只是一個計算框架，沒有集群資源管理和調度的功能，分佈式訓練也欠缺集群容錯方面的能力。為了解決這些問題，我們在YARN基礎上自研了AFO框架解決這個問題。

AFO架構特點：

高可擴展，PS、Worker都是任務（Task），角色可配置
基於狀態機的容錯設計
提供了日誌服務和Tensorboard服務，方便用戶定位問題和模型調試

深度學習實踐：使用TensorFlow訓練WDL模型性能問題定位與調優

圖2 AFO 架構

AFO模塊說明：

Application Master：用來管理整個TensorFlow集群的資源申請，對任務進行狀態監控
AFO Child：TensorFlow執行引擎，負責PS、Worker運行時管理和狀態同步
History Server：管理TensorFlow訓練生成的日誌
AFO Client：用戶客戶端

WDL模型

在推薦系統、CTR預估場景中，訓練的樣本數據一般是查詢、用戶和上下文信息，系統返回一個排序好的候選列表。推薦系統面臨的主要問題是，如何同時可以做到模型的記憶能力和泛化能力，WDL提出的思想是結合線性模型（Wide，用於記憶）和深度神經網絡（Deep，用於泛化）。

以論文中用於Google Play Store推薦系統的WDL模型為例，該模型輸入用戶訪問應用商店的日誌，用戶和設備的信息，給應用App打分，輸出一個用戶“感興趣”App列表。

深度學習實踐：使用TensorFlow訓練WDL模型性能問題定位與調優

圖3 WDL 模型網絡

其中，installed apps和impression apps這類特徵具有稀疏性（在海量大小的App空間中，用戶感興趣的只有很少一部分），對應模型“寬的部分”，適合使用線性模型；在模型“深的部分”，稀疏特徵由於維度太高不適合神經網絡處理，需要embedding降維轉成稠密特徵，再和其他稠密特徵串聯起來，輸入到一個3層ReLU的深度網絡。最後Wide和Deep的預估結果加權輸入給一個Logistic損失函數（例如Sigmoid）。

WDL模型中包含對稀疏特徵的embedding計算，在TensorFlow中對應的接口是tf.embedding_lookup_sparse，但該接口所包含的OP（例如tf._gather）無法使用GPU加速，只能在CPU上計算。因此TensorFlow在處理稀疏特徵性能不佳。不僅如此，我們發現分佈式TensorFlow在進行embedding計算時會引發大量的網絡傳輸流量，嚴重影響訓練性能。

性能瓶頸分析與調優

在使用TensorFlow訓練WDL模型時，我們主要發現3個性能問題：

每輪訓練時，輸入數據環節耗時過多，超過60%的時間用於讀取數據。
訓練時產生的網絡流量高，佔用大量集群網絡帶寬資源，難以實現分佈式性能線性加速。
Hadoop的默認參數配置導致glibc malloc變慢，一個保護malloc內存池的內核自旋鎖成為性能瓶頸。

TensorFlow輸入數據瓶頸

TensorFlow支持以流水線（Pipeline）的方式輸入訓練數據。如下圖所示，典型的輸入數據流水線包含兩個隊列：Filename Queue對一組文件做shuffle，多個Reader線程從此隊列中拿到文件名，讀取訓練數據，再經過Decode過程，將數據放入Example Queue，以備訓練線程從中讀取數據。Pipeline這種多線程、多隊列的設計可以使訓練線程和讀數據線程並行。

理想情況下，隊列Example Queue總是充滿數據的，訓練線程完成一輪訓練後可以立即讀取下一批的數據。如果Example Queue總是處於“飢餓”狀態，訓練線程將不得不阻塞，等待Reader線程將Example Queue插入足夠的數據。使用TensorFlow Timeline工具，可以直觀地看到其中的OP調用過程。

深度學習實踐：使用TensorFlow訓練WDL模型性能問題定位與調優

圖4 TensorFlow輸入數據流水線

使用Timeline，需要對tf.Session.run()增加如下幾行代碼：

with tf.Session as sess: ptions = tf.RunOptions(trace_level=tf.RunOptions.FULL_TRACE) run_metadata = tf.RunMetadata() _ = sess.run([train_op, global_step], options=run_options, run_metadata=run_metadata) if global_step > 1000 && global_step < 1010: from tensorflow.python.client import timeline fetched_timeline = timeline.Timeline(run_metadata.step_stats) chrome_trace = fetched_timeline.generate_chrome_trace_format() with open('/tmp/timeline_01.json', 'w') as f: f.write(chrome_trace)

這樣訓練到global step在1000輪左右時，會將該輪訓練的Timeline信息保存到timeline_01.json文件中，在Chrome瀏覽器的地址欄中輸入chrome://tracing，然後load該文件，可以看到圖像化的Profiling結果。

業務模型的Timeline如圖所示：

深度學習實踐：使用TensorFlow訓練WDL模型性能問題定位與調優

圖5 Timeline顯示數據輸入是性能瓶頸

可以看到QueueDequeueManyV2這個OP耗時最久，約佔整體時延的60%以上。通過分析TensorFlow源碼，我們判斷有兩方面的原因：

（1）Reader線程是Python線程，受制於Python的全局解釋鎖（GIL），Reader線程在訓練時沒有獲得足夠的調度執行；

（2）Reader默認的接口函數TFRecordReader.read函數每次只讀入一條數據，如果Batch Size比較大，讀入一個Batch的數據需要頻繁調用該接口，系統開銷很大；

針對第一個問題，解決辦法是使用TensorFlow Dataset接口，該接口不再使用Python線程讀數據，而是用C++線程實現，避免了Python GIL問題。

針對第二個問題，社區提供了批量讀數據接口TFRecordReader.read_up_to，能夠指定每次讀數據的數量。我們設置每次讀入1000條數據，使讀數句接口被調用的頻次從10000次降低到10次，每輪訓練時延降低2-3倍。

深度學習實踐：使用TensorFlow訓練WDL模型性能問題定位與調優

圖6 優化數據輸入使性能提升2-3倍

可以看到經過調優後，QueueDequeueManyV2耗時只有十幾毫秒，每輪訓練時延從原來的800多毫秒降低至不到300毫秒。

集群網絡瓶頸

雖然使用了Mellanox的25G網卡，但是在WDL訓練過程中，我們觀察到Worker上的上行和下行網絡流量抖動劇烈，幅度2-10Gbps，這是由於打滿了PS網絡帶寬導致丟包。因為分佈式訓練參數都是保存和更新都是在PS上的，參數過多，加之模型網絡較淺，計算很快，很容易形成多個Worker打一個PS的情況，導致PS的網絡接口帶寬被打滿。

在推薦業務的WDL模型中，embedding張量的參數規模是千萬級，TensorFlow的tf.embedding_lookup_sparse接口包含了幾個OP，默認是分別擺放在PS和Worker上的。如圖所示，顏色代表設備，embedding lookup需要在不同設備之前傳輸整個embedding變量，這意味著每輪Embedding的迭代更新需要將海量的參數在PS和Worker之間來回傳輸。

深度學習實踐：使用TensorFlow訓練WDL模型性能問題定位與調優

圖7 embedding_lookup_sparse的OP拓撲圖

有效降低網絡流量的方法是儘量讓參數更新在一個設備上完成，即

with tf.device(PS): do embedding computing

社區提供了一個接口方法正是按照這個思想實現的：embedding_lookup_sparse_with_distributed_aggregation接口，該接口可以將embedding計算的所使用的OP都放在變量所在的PS上，計算後轉成稠密張量再傳送到Worker上繼續網絡模型的計算。

從下圖可以看到，embedding計算所涉及的OP都是在PS上，測試Worker的上行和下行網絡流量也穩定在2-3Gpbs這一正常數值。

深度學習實踐：使用TensorFlow訓練WDL模型性能問題定位與調優

圖8 embedding_lookup_sparse_with_distributed_aggregation的OP拓撲圖

PS上的UniqueOP性能瓶頸

在使用分佈式TensorFlow 跑廣告推薦的WDL算法時，發現一個奇怪的現象：WDL算法在AFO上的性能只有手動分佈式的1/4。手動分佈式是指：不依賴YARN調度，用命令行方式在集群上分別啟動PS和Worker作業。

使用Perf診斷PS進程熱點，發現PS多線程在競爭一個內核自旋鎖，PS整體上有30%-50%的CPU時間耗在malloc的在內核的spin_lock上。

深度學習實踐：使用TensorFlow訓練WDL模型性能問題定位與調優

圖9 Perf診斷PS計算瓶頸

進一步查看PS進程棧，發現競爭內核自旋鎖來自於malloc相關的系統調用。WDL的embedding_lookup_sparse會使用UniqueOp算子，TensorFlow支持OP多線程，UniqueOp計算時會開多線程，線程執行時會調用glibc的malloc申請內存。

經測試排查，發現Hadoop有一項默認的環境變量配置:

export MALLOC_ARENA_MAX="4"

該配置意思是限制進程所能使用的glibc內存池個數為4個。這意味著當進程開啟多線程調用malloc時，最多從4個內存池中競爭申請，這限制了調用malloc的線程並行執行數量最多為4個。

翻查Hadoop社區相關討論，當初增加這一配置的主要原因是：glibc的升級帶來多線程ARENA的特性，可以提高malloc的併發性能，但同時也增加進程的虛擬內存（即top結果中的VIRT）。YARN管理進程樹的虛擬內存和物理內存使用量，超過限制的進程樹將被殺死。將MALLOC_ARENA_MAX的默認設置改為4之後，可以不至於VIRT增加很多，而且一般作業性能沒有明顯影響。

但這個默認配置對於WDL深度學習作業影響很大，我們去掉了這個環境配置，malloc併發性能極大提升。經過測試，WDL模型的平均訓練時間性能減少至原來的1/4。

調優結果

注意：以下測試都去掉了Hadoop MALLOC_ARENA_MAX的默認配置

我們在AFO上針對業務的WDL模型做了性能調優前後的比對測試，測試環境參數如下：

模型：推薦廣告模型WDL

OS：CentOS 7.1

CPU: Xeon E5 2.2G, 40 Cores

GPU：Nvidia P40

磁盤: Local Rotational Disk

網卡：Mellanox 25G（未使用RoCE）

TensorFlow版本：Release 1.4

CUDA/cuDNN: 8.0/5.1

深度學習實踐：使用TensorFlow訓練WDL模型性能問題定位與調優

圖10 分佈式線性加速效果

可以看到調優後，訓練性能提高2-3倍，性能可以達到32個GPU線性加速。這意味著如果使用同樣的資源，業務訓練時間會更快，或者說在一定的性能要求下，資源節省更多。如果考慮優化MALLOC_ARENA_MAX的因素，調優後的訓練性能提升約為10倍左右。

總結

我們使用TensorFlow訓練WDL模型發現一些系統上的性能瓶頸點，通過針對性的調優不僅可以大大加速訓練過程，而且可以提高GPU、帶寬等資源的利用率。在深入挖掘系統熱點瓶頸的過程中，我們也加深了對業務算法模型、TensorFlow框架的理解，具有技術儲備的意義，有助於我們後續進一步優化深度學習平臺性能，更好地為業務提供工程技術支持。

鄭坤，美團點評技術專家，2015年加入美團點評，負責深度學習平臺、Docker平臺的研發工作。

招聘信息

美團點評GPU計算團隊，致力於打造公司一體化的深度學習基礎設施平臺，涉及到的技術包括：資源調度、高性能存儲、高性能網絡、深度學習框架等。目前平臺還在建設中期，不論在系統底層、分佈式架構、算法工程優化上都有很大的挑戰。誠邀對這個領域感興趣的同學加盟，不論是工程背景，還是算法背景我們都非常歡迎。有興趣的同學可以發送簡歷到 zhengkun#meituan.com。

分享到:

閱讀更多 美團技術團隊 的文章

關鍵字: Hadoop 編程語言移動互聯網

TensorFlow 2.0簡介

TensorFlow 2.0姿態估計快速入門

北大學霸出品，TensorFlow 2.0快速入門指南來了！

【GitHub熱門推薦】TensorFlow Agents：Agents強化學習庫

Faster-RCNN+TensorFlow 詳細訓練過程（附github源碼）

[tensorflow]如何處理樣本不均衡？

Tensorflow 學習筆記（一）TensorFlow入門

「tensorflow」淺談什麼是張量tensor

03.06 「tensorflow」淺談什麼是張量tensor

MacOSX 安裝 TensorFlow

01.21 MacOSX 安裝 TensorFlow

TensorFlow2學習二、TensorFlow Keras 構建簡單網絡

使用 TensorFlow 來實現一個簡單的驗證碼識別過程

Tensorflow 2.0 信號處理

在瀏覽器中進行深度學習：TensorFlow.js (九）訓練詞向量

在瀏覽器中進行深度學習：TensorFlow.js (八）生成對抗網絡

基於 TensorFlow.js 的遷移學習圖像分類器

在瀏覽器中進行深度學習：TensorFlow.js (五）構建一個神經網絡

在瀏覽器中進行深度學習：TensorFlow.js (二）線性迴歸

TensorFlow v2.0實現邏輯斯諦迴歸

10.23 TensorFlow v2.0的基本張量操作

使用 TensorFlow 識別簡單圖像驗證碼

TensorFlow——實現簡單的線性迴歸

人工智能 TensorFlow 必知必會編程概念整理

機器學習中的DCGAN-Tensorflow：用於更穩定的訓練

谷歌開源機器學習數據集，可在 TensorFlow 直接調用

Effective TensorFlow Chapter7——理解執行順序和控制依賴

02.04 TensorFlow Probability 概率編程入門級實操教程

要替代 TensorFlow？谷歌開源機器學習庫 JAX

TensorFlow 官方簡化版！谷歌開源機器學習庫 JAX

TensorFlow 官方簡化版，谷歌開源機器學習庫 JAX

「譯」Effective TensorFlow Chapter1——TensorFlow 基礎

Swift for Tensorflow

TensorFlow Lite極簡入門：構建移動應用程序進行圖像分類

令人困惑的 TensorFlow！(II)

使用 tf.Transform 對 TensorFlow 管道模式進行預處理

tensorflow：多層LSTM代碼分析

TensorFlow——多層 LSTM 通俗易懂版

TensorFlow進階教程（二）:TensorFlow.js 入門指南

從零開始搭建深度學習伺服器：TensorFlow + PyTorch + Torch

Tensorflow Graph概述

TensorFlow-實踐方法

06.18 Windows10下Keras,Tensorflow,CNTK ,MXNet和PyTorch的GPU

Ubuntu 上安裝 TensorFlow

更簡單的機器學習方式！TensorFlow.js是ML新手的“絕佳”選擇

05.17 「思考」TensorFlow 中最重要的概念：嵌入，是啥？

05.16 「關鍵點」TensorFlow 可以這樣區分類與操作？「附例子」

05.08 通過 TensorFlow 構建您的第一個深度學習分類器（以狗為例）！

人工智慧開發（一）環境搭建-基於ubuntu16 Python3 tensorflow

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"

深度學習實踐：使用TensorFlow訓練WDL模型性能問題定位與調優

相關文章:

TensorFlow 2.0簡介

TensorFlow 2.0姿態估計快速入門

北大學霸出品，TensorFlow 2.0快速入門指南來了！

【GitHub熱門推薦】TensorFlow Agents：Agents強化學習庫

Faster-RCNN+TensorFlow 詳細訓練過程（附github源碼）

[tensorflow]如何處理樣本不均衡？

Tensorflow 學習筆記（一）TensorFlow入門

「tensorflow」淺談什麼是張量tensor

03.06 「tensorflow」淺談什麼是張量tensor

MacOSX 安裝 TensorFlow

01.21 MacOSX 安裝 TensorFlow

TensorFlow2學習二、TensorFlow Keras 構建簡單網絡

使用 TensorFlow 來實現一個簡單的驗證碼識別過程

Tensorflow 2.0 信號處理

在瀏覽器中進行深度學習：TensorFlow.js (九）訓練詞向量

在瀏覽器中進行深度學習：TensorFlow.js (八）生成對抗網絡

基於 TensorFlow.js 的遷移學習圖像分類器

在瀏覽器中進行深度學習：TensorFlow.js (五）構建一個神經網絡

在瀏覽器中進行深度學習：TensorFlow.js (二）線性迴歸

TensorFlow v2.0實現邏輯斯諦迴歸

10.23 TensorFlow v2.0的基本張量操作

使用 TensorFlow 識別簡單圖像驗證碼

TensorFlow——實現簡單的線性迴歸

人工智能 TensorFlow 必知必會編程概念整理

機器學習中的DCGAN-Tensorflow：用於更穩定的訓練

谷歌開源機器學習數據集，可在 TensorFlow 直接調用

Effective TensorFlow Chapter7——理解執行順序和控制依賴

02.04 TensorFlow Probability 概率編程入門級實操教程

要替代 TensorFlow？谷歌開源機器學習庫 JAX

TensorFlow 官方簡化版！谷歌開源機器學習庫 JAX

TensorFlow 官方簡化版，谷歌開源機器學習庫 JAX

「譯」Effective TensorFlow Chapter1——TensorFlow 基礎

Swift for Tensorflow

TensorFlow Lite極簡入門：構建移動應用程序進行圖像分類

令人困惑的 TensorFlow！(II)

使用 tf.Transform 對 TensorFlow 管道模式進行預處理

tensorflow：多層LSTM代碼分析

TensorFlow——多層 LSTM 通俗易懂版

TensorFlow進階教程（二）:TensorFlow.js 入門指南

從零開始搭建深度學習伺服器：TensorFlow + PyTorch + Torch

Tensorflow Graph概述

TensorFlow-實踐方法

06.18 Windows10下Keras,Tensorflow,CNTK ,MXNet和PyTorch的GPU

Ubuntu 上安裝 TensorFlow

更簡單的機器學習方式！TensorFlow.js是ML新手的“絕佳”選擇

05.17 「思考」TensorFlow 中最重要的概念：嵌入，是啥？

05.16 「關鍵點」TensorFlow 可以這樣區分類與操作？「附例子」

05.08 通過 TensorFlow 構建您的第一個深度學習分類器（以狗為例）！

人工智慧開發（一）環境搭建-基於ubuntu16 Python3 tensorflow

第二章 IoC容器和Bean配置

運算裡不得不說的python模塊—math

Devops度量--DevOps 現狀快速檢查表

SOP是什麼（解讀）

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

DNS偵查工具

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

（必收藏系列）Linux面試題——命令集

五分鐘學會如何在 IPFS 上部署網站

「正點原子NANO STM32F103開發板資料連載」第29章 內存管理實驗

小白怎麼學Web前端開發 如何成為技術達人

如何開發一個web靜態服務器

學Java編程還有前景嗎 如何才能拿到高薪

Python網絡爬蟲之配置篇（一）

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

Python的運行效率太低？幾行代碼快速提升！

python的優點是什麼？最新Python400集視頻（附教程）

MySQL中OOM故障應如何下手-愛可生

像專家一樣使用 panic

30種不同的編程語言怎麼寫“Hello, World”

percona QAN 介紹

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

網絡工程師職業生涯中，哪兩點是最重要的？

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

小白怎麼學Web前端開發如何成為技術達人

學Java編程還有前景嗎如何才能拿到高薪