Swift for Tensorflow

2018-11-14 09:52:47 IT大咖說

內容來源：2018 年 9 月 15 日，SwiftGG資深灌水師王文槿在“2018@swift 第三屆 Swift 開發者大會”進行《Swift for Tensorflow》演講分享。IT 大咖說作為獨家視頻合作方，經主辦方和講者審閱授權發佈。

閱讀字數：3628 | 10分鐘閱讀

獲取嘉賓完整演講視頻及PPT，請複製：http://t.cn/EArXaIQ，粘貼至瀏覽器即可。

Why Swift for Machine Learning

本次我們談論的Machine Learning並不是在客戶端而是在服務端側，因此接下來的內容有一個大背景，即都是基於Server-side Swift。

Swift既像腳本語言一樣有很強的Productive，開發起來快速簡潔，性能又和老牌的編譯型語言類似。正是優秀的特性，使得Swift在服務端獲得廣泛的應用。

Swift有三個主要特點。第一是高性能；第二是社區很活躍，不過在Server-side部分還有很長路要走；第三是快速安全。

Next Big Thing on Server

之前的Server服務大多是些增刪改查，頂多再做些DBA、主從之類的，但這些正逐步被雲服務的基礎設施所替代。而目前基於機器學習的App在服務端正呈現井噴式的發展，像分析系統、音視頻理解、超解析、聊天機器人等。

這些機器學習類的服務端App所使用的語言主要有兩個。第一個毫無疑問是C++，無論是caffeine還是Tensorflow最初都是用C++實現的，它的特點在於安全和高性能，缺點是僅有少量的productive。另一個就是python，和C++相反，python寫起來很容易，但也正因為如此會多寫出很多垃圾代碼，同時它也不夠安全。

那麼有沒有一種語言，兼具安全高性能和Easy with write呢？答案顯而易見，就是今天的主角——Swift。

Swift for TensorFlow

Swift for TensorFlow是作為一個整體存在的，並不僅是Swift引入了TensorFlow API，它可算作一門新的語言，官方簡寫為TFiwS。

Intro

TFiwS的首個released是在2018年TFDEVSummit上，它是Open source的，並加入了TensorFlow Ecosystem。在TFiwS中機器學習是"第一等公民"，而並非只是將TensorFlow API包裝成庫拿來使用。

雖然TFiwS尚處於早期階段，但得益於TensorFlow的支持，它可以跑在CPU、GPU、以及Cloud TPU上。並且迭代速度很快，基本上兩週發佈一個新版本。

與Swift的結合，使得TFiwS兼顧了性能和可用性。還能夠應用Swift生態的東西，比如在Xcode Playground工作，同時支持macOS和ubuntu。

Playground

上圖為Playground中TFiwS的代碼，其中Tensor對象可以簡單理解為一個多維數組，用來幫助我們做一些運算。比如對於圖中2級3維的數組，我們可以直接對Tensor對象做加乘操作。可以看到這種寫法與腳本語言很類似，雖然這是咋一看很普通的特性，但其實對可用性來說很重要，相比一些線性代數庫要好用很多。

Core Ideas

TensorFlow模型中有兩種模式，分別是Graph和Eager Execution。上圖為Graph模式代碼，這段代碼前半部分並沒有實際進行運算，只是在構建Graph結構，直到sess.run() 之後才真正執行。

這種模式的優勢在於高性能，因為可以在執行前對圖進行各種優化。但缺點也很明顯，首先是很難Debug，比如我們沒法通過在xt後添加一行print來打印出它的值，因為此時代碼沒有執行；其次是可用性差，我們不能按照直覺去寫代碼，而是先要在腦中構建出圖，讓再由代碼執行。

Eager Execution是一種立即執行模式，每個操作都可以獲取到結果。這種的優勢在於Define-by-run，即可以運用一些控制流程來決定代碼的執行；同時對Debug友好。缺點嘛，就是沒有優化。

其實我們可以簡單的理解，Graph是編譯模式，Eager Execution是解釋模式。

TFiwS Mode

現在TensorFlow現在有了第三種模式，也就是TFiwS模式。雖然上面的這段代碼是以Eager Execution模式寫的，但是執行的時候卻是以Graph模型運行，所以它有圖模式所有的優化。其原理是在編譯階段生成圖，然後生成的圖和代碼在最終執行期間並行執行，並進行智能調度。

How

對於圖中這段代碼，我們如果想要獲取到它的圖該怎麼辦呢？這裡的關鍵點在於Swift沒有runtime，這樣的話只能通過遍歷語法樹來實現（如下圖）。語法樹中保存有類型信息、運算信息、參與運算的變量類信息等等。

之所以可以怎麼做，主要得益於Swift的靜態類型系統，這也是為什麼這種方式適用於Swift而不適用於pyton的原因。

編譯完成之後就變成了這樣形式，原先的立即執行代碼都變成了圖來調用，最後返回結果。

這段代碼與前一個有兩點不同，首先它多了一條用於打印tmp2的語句，其次它並非直接返回tmp2，而是對tmp2進行運算後返回tmp3，且涉及的另一個運算變量是由本地的其他函數返回。

這是對這段代碼進行靜態分析後構建出的圖。這裡第一個問題就是magic的值未知，因為它是由本地函數返回，在編譯期間獲取不到。第二個就是我們不知道tmp2的值何時返回，因為圖是直接執行的。

Program Slice Stage

要理解上面的問題，首先要明白程序變換，程序變換第一步是將原始代碼變換成一份用來構建圖的代碼，第二步是將原始代碼變換成可以跑的代碼。

上圖為第一階段變換的代碼，圖右側就是用來構建圖的代碼，可以看到其中一些本地代碼都被刪除並用其他東西來替代，比如Print操作被替換成了send發送。Send和Recvice是標準的TensorFlow節點，用於跑分佈式學習的時候不同的集群間交換結果。

上圖為第二階段變化後用於跑的代碼（host），這段代碼中所有的tensor code都已被刪除。第一行為啟動圖的代碼，然後通過receive接受圖代碼中send的tmp2，並打印出來。接著調用magicNumber函數計算出result發送給圖代碼。最後接受圖代碼返回的結果並拋出。

以上就是整個變換流程圖，左邊是Host的代碼，右邊是圖代碼，他們之間通過Receive和Send通信。這樣還帶來了一個好處，即圖代碼和host 代碼可以運行在不同的地方，比如圖代碼跑GPU，host代碼跑CPU，或者在遠程GPU上運行。

Summary

TFiwS本質上是在Swift和Complier之間實現了一個Pass，它會將原始代碼拆分成兩塊——Host Code和Graph Code。Host Code在Swift Runtime上執行，Graph Code在TF Runtime上執行。這兩個Runtime之間通過Send和Receive節點進行通信，最終輸出。

Example

Linear Classification

我們先來給這張圖賦予一些實際意義，假設上圖是對一片被汙染的海域進行53次採樣後獲得的結果，其中點表示該區域海水是乾淨的，方塊表示已被汙染。現在的問題是，給出一個座標如何判斷該位置是否已被汙染。

很明顯這是一個線性可分的問題，那麼我們首先找出一條線，應用上面的線性模式公式。這裡我們假設W0後還有一個X0，這個X0等於1，且X1和X2都已計算處理出來了。這個線性方程計算後會有4個連續的值，值域從正無窮到負無窮。

接下來問題是如何確定這個值對應的位置是否被汙染。對此有兩種方案，一種是直接設定一個閾值，用它來作為標準；另一種是通過函數將Line(X)的返回值map到固定的範圍內。

上圖的函數定義域是負無窮到正無窮，值域是0到1。將Line(x)的值放入該函數中後會返回一個0到1的值，我們可以用0和1分別表示一個標籤。這樣就獲得一個新的模型。

然後就是如何基於53個觀察數據計算出W。如果以概率的角度來看，其實我們可以用極大似然估計法得到關於W的可視函數，然後使用梯度下降的方式最大化極大似然估計法求出來的W。

上圖為簡寫後的矩陣形式，用這個公式就可以迭代多次以獲得最好的W。這種方式被稱為對數幾率迴歸。

Code Time

下面我們來看下上面的問題如何在TFiwS中實現。

這段代碼的關鍵在於最後的兩個結構體。我們用Model表示最終想要的模型，模型中的參數為ParameterAggregate類型，它在TFiwS中表示一個模型。

這裡僅是在做一些變換，裡面構造了用來做（未知）的Tensor和每個數據的標記。

模型的訓練通過處理函數完成，內部不停迭代模型。可以看到TFiwS定義了很多操作，讓我們像寫公式一張寫代碼。

以上為使用python的matplot展示的最終效果，與我們預想中的連線相差無幾。

Collaborative Filtering

Collaborative Filtering協同過濾是現在推薦系統的基礎，本質是基於用戶對某個事物的評分來進行推薦。它有兩種方法，item to item和user to item，分別是基於商品和用戶畫像。本次主要介紹item to item的實現。

假設我們現在要基於目標用戶和其他用戶的觀看歷史來推薦電影，使用的是常用的MovieLens Dataset，其中有10萬條記錄，為943個用戶對1682部電影的評分。

這10萬條數據其實是很稀疏的，因為943乘以1682遠不止10萬，也就是說有很多用戶對某些電影的評分我們是沒有的。因此我們要基於現有數據推測出一些沒有的數據。

對於相似性的計算推薦系統中最常用的就是cosine similarity（餘弦相似性），如上圖所示，計算的是兩者之間的夾角，角度越小相似度越高。

而對於建模我們可以從數據入手，將數據劃分成測試數據和訓練數據。以訓練數據作為模型，然後給測試數據進行預測，最終比較預測值和原測試數據值之間的差值，以此來判斷業務模型的訓練效果。

1. Load Data

上圖為TFiwS中的實現，首先加載數據，再進行一些變換，接著切分測試和訓練數據，最後將數據的轉換成TFiwS tensor。

2. Compute Similarity

這是相似度計算公式與實際代碼，該公式其實可以被直接轉換成矩陣相乘的形式，這樣就能通過少量代碼進行計算。

3. Make Prediction

和相似度公式類似，我們也可以將預測公式轉換成矩陣形式，在TFiwS中以少量的代碼表示。

4. Validation

最終的驗證階段，我們只需要將測試數據放到預測後的大矩陣中找到對應的值，然後將他們一一相減，最後將所有和測試數據對應的點的（）抓取出來求平方就可以了。

5. Result

最終的結果為總用戶943，電影總量1682，mse為10.776904。我們我們還可以對此做進一步優化。

因為預測的時候我們是將某個商品乘以與其相似的所有商品，但在計算過程中其實有很多不相關的商品也摻雜在裡面。如果與該商品進行計算的是與其相關度Top k的商品，那麼最終的結果會更加準確。

ReSource

上圖展示的是一些相關資源。第一個是最後的兩個案例的代碼；第二個是TFiwS的文檔，像本次講的圖模式原理就在裡面；第三個是教程和Demo的鏈接，比如Swift-models的倉庫中就有很多現成的模型。

分享到:

閱讀更多 IT大咖說 的文章

關鍵字: 瀏覽器 Swift語言編程語言

TensorFlow 2.0簡介

TensorFlow 2.0姿態估計快速入門

Swift 常量講解

Swift 5.2現已發佈

Swift 5.2 改進編譯器診斷功能，提供用戶更有用的錯誤信息

Swift 字符(Character)講解

OpenStack Swift 對象存儲管理

超酷！2020必須玩的新編程語言：Vlang，對標Golang、Rust、Swift

2020年值得關注的新編程V語言Vlang，對標Golang、Rust、Swift

[tensorflow]如何處理樣本不均衡？

Tensorflow 學習筆記（一）TensorFlow入門

iOS Swift 自動引用計數（ARC） -「入門級」

iOS Swift 枚舉 -「入門級」

APP iOS項目需要Swif 狠心研究突破是OC-Swift 閉包

「tensorflow」淺談什麼是張量tensor

03.06 「tensorflow」淺談什麼是張量tensor

MacOSX 安裝 TensorFlow

01.21 MacOSX 安裝 TensorFlow

數據結構 & 算法 in Swift （一）：Swift基礎和數據結構

使用Flutter一年後，這是我得到的經驗

使用 TensorFlow 來實現一個簡單的驗證碼識別過程

解決兩數之和 (JS Java C#, Swift, Kotlin, Python,C++, Golang)

TensorFlow v2.0實現邏輯斯諦迴歸

10.23 TensorFlow v2.0的基本張量操作

使用 TensorFlow 識別簡單圖像驗證碼

09.22 Swift 5.1 發佈

TensorFlow——實現簡單的線性迴歸

人工智能 TensorFlow 必知必會編程概念整理

機器學習中的DCGAN-Tensorflow：用於更穩定的訓練

Effective TensorFlow Chapter7——理解執行順序和控制依賴

Swift 5強制獨佔內存

02.04 TensorFlow Probability 概率編程入門級實操教程

「譯」Effective TensorFlow Chapter1——TensorFlow 基礎

TensorFlow Lite極簡入門：構建移動應用程序進行圖像分類

令人困惑的 TensorFlow！(II)

使用 tf.Transform 對 TensorFlow 管道模式進行預處理

Swift 5.0 計劃年底發布：主打 ABI 穩定性，不向前兼容

tensorflow：多層LSTM代碼分析

從 OC 到 Swift 的快速入門與專業實踐

從零開始搭建深度學習伺服器：TensorFlow + PyTorch + Torch

Tensorflow Graph概述

TensorFlow-實踐方法

06.20 Swift 4.2革新 What's new in Swift

泛型對於 Swift 的重要性

06.18 Windows10下Keras,Tensorflow,CNTK ,MXNet和PyTorch的GPU

Ubuntu 上安裝 TensorFlow

05.16 「關鍵點」TensorFlow 可以這樣區分類與操作？「附例子」

05.08 通過 TensorFlow 構建您的第一個深度學習分類器（以狗為例）！

人工智慧開發（一）環境搭建-基於ubuntu16 Python3 tensorflow

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"