04.28 CPU、GPU都OUT啦!AI芯片瞭解一下

CPU、GPU都OUT啦!AI芯片瞭解一下

中興華為的事兒這兩天被討論爛了,裡面涉及到的多數是傳統芯片,比如CPU、GPU,但說實話,傳統芯片已經不再時髦了。

美國著名科技媒體The Information在去年發佈了一篇文章,預測微軟、亞馬遜等科技巨頭,在2018年都會嘗試打造自己的AI芯片。

CPU、GPU都OUT啦!AI芯片瞭解一下

這篇文章可以說非常有預見性,現在包括阿里、Facebook等在內的公司都開始了AI芯片的研發。

CPU注重邏輯,GPU專注運算,而AI芯片,則是為人工智能和深度學習專門開發的。

目前AI芯片大致可以為兩類,商用級和民用級。

商用級AI芯片

商用級AI芯片的代表是TPU,由谷歌在2016年正式發佈,全名是張量處理器(Tensor Processing Unit),可以輔助谷歌的TensorFlow運行(TensorFlow是一個軟件引擎,為深度學習提供驅動力)。

早年深度神經網絡用的都是CPU,CPU能處理的事情很雜,全能!後來又用上了GPU,就是我們電腦裡的顯卡。

CPU、GPU都OUT啦!AI芯片瞭解一下

主機電腦裡的遊戲顯卡

它專為圖像處理而生,但在結構上和CPU沒有本質區別。所以GPU除了善於處理圖像外,還能用來進行密碼破解、金融分析、數值分析等等。比如比特幣的挖礦,很多用的就是GPU。

TPU在通用性上最差,它通常只專注於一件事,也正因如此,讓它在特定的場合和應用上有極端的效率,所謂“萬能工具的效率永遠比不上專用工具”。

CPU、GPU都OUT啦!AI芯片瞭解一下

做個類比,如果說CPU是一個全知全能的老教授,GPU就是100個小學生。算複雜公式,自然前者當仁不讓,但如果做大規模的簡單計算,比如5+6=11,顯然100個小學生的效率更高。

而TPU,則是班裡的怪才,可能除法算的特別好,但其他方面的能力幾乎是0。

說完了基本面,我們看看它在商用領域的應用場景:

01 下棋

TPU是AlphaGo背後不可或缺的功臣。

起初AlphaGo的硬件平臺採用了傳統芯片:48顆CPU和8塊GPU,AlphaGo的分佈式版本則利用了更多的芯片,40個搜索線程運行在1202顆CPU和176顆GPU上。

在與樊麾的比賽中,狗就用的這個配置,因此當李世石看完比賽後,對“人機大戰”很有信心,但隨後谷歌把硬件平臺換成了TPU,結果以絕對優勢擊敗了李世石。

CPU、GPU都OUT啦!AI芯片瞭解一下

與柯潔對戰的AlphaGo其實是一個特殊的離線版本,僅由一個TPU在不連接網絡的情況下完成對戰,它的體積要比原版小很多,而性能卻是翻倍的提高。

谷歌資深硬件工程師Norman Jouppi的刊文表示,谷歌TPU的處理速度要比GPU和CPU快15-30倍(對比的是英特爾Haswell CPU以及Nvidia Tesla K80 GPU),而在能效上,TPU更是提升了30到80倍。

CPU、GPU都OUT啦!AI芯片瞭解一下

谷歌的TPU已經在各種領域中得以應用,除了圍棋,還有谷歌翻譯、圖像搜索(Google Image Search)、谷歌照片(Google Photo)、谷歌雲視覺API(Google Cloud Vision API)等等。

02 服務器

Google作為全球最大的互聯網公司,每天會產生大量的數據,為了服務用戶,谷歌組件了世界上最大的計算機網絡,配備了15個倉庫大小的數據中心,在全球四個大陸上都有分佈。

CPU、GPU都OUT啦!AI芯片瞭解一下

六年前,谷歌為安卓系統加入了語音識別技術,也就是我們熟悉的Google Assistant。谷歌工程師很快發現,如果用戶每天使用Google Assistant的頻率比搜索引擎高,服務器很快會面臨崩潰。

但是,谷歌沒有選擇繼續開服務器倉庫,而是打起了TPU的主意。

谷歌的TPU專門執行神經網絡服務,具體來說,當用戶使用安卓手機上的語音助手時,TPU才會運行。

TPU的存在讓神經網絡可以高效計算,並有了自主學習的能力,大大提高了效率,也給谷歌剩下了好幾個數據中心的搭建成本。

CPU、GPU都OUT啦!AI芯片瞭解一下

TPU業務不斷壯大,但谷歌並沒有售賣TPU芯片的想法,而是想通過TPU,提供非常好的雲服務。

今年2月,谷歌的Cloud TPU對外全面開放,價格為每個Cloud TPU每小時6.5美元。

從下圖可以看出,有了TPU的加持,谷歌的雲服務在硬實力上已經能和全球最牛的亞馬遜AWS相抗衡了。

CPU、GPU都OUT啦!AI芯片瞭解一下

谷歌的TPU完全是自己研發的,並且只在自家的TensorFlow中效率最高,這裡有一定的技術壁壘。

今後,谷歌很可能成為TPU主流供應商,它可以服務於任何一個神經網絡引擎,

TPU雲服務很可能變成谷歌新的支柱產業。

當然,其他巨頭也不想受制於人,Facebook、微軟等公司都有自己的神經網絡服務,而這些服務都需要海量的計算設備和服務器,TPU是最好的解決方案。

03 自動駕駛

自動駕駛主要依靠的就是各種傳感器,在這其中,對於圖像的識別和處理又是重中之重。

對於路況數據的處理,通常的辦法是在車裡塞一個電腦,比如特斯拉就搭載了英偉達開發的Drive PX 2 AI計算平臺。

裡面包括2個獨立的GPU,12個CPU核心,16nm製程,水冷系統等等,性能上相當於150個MacBook Pro,這在傳統汽車上是完全見不到的。

CPU、GPU都OUT啦!AI芯片瞭解一下

這套硬件不是針對特斯拉研發的,它可以處理很多東西,包括激光雷達、毫米波雷達,和攝像頭等傳感器收集的數據。

如果能在這個“電腦”裡塞進一個TPU模塊,圖像處理就會變得更快,功耗和發熱又能有顯著減少。

特別像特斯拉這種,不用激光雷達,而以8個攝像頭為支撐的無人駕駛模式,TPU將會帶來質的提升。

CPU、GPU都OUT啦!AI芯片瞭解一下

特斯拉新的駕駛系統,增加了攝像頭數量

在AI芯片領域,科技巨頭們會試圖擺脫傳統芯片廠商的控制。一方面可以降低成本,也可以進行深度調教。另一方面,英特爾等公司也有些不思進取,它們的產品,顯然已經不能滿足當下的需求。


民用級AI芯片

相對於傳統的CPU和GPU,AI芯片在手機裡是新苗子,但是它的作用正在逐步被放大。

華為、蘋果、谷歌都為自己的手機開發了AI芯片,上游的供應商,高通和ARM所發售的移動芯片裡,都正在使用相關AI技術。

iPhone X搭載了A11仿生處理器,就集成了一個每秒運算次數可達6000億次的神經網絡引擎。

CPU、GPU都OUT啦!AI芯片瞭解一下

它的存在讓iPhone X變得與眾不同,比如X的人像模式,可以在拍完後追加燈光效果,其本質就是摳圖,識別出人臉,把背景變暗,給臉加亮。

這個識別的過程用到了深度學習技術,如果沒有AI芯片,摳圖的效果會大打折扣。

CPU、GPU都OUT啦!AI芯片瞭解一下

同時,iPhone X上的面部解鎖也是對NPU的應用。人的臉每天都是不一樣的,歲月催人老,更不用說什麼化妝、刮鬍子這種短時間內的劇烈變化。

而有了機器學習,就能讓iPhone X主動適應人的面部變化,而無需你重新錄入面部信息。

蘋果在其官網的文案描述是:

A11這款芯片能夠利用機器學習技術來識別你樣貌的變化。當你戴上眼鏡、帽子或留起鬍鬚時,你的朋友或許一眼認不出你,但是 iPhone X 可以。

華為旗艦機上使用了麒麟970處理器,上面集成了來自寒武紀授權的NPU專用處理單元。

NPU(neural processing unit)是專為機器學習而開發的硬件,它不僅能執行神經網絡所需的高速運算,而且具有傑出的能效。

CPU、GPU都OUT啦!AI芯片瞭解一下

NPU的加入為Mate10提供了“拍照場景識別”的功能。

相機能對環境進行判斷,然後針對特定的場景對照片進行優化。比如相機識別出你在拍天,哪怕有霧霾,也能讓天變藍。

識別出面前是個食物,那必須拍得令人垂涎欲滴;如果是個妹子,就得把對方P得楚楚動人。

NPU的加持,讓Mate 10能夠對13種場景與物體進行識別,諸如美食、鮮花、文字、動物(狗、貓)、下雪、夜晚等。

CPU、GPU都OUT啦!AI芯片瞭解一下

如果這個東西做好了,對於照相體驗來說可能是顛覆性的。一個非專業人士,只要端起手機,NPU就能自動識別場景,並調出與場景相匹配的最佳拍照參數。按下快門,隨手就是一張大片有木有?

高通今年的旗艦處理器:驍龍845,也將AI作為了一個宣傳重點。

845支持很多AI框架協議,比如谷歌的TensorFlow,臉書的Caffe 2,給不同的手機廠家開放了AI的應用權限。

CPU、GPU都OUT啦!AI芯片瞭解一下

驍龍845

廠商們可以給自己的手機開發出更豐富的功能,可以讓單攝像頭拍出雙攝才有的虛化效果,可以進行人臉識別和解鎖,智能語音也能變得更快更準確。

CPU、GPU都OUT啦!AI芯片瞭解一下

科技巨頭們在AI芯片上的佈局,印證一個芯片產業的發展趨勢:在數據比重越來越大的今天,諸如谷歌、微軟、阿里、騰訊等公司都會為了數據處理而購買更多的AI芯片。

CPU和GPU等傳統芯片依然會在數量上佔據主流,但科技公司對於這種通用型芯片的需求會減少。

至於兼顧性能和功耗的AI芯片,將覆蓋包括雲服務、自動駕駛、智能手機、智能音箱等各種領域,成為支撐物聯網革命的關鍵,帶我們進入一個萬物有靈的時代。


分享到:


相關文章: