11.23 對話英特爾AI事業部副總裁:解讀AI佈局,下一代NNP-T明年公佈

對話英特爾AI事業部副總裁:解讀AI佈局,下一代NNP-T明年公佈

芯潮(ID:aichip001)文 | 心緣

英特爾已成為一個超級AI硬件中樞。

如果說以前英特爾還只是AI推理領域的主宰者,那麼隨著其NNP-T芯片投向市場,數據中心訓練芯片領域有望被攪起新的風雲。

在最新財報電話會議上,英特爾預計2019年AI業務預計將超過35億美元。而隨著新一代專用神經網絡處理器、Movidius Myriad視覺處理單元(VPU)和獨立GPU陸續現身,不出意外的話,2020-2021年將成為英特爾全面展示AI能力的大秀場。

昨日,智東西同少數媒體採訪了英特爾人工智能事業部副總裁兼英特爾人工智能平臺與市場研究總經理Julie Choi(辛周妍)。在交流過程中,她不僅為更為系統介紹了英特爾的AI產品佈局,解讀了英特爾不同協處理器組合的應用側重點,還透露了英特爾專用AI芯片為何蟄伏了三年才終於現身。

辛周妍相信,英特爾Nervana神經網絡訓練處理器將會顛覆現有市場格局。

對話英特爾AI事業部副總裁:解讀AI佈局,下一代NNP-T明年公佈

▲英特爾人工智能事業部副總裁兼英特爾人工智能平臺與市場研究總經理Julie Choi(辛周妍)

01、首秀專用AI芯片,打出全套AI硬件組合拳

除了英特爾,似乎沒有一家公司能已經集齊AI芯片主流架構。

目前AI領域呈現“CPU+GPU”、“CPU+FPGA”、“CPU+ASIC”三大流派。而英特爾已經集齊了這四大架構豪華套餐。

一方面,英特爾致力於提升CPU等現有產品,向其中注入更多AI能力的支持;另一方面,英特爾也持續加大在新架構方面的投入。

CPU毫無疑問是英特爾的拿手好戲,而隨著英特爾陸續收購全球全球FPGA老二Altera(2015年)、計算機視覺創企Movidius(2016年)、神經網絡處理器創企Nervana(2016年)、結構化ASIC廠商eASIC(2018年),它在數據中心、邊緣計算的AI芯片佈局雛形已然顯現。

面向邊緣,英特爾的Movidius以超低功耗高性能的特點切入大量低功耗便攜設備。尤其是最新一代Movidius Myriad VPU,代號Keem Bay,速度上是英偉達TX2的4倍、華為海思昇騰310的1.25倍,每秒每TOPS的推理量是NVIDIA Xavier的4倍。

辛周妍說,Keem Bay一定會成為市場的領導者,因為英特爾客戶急需單位功耗最高性能最佳表現的產品。

對話英特爾AI事業部副總裁:解讀AI佈局,下一代NNP-T明年公佈

面向雲端,在通用硬件方面,CPU仍是英特爾AI芯片的核心法寶。英特爾將AI能力注入第二代至強可擴展處理器,將高性能推理能力發揮到更高水準。其最高性能的至強Tiger Lake AP已經可以支持相當複雜的AI訓練。

不僅如此,英特爾還面向數據中心提供GPU、FPGA、深度學習訓練芯片NNP-T、深度學習推理芯片NNP-I等半定製化或定製化芯片。

近日英特爾宣佈為高性能計算打造的7nm製程工藝Xe架構GPU,預計在2021年用在Aurora極光超算上。

英特爾今年在FPGA領域主要做了兩件大事,一是推出全新品牌Agilex FPGA,集英特爾多種先進技術資源於一身;二是發佈全球最大容量FPGA,第一次用EMIB技術將兩個FPGA在邏輯和電氣上實現整合。

而英特爾第一個Nervana神經網絡處理器產品家族——NNP-T和NNP-I都在2019年量產。

NNP-T是一種新型AI模型訓練方式,其特點在於可擴展能力,在ResNet50和BERT上擴展率高達95%,同時達到SOTA精度;NNP-I試生產芯片和全棧軟件已被集成於1U高度的單RU機箱中,能以不到NVIDIA T4 2倍的加速數量,達到NVIDIA T4約3.7倍的計算密度。

不管是對於小規模群集,還是大規模POD超級計算機,Nervana NNP-T都可進行近乎線性且極具能效的擴展。NNP-T、NNP-I已面向百度、Facebook等客戶,針對他們的AI需求做定製開發。

對話英特爾AI事業部副總裁:解讀AI佈局,下一代NNP-T明年公佈

據辛周妍透露,NNP-T的迭代週期為2-3年,下一代版本的NNP-T預計將在2020年公佈,英特爾還計劃在2020-2021年分享NNP-T相關使用案例。

02、為什麼英特爾NNP-T三年磨一劍?

有意思的是,Nervana和Movidius分別在2016年8月和9月被英特爾宣佈收購。

截至現在,第三代Movidius Myriad VPU已經問世,而初代Nervana訓練和推理芯片卻姍姍來遲。

那麼為什麼Nervana的研發推進如此緩慢呢?

據辛周妍回憶,三年前Nervana加入英特爾時只有48人的團隊,而且僅有一個創意,沒有任何硬件開發帶進英特爾。平均而言,從一個創意到達到生產級的芯片,並且擴展到成千上萬的客戶,至少需三年的開發週期。

雖然英特爾的專用AI芯片來得偏晚,但面對市場上已經持續一段時間的雲計算巨頭造芯潮,英特爾並沒有感到太大壓力。

以和英特爾合作研發NNP-T的百度為例,像百度這樣的許多大型雲計算服務廠商都是大型複雜模型的開發者,需要用新硬件去訓練複雜的模型。百度就嘗試過多種架構的芯片,包括GPU、FPGA和他們自研的崑崙芯片等等。

那麼為什麼百度還會選擇英特爾NNP-T?據辛周妍介紹,這是因為NNP-T提供了一種高效的分佈式訓練方式,能提供最高效的架構,對95%的大型複雜模型進行線性擴展,使得客戶無需在數據中心聯網性能上投入過多,而這是利用其它硬件架構難以實現的。

選擇和百度飛槳來合作定製NNP-T,是因為百度希望擴展飛槳在市場中的採用率,而英特爾也預判飛槳未來將有更多應用,因此雙方合力對飛槳進行一個硬件就緒的優化。

對話英特爾AI事業部副總裁:解讀AI佈局,下一代NNP-T明年公佈

據百度AI系統架構師丁瑞全分享,百度X-Man 4.0與英特爾NNP-T配合,搭載了4個X-Man計算機32個 NNP-T的系統已經運行起來,且效果符合預期,百度很快將在數據中心部署英特爾的產品。此前百度深度學習框架飛槳利用英特爾CPU,將ERINE模型高性能推理速度提升5倍。

當英特爾NNP-T加入AI芯片的競爭之中,它是否會顛覆現有市場格局?

“是的。”辛周妍相當爽快地回答,Nervana芯片將替代GPU和FPGA承擔部分AI處理任務。

03、AI將是英特爾接下來50年的戰略核心

英特爾之所以踏足AI領域,是以其客戶需求為導向。

客戶需要AI,所以英特爾需向客戶提供支持AI的硬件和軟件;客戶需要新型硬件來支持分佈式的訓練,以及高密度的推理工作負載,所以英特爾打造了Nervana系列專用神經網絡處理器。

AI對於英特爾的轉型也是非常重要的一部分,辛周妍說,它也是英特爾接下來50年的戰略核心部分。

總體來看,英特爾在提供AI芯片選型方案上的核心競爭力主要體現在兩方面,一是各獨立硬件產品性能足夠高,二是提供全面的硬件選擇。

沒有哪個AI硬件能做到一個產品打天下,因此英特爾打造了不同類型的硬件,而具體如何做出選擇則是根據實際需求,和客戶一起去研究最佳選擇。

FPGA則比較擅長要求低延遲高通量的推理運算,選擇這一基礎架構的客戶通常看重FPGA的可編程性,希望能對硬件進行配置。比如微軟就基於FPGA進行了大量的深度學習推理。

NNP-I、NNP-T主要面向超大規模的雲服務提供商,Facebook即選擇採用NNP-I部署更快、更高效的推理計算,並將他們對先進深度學習編譯器Glow的支持擴展到NNP-I。

獨立GPU在開發早期目標應用於高性能計算的超算領域,也用在面向大型客戶的AI領域。

辛周妍表示,

NNP-T和英特爾獨立GPU推出後,將給市場帶來更多針對高密度神經網絡訓練的替代選擇。

04、廣度深度全面加持AI能力

英特爾的AI產品組合,不僅在廣度上堪稱業界之最,在深度上也非常硬核。

有最先進深度學習訓練需求的英特爾客戶,要求性能每3.5個月提升一倍,而滿足這一需求,僅靠計算的提升還不夠。

而此前英特爾亮出的六大技術支柱,基本上展示了英特爾全面考慮計算、內存與存儲、通信與互連、封裝、軟件的能力,確保在提升效率和可編程性的同時,能將深度學習擴展到數以千計節點。

對話英特爾AI事業部副總裁:解讀AI佈局,下一代NNP-T明年公佈

對於英特爾這樣體量龐大的半導體巨頭而言,單純一對一的向具體客戶進行單獨部署並不是一個可以持續下去的商業模式,關鍵是在於針對軟件的優化。

再以英特爾與百度飛槳的合作為例。從硬件的角度,英特爾有不同接口的卡提供給廠商;從軟件的角度,英特爾支持TensorFlow、百度飛槳等多種深度學習框架。

對話英特爾AI事業部副總裁:解讀AI佈局,下一代NNP-T明年公佈

英特爾打造的OpenVINO工具包,提供開放式視覺推理和神經網絡優化能力,可幫助開發者快速將雲端訓練的AI模型部署到各種邊緣設備,簡化開發部署流程。

基於此,英特爾最近推出面向邊緣的Dev Cloud,將以開源態度與開發者合作,與英特爾Distribution of OpenVINO工具包共同解決開發人員的主要痛點,使得他們在購買硬件前,能在試用不同類型的英特爾處理器、部署原型和測試AI解決方案。

對話英特爾AI事業部副總裁:解讀AI佈局,下一代NNP-T明年公佈

除了現有先進科技外,英特爾也在為未來計算創新做儲備。

例如在神經擬態方面,埃森哲、空中客車、通用電氣、日立等首批企業成員均加盟英特爾神經擬態研究社區INRC,該社區現有超過75家組織。

在量子計算方面,英特爾研發了首款49量子位超導量子測試芯片Tangle Lake、用於量子計算的最小自旋量子位芯片,並在今年推出全球第一臺低溫晶圓探測儀量子計算首款測試工具,以計算庫量子計算解決方案的研究。

05、結語:舉全公司之力做AI

辛周妍說,英特爾全公司十多萬人都在做AI。每一個硬件軟件都支持AI,所有硬件的路線圖都包含AI,並在每一個技術的方向上都可以開發出來好的產品,更寬和更深的支持他們的客戶,這是英特爾AI戰略的核心。

英特爾的AI打法不是對標其他競爭對手,而是以客戶需求為導向,而客戶的需求細分到很多不同的方向,這也是英特爾建立如此廣泛AI產品佈局的基礎。而隨著英特爾全棧式AI陣列的完善,它將成為AI時代極其強大而難以撼動的高山。


分享到:


相關文章: