對話阿里雲異構計算掌舵人:人工智慧爆發三要素

計算,正在撬動人工智能產業這個千億級的市場。

傳統通用計算無法滿足人工智能對爆發的計算能力需求,異構計算中GPU/FPGA等高並行、高密集的計算能力被認為是現階段挑起人工智能產業的大梁。

異構計算是指不同類型的指令集和體系架構的計算單元組成的系統的計算方式,如“CPU+GPU”,"CPU+FPGA“等,”更適合深度學習、基因匹配、金融分析等計算密集型領域。

近日,阿里雲對外展示了異構計算產品家族,將異構計算的能力帶到雲上對外服務。

對話阿里雲異構計算掌舵人:人工智能爆發三要素

會後,我們採訪了阿里雲異構計算掌舵人張獻濤。

張獻濤,花名旭卿,武漢大學信息安全博士,是Xen、KVM等多個開源虛擬化項目的主要貢獻者,目前主要負責阿里雲虛擬化技術、高性能計算產品、異構計算產品以及創新類型產品的技術和研發的團隊。

在這次對話中,張獻濤分享了對人工智能與異構計算的關係,以及對未來計算大戰的思考。

人工智能爆發三要素:算法、計算力、數據

張獻濤指出,人工智能的概念提出60多年了,這幾年才呈現出爆發的趨勢,不單單是因為算法改進、數據積累,更重要的是計算能力的變革。一般企業都有自己的算法和數據,但在計算力的獲取上一直有比較高的門檻。

對話阿里雲異構計算掌舵人:人工智能爆發三要素

異構計算被認為是更適合人工智能的計算形態,它的優點是具有比傳統CPU並行計算更高效率和低延遲的計算性能,在處理物聯網場景下的AI應用時,異構計算比CPU的處理效率高30倍以上。張獻濤表示。

在過去,異構計算的採購、部署以及使用門檻對絕大多數企業、用戶來說都很高,比如小量的用戶基本上沒有議價能力,特別是購買FPGA板卡,量少的話採購價格特別高。此外,交付週期是另一大痛點,從機型選擇、硬件架構設計、供應商選擇、機房選擇、財務審批通常要幾個月時間。採購之後型號就固定了,有新品出現只能追加預算購買,線下的GPU/FP又無法和線上服務打通。

對話阿里雲異構計算掌舵人:人工智能爆發三要素

面向多場景的異構計算加速平臺

張獻濤指出,雲已經證明了是提供計算能力的最佳交付方式,所以把GPU/FPGA的計算能力放在雲端對外服務是一件再自然不過的事。

“阿里雲在短時間裡先後推出彈性GPU和FPGA解決方案,目的就是降低異構計算資源使用的門檻,對人工智能有計算需求的企業可以隨買隨用。”張獻濤表示,

雲是計算能力的放大器

相比CPU,GPU有更高的並行度、更高的單機計算峰值、更高的計算效率;而FPGA則擁有更高的每瓦性能、非規整數據計算更高的性能、更低的設備互聯延遲。

“雲是計算能力的放大器,將GPU和FPGA解決方案部署在雲端意味著優勢的進一步放大。”張獻濤介紹,虛擬化技術讓GPU/FPGA的計算資源可以即買即用,彈性伸縮,無需擔心性能瓶頸,還能以更低的價格享受到性能更強的GPU/FPGA計算能力。

對話阿里雲異構計算掌舵人:人工智能爆發三要素

同時,阿里雲提供了從產品、服務、生態各維度的人工智能平臺服務,滿足企業在人工智能領域不同層次的需求,比如用戶可以在阿里雲異構平臺上快速搭建TensorFlow深度學習框架,同時調用視頻識別、圖像識別、語音識別等服務,開發出類似ET工業大腦、環境大腦的應用服務,這跟此前需要東拼西湊還要運維的創業方式相比,體驗和效率完全不同。

“我們提供了25/100Gb ROCE走RDMA協議直連,可以多機多卡,用非常多的GPU/FPGA設備集群來共同訓練一個模型,大大減少用戶訓練的時間,從幾周到一個月縮短到一天或者幾個小時的級別。”張獻濤強調。

異構計算的未來:GPU、FPGA、ASIC三分天下

從市場角度來看,GPU處理器佔據了異構計算的主流地位,但對未來的趨勢,張獻濤表示,“隨著FPGA的生態環境的建立和完善、ASIC芯片的逐漸成熟,未來異構計算領域會呈現GPU、FPGA、ASIC芯片三分天下的局面,GPU、FPGA、ASIC芯片都會有自己獨特的特長和應用領域,有自己獨特的客戶群體。”

對話阿里雲異構計算掌舵人:人工智能爆發三要素

阿里雲提供同時覆蓋Intel和Xilinx兩大FPGA廠商的解決方案

這也是張獻濤團隊專注的方向,接下來團隊會發布包括8卡/16卡GPU產品、下一代的Volta架構的GPU產品、新一代的FGPA的產品,而ASIC芯片的產品上雲也正在研發當中。

目前他所帶領的團隊主要有兩個目標:一方面致力於讓異構計算變成用戶即買即用的計算資源,提供最為全面的異構計算產品方案;另一方面致力於讓用戶能夠用好異構資源,充分發揮雲上各個產品之間的統一調度能力,讓阿里雲在人工智能方面的服務更具備競爭力,把異構計算變成一種普惠的計算能力。

在10月11日舉行的2017杭州雲棲大會上,阿里雲還將推出更多個性化的人工智能產品及服務,期間將有20餘場人工智能相關的峰會和分論壇,涉及基礎設施、AI基礎技術、AI產品以及AI行業解決方案等領域。阿里巴巴及合作伙伴將分享AI在數據中心、電子商務、工業製造、城市管理、藝術設計等行業的前沿經驗,並展示最新技術。


分享到:


相關文章: