要讓智能終端芯片不再難做!寒武紀最新發布的AI芯片什麼來頭?

要讓智能終端芯片不再難做!寒武紀最新發布的AI芯片什麼來頭?

5月3日,AI芯片“獨角獸”寒武紀在上海發佈終端智能處理器IP產品、雲端智能芯片MLU100及其板卡,聯想、曙光、科大訊飛現場發佈基於寒武紀芯片的應用產品。

“我們要讓人工智能的公司少花錢、多出活,沒有難看的財務報表。” 寒武紀公司創始人兼CEO陳天石說。

以通用性應對多種決策場景

2016年,寒武紀發佈“全球第一款商用終端智能處理器IP產品”寒武紀1A併成功入選第三屆世界互聯網大會評選的“世界互聯網領先科技成果”,全球首款內置獨立NPU麒麟970正是搭載了寒武紀1A模塊,並應用於華為Mate10、P20和榮耀10等智能終端。本次發佈的寒武紀1M,是寒武紀第三代IP產品,基於臺積電7nm製造工藝,提供2Tops/4Tops/8Tops三種規模的處理器核,可通過多核互聯進一步提高性能。

隨著AI滲透各行各業,特定場景下的定製化AI芯片受到追捧。如亞馬遜早先傳出為智能音箱Echo定製AI芯片,英特爾也為開放環境下最複雜的決策場景之一——自動駕駛開發EyeQ系列。而寒武紀1M聚焦於通用性和卓越性。據陳天石介紹,寒武紀1M的處理器核支持CNN、RNN、SOM等多樣化的深度學習模型,並更進一步支持SVM、k-NN、k-Means、決策樹等經典機器學習算法,支持本地訓練,為視覺、語音、自然語言處理以及各類經典的機器學習任務提供了靈活高效的計算平臺。

“通過多核處理器集成的方式帶來更強的性能,將賦予下游廠商更多的自由度。比如做手機或者是智能音箱,用一個處理器核就可以完成,如果做比較複雜的智能駕駛,可能需要好幾個核同時處理多路、複雜的視覺信息。”陳天石說。

相比在雲端處理數據再回傳到設備的信息處理方式,在終端進行本地訓練有利於個性化學習、隱私保護並減輕雲端數據中心的負載和開銷。陳天石透露,寒武紀1M是全球首款支持本地訓練的終端智能處理器產品,能快速賦予芯片客戶智能處理能力。

“有了寒武紀1M,就不再有難做的智能終端芯片。”陳天石說。

端雲結合打造智能生態

智能芯片是人工智能產業的基石。隨著數據中心、高性能計算、雲計算對算力要求的不斷提升,國際科技巨頭已經在雲端AI芯片展開角逐。如集成到谷歌數據中心的TPU處理器,英偉達用於超算和雲計算的Tesla GPU系列,成為微軟深度學習平臺Project Brainwave的關鍵加速器的英特爾FGPA芯片等。

本次發佈會,寒武紀推出了基於臺積電16nm工藝,高性能模式下的等效理論峰值速度達每秒166.4萬億次定點運算、峰值功耗不超過110瓦的MLU100雲端智能芯片。據陳天石介紹,MLU100芯片的軟件平臺是基於寒武紀已經發布的平臺,以寒武紀處理器為基礎,配合寒武紀的編譯器、機器學習支持庫,可以支持已有的深度學習主流框架,未來,寒武紀還將發佈自己的編程語言。

“MLU100本身可以高效完成多任務、多模態、低延時、高通量的複雜智能處理任務,還可以與寒武紀1A/1H/1M系列終端處理器完美適配,以端雲協作的方式為廣大客戶提供前所未有的智能應用體驗。”陳天石說。

會上,聯想、曙光、 科大訊飛公佈了基於寒武紀芯片的應用方案。聯想集團推出了基於MLU100智能處理卡的ThinkSystem SR650,打破了37項服務器基準測試的世界記錄,將全面支撐起聯想客戶在機器學習/VDI/虛擬化/雲/數據庫/分析/SAP等方向上的業務需求。

中科曙光推出了基於Cambricon MLU100智能處理卡的服務器產品系列“PHANERON”,支持2-10塊寒武紀MLU處理卡,PHANERON-10單臺服務器可集成10片寒武紀人工智能處理單元,為人工智能訓練應用提供832T半精度浮點運算能力,為推理應用提供1.66P整數運算能力,典型場景下的能效提升30倍以上。此外,中科曙光還披露了人工智能管理平臺SothisAI,可以與寒武紀的芯片及其開發環境實現深度融合。

科大訊飛公司也在發佈會上披露了與寒武紀芯片的深度合作研發項目。根據介紹,一小時的語音數據在一個傳統處理器上進行智能應用處理,需要一萬小時才能完成,而科大訊飛於發佈會上披露的測試結果表明,寒武紀的智能處理器在語音智能處理上交出了優異的答卷,能耗效率領先競爭對手的雲端GPU方案達5倍以上。寒武紀智能處理器支持手機本地端處理更加複雜的機器學習算法,使得語音本地識別準確率相對於傳統處理器領先了9.8%,顯著提高了用戶體驗。


分享到:


相關文章: