寒武紀推首款邊緣AI芯片!雲邊端全家桶齊了,加速卡不到2000元

寒武紀推首款邊緣AI芯片!雲邊端全家桶齊了,加速卡不到2000元

芯潮(ID:aichip001)文 | 心緣

芯潮11月14日報道,深圳高交會期間,AI芯片獨角獸寒武紀推出面向邊緣智能計算領域的AI芯片思元220(MLU220)及M.2加速卡產品,加速卡售價1999元。

寒武紀推首款邊緣AI芯片!雲邊端全家桶齊了,加速卡不到2000元

邊緣通常與各類傳感器相連,而傳感器的數據往往是非結構化的,比如視頻,圖像和語音,很難直接用於控制和決策。因此需要邊緣AI計算將非結構化數據進行結構化,用於控制和決策。為此,寒武紀專門設計了針對邊緣AI計算的芯片。

至此,寒武紀AI芯片在雲、邊、端實現全方位、立體式覆蓋。

01、峰值32 TOPS,功耗僅10W

寒武紀推首款邊緣AI芯片!雲邊端全家桶齊了,加速卡不到2000元

思元220是一款專門用於深度學習的SoC邊緣加速芯片,採用臺積電16nm工藝,尺寸為15mm x 15mm,基於寒武紀最新一代智能處理器MLUv02架構,峰值算力達32 TOPS(INT4),功耗僅10W,並且支持通過低功耗技術,將功耗進一步降低。

思元220高性能低功耗設計,主要得益於思元220採用了寒武紀最新一代的處理器架構MLUv02。

MLUv02架構基於片上網絡NoC構建,有六大方面的提升和優化:

寒武紀推首款邊緣AI芯片!雲邊端全家桶齊了,加速卡不到2000元

(1)提升單核性能,通過重新設計運算電路,運算指令的能效大幅提升,單核算力提升8倍;

(2)節省內存和帶寬,增加數據壓縮和解壓縮指令,大幅節省內存容量和訪存帶寬;

(3)高度靈活,指令集擴展近百條,功能更強大更靈活;

(4)精度可選擇,除了INT8,還增加INT4和INT16精度的運算指令,可根據需求靈活選擇,在高性能的場景使用更高性能的INT4,在高精度的場景,使用更高精度的INT16;

(5)增加了軟件可管理的共享緩存,可以用軟件直接控制在處理器核之間進行通訊,利用內部Shared Mem大大優化多核性能;

(6)方便處理複雜數據,增加了靈活的轉置等指令,可以支持各種複雜的數據預處理。

寒武紀推首款邊緣AI芯片!雲邊端全家桶齊了,加速卡不到2000元

另外,思元220內置高性能CPU 4核ARM A55,主頻為1.5GHZ,並集成了豐富的外設接口,包括:

(1)2個PCIe3.0 2×2接口,可以連接NVMe等各類高速設備;

(2)eMMC5.1 HS400,支持高速eMMC存儲,最高達400 MB/s;

(3)SDIO3.0, 可以方便連接各種存儲設備和WIFI 藍牙等無線設備;

(4)雙千兆以太網口,可以幫助客戶實現雙網口的方案,從而實現內外網物理隔離,保護數據安全;

(5)LPDDR4X內存接口,保證計算數據高速交互和低功耗。

隨著5G與AI時代的到來,海量數據處理需求推動AI硬件向邊緣擴展。寒武紀副總裁劉道福認為,邊緣計算主要帶來三個優勢:一是直接在邊緣處理數據,大幅降低通信成本;二是大幅降低時延,解決實時處理需求;三是保護數據隱私安全,無需將數據傳回雲端,減少數據洩漏。

對此,MLU220邊緣方案有三大優勢:

(1)數據高安全:數據本地智能處理,脫敏上傳。

(2)處理低延時:數據實時分析,結果即時反饋。

(3)帶寬高利用:數據邊緣清洗,智能分發,有效上傳。

02、超小尺寸加速卡,僅U盤大小

基於思元220,寒武紀面向市場推出小尺寸M.2加速卡,未來還會推出更高算力的產品形態。

思元220-M.2邊緣加速卡在尺寸僅U盤大小的卡片上,算力達到16 TOPS(INT4),功耗僅8.25W,可提供8路高清視頻的實時智能分析。

寒武紀推首款邊緣AI芯片!雲邊端全家桶齊了,加速卡不到2000元

該加速卡廣泛應用於智能交通、智能電網、智能製造、智慧金融、無人機、工廠質檢、智慧教育、智慧醫療、智慧零售等邊緣計算場景,並支持視覺、語音、自然語言處理及傳統機器學習等多種AI應用。

客戶可通過標準的M.2接口快速部署到已有業務中,實現業務的智能升級和邊緣加速解決方案。

思元220芯片和板卡不僅有高算力、低功耗、小尺寸的特點,還有成熟的軟件棧和軟件生態。

寒武紀的雲、邊、端芯片都採用統一的處理器架構和指令集,以及統一的軟件棧,這三個領域的生態可以相互促進,形成正循環。

雲端提供了完整的開發、調試、調優的軟件,雲端開發好的程序,可方便快速部署到終端和邊緣,解決終端和邊緣開發難、調試難、調優難的問題。而終端和邊緣可以積累大量的客戶和開發者,反哺於雲端生態,最終實現雲、邊、端生態的繁榮。

具體到思元220,軟件棧已經在雲端進行了兩代產品的打磨。通過端雲一體的軟件平臺,思元220將繼續支持寒武紀Neuware軟件工具鏈,支持業內TensorFlow、Caffe、MXNet、PyTorch等各主流編程框架。

其BANG Lang.編程環境可對計算資源做直接定製,滿足多樣化AI定製需求。

寒武紀推首款邊緣AI芯片!雲邊端全家桶齊了,加速卡不到2000元

寒武紀方表示,面向未來邊緣計算、自動駕駛車載計算、訓練等不同場景,寒武紀將持續投資,推出更多AI處理器,面向全場景持續提供更先進靈活、快速高效、性能卓越的AI算力產品及服務。

03、思元系列芯片的四點優勢

在本屆高交會期間,寒武紀展出了最全思元系列AI芯片產品,包括面向雲端的思元100和思元270、面向邊緣的思元220。

今年6月,寒武紀發佈中文品牌“思元”及第二代雲端AI芯片思元270。去年寒武紀推出雲端AI芯片品牌MLU(Machine Learning Unit)及第一代雲端AI芯片思元100。

整體來看,寒武紀思元系列有如下四點共同的優勢:

1、通用性好

通用智能處理器,支持各類深度學習技術,支持多模態智能處理(視覺、語音和自然語言處理),應用領域廣泛。

2、端雲一體

率先提出“端雲一體”的智能處理思路,徹底打通端和雲的智能處理,終端和雲端芯片可共享同樣的軟件接口和完備生態。

3、高能效

相比GPU處理器,採用了針對深度學習和人工智能應用特點定製的指令集和處理器架構,具有更優的能效比。

4、完善的軟件開發環境

寒武紀為思元系列提供了一整套成熟的開發環境Cambricon NeuWare,具體包括應用開發、功能調試、性能調優等在內的一系列工具。

04、結語:填補國內邊緣端加速缺口

從2018年5月發佈第一代雲端AI芯片思元100至今,寒武紀已完成覆蓋雲(思元100、思元270)、邊(思元220)、端(寒武紀1A、1H、1M處理器IP)的完整AI芯片佈局,並在多場景實現廣泛應用。

此次新推出的思元220,為國內邊緣端加速市場又增添了一個新選擇。


分享到:


相關文章: