我"芯"飛揚 2019年國產AI芯片盤點

隨著人工智能的日日雄起,AI相關產業的商用場景正逐步大規模落地,科大訊飛董事長劉慶峰在接受媒體時就曾不止一次表示,2019年是AI應用落地,人工智能紅利期已經到來。受此共識影響,國內AI領域自2019正式進入發展蓬勃期,各種應用層出不窮,與之對應的,是國產智能芯片後來居上。2019年,國內各大科技巨頭都研發了哪些AI芯片?下面我們就一起來看看。

1.崑崙芯片

2019年尾聲,百度宣佈首款AI芯片崑崙已經完成研發,將由三星代工生產。該芯片使用的是三星14nm工藝技術,封裝解決方案採用的是I-Cube TM。

我

據悉,崑崙AI芯片提供512Gbps的內存帶寬,在150瓦的功率下實現260TOPS的處理能力,能支持語音,圖像,NLP等不同的算法模型,其中ERNIE模型的性能是T4GPU的三倍以上,兼容百度飛槳等主流深度學習框架。該款芯片主要用於雲計算和邊緣計算,預計在2020年初實現量產。

2.科大訊飛AI 語音芯片 CSK400X 系列

2019年10月24日,科大訊飛在第三屆1024全球開發者節上發佈了訊飛聯合生態合作伙伴打造的家電行業專用 AI 語音芯片 CSK400X 系列,以及基於CSK400X的四套智能家電模組。

我

CSK400X算力可達到128GOPS,通過深度神經網絡算法解決家居中的噪音問題,支持200個喚醒詞作為命令詞,可幫助開發者加速對家電語音功能的開發。此外,根據家電的不同需求,科大訊飛將這些芯片分成了幾類,比如旗艦版的雙麥的離線模組,雲加端的雙麥模組,甚至還提供純粹的支持語音合成的模組。這些功能豐富且效果領先的芯片模組擁有高度的性價比,能夠讓家電的智能語音功能開發在很低的成本下集成高水平的語音能力。

3.含光800

2019年的杭州雲棲大會上,達摩院院長張建鋒展示了一款號稱全球最強 AI芯片——含光800。在業界標準的 ResNet-50 測試中,含光 800 推理性能達到 78563 IPS,比目前業界最好的 AI 芯片性能高 4 倍;能效比500 IPS/W,一個含光800的算力相當於10個GPU。

我

目前,含光800已經實現了大規模應用於阿里巴巴集團內多個場景,例如視頻圖像識別/分類/搜索、城市大腦等,未來還可應用於醫療影像、自動駕駛等領域。以杭州城市大腦實時處理1000路視頻為例,過去使用GPU需要40塊,延時為300ms,單路視頻功耗2.8W;使用含光800僅需4塊,延時150ms,單路視頻功耗1W。

4.昇騰910

2019年8月,華為在深圳總部發布AI處理器Ascend 910(昇騰910),據華為發佈的參數顯示,昇騰910是一款具有超高算力的AI處理器,其最大功耗為310W,華為自研的達芬奇架構大大提升了其能效比。八位整數精度(INT8)下的性能達到512TOPS,16位浮點數(FP16)下的性能達到256 TFLOPS。

我

作為一款高集成度的片上系統(SoC),除了基於達芬奇架構的AI核外,昇騰910還集成了多個CPU、DVPP和任務調度器(Task Scheduler),因而具有自我管理能力,可以充分發揮其高算力的優勢。

昇騰910集成了HCCS、PCIe 4.0和RoCE v2接口,為構建橫向擴展(Scale Out)和縱向擴展(Scale Up)系統提供了靈活高效的方法。HCCS是華為自研的高速互聯接口,片內RoCE可用於節點間直接互聯。最新的PCIe 4.0的吞吐量比上一代提升一倍。

5.征程二代

2019世界人工智能大會中,人工智能芯片初創公司地平線正式宣佈量產中國首款車規級人工智能芯片——征程二代,並且獲得五個國家市場客戶的前裝定點項目。

我

據介紹,征程二代於2019年初流片成功,搭載地平線自主創新研發的高性能計算架構BPU2.0(Brain Processing Unit),可提供超過4TOPS的等效算力,典型功耗僅2瓦,滿足AEC-Q100標準,算力利用率超過90%,每TOPS算力可以處理的幀數可達同等算力GPU的10倍以上,識別精度超過99%,延遲少於100毫秒,多任務模式下可以同時跑超過60個分類任務,每秒鐘識別目標數可以超過2000個。

6.邃思DTU

2019年發佈會上,由騰訊領投、融資累計超過6億元的AI芯片公司燧原科技,發佈自主研發的首款AI訓練芯片"邃思DTU"。

我

邃思DTU採用格羅方德12nm FinFET工藝,480平方毫米主芯片上承載141億個晶體管,實現2.5D高級立體封裝,據稱單卡單精度算力為業界第一,達20TFLOPS,首次支持混合精度,半精度及混合精度下算力達80TFLOPS,最大功耗僅225W。

邃思芯片基於可重構芯片的設計理念,計算核心包含32個通用可擴展神經元處理器(SIP),每8個SIP組合成4個可擴展智能計算群(SIC)。SIC之間通過 HBM 實現高速互聯,通過片上調度算法,數據在遷移中完成計算,實現了 SIP 利用率最大化。

7.思元220芯片

寒武紀在第21屆高交會正式發佈邊緣AI系列產品思元220(MLU220)芯片及M.2加速卡產品,標誌寒武紀在雲、邊、端實現了全方位、立體式的覆蓋。

我

思元220芯片採用了寒武紀在處理器架構領域的一系列創新性技術,其架構為寒武紀最新一代智能處理器MLUv02,實現最大32TOPS(INT4)算力,而功耗僅10W,可提供16/8/4位可配置的定點運算。作為通用處理器,支持各類深度學習技術,支持多模態智能處理(視覺、語音和自然語言處理),應用領域廣泛,客戶可以根據實際應用靈活的選擇運算類型來獲得卓越的人工智能推理性能。

上面我們盤點了2019年國內科技企業發佈的7款AI芯片,每款芯片的出現,都令人熱血澎湃,大感振奮,意味著我國在錯失了計算機處理芯片風口的同時,在AI領域終於彎道超車。

實際上除了國內企業外, 2019年,國外一些企業也發佈了幾款性能強悍的AI芯片,如:總部位於英國布里斯托的Graphcore公司推出了迄今為止最複雜的處理器芯片——Graphcore IPU;亞馬遜雲服務業務AWS發佈的高性能機器學習加速芯片Inferentia;英特爾推出的面向訓練 (NNP-T1000) 英偉達發佈的全新的軟件定義自動駕駛平臺——NVIDIA DRIVE AGX Orin——中內置的全新Orin系統級芯片等。


分享到:


相關文章: