阿里平頭哥發佈第一顆量產芯片含光800,性能全球最快

含光800是平頭哥第一顆正式流片的芯片,事實上這款芯片已經應用在了阿里雲的服務器上!一個芯片要經歷設計、仿真、流片、驗證、量產應用等幾個環節,流片失敗就要重頭再來,所以做芯片很不容易。

阿里平頭哥發佈第一顆量產芯片含光800,性能全球最快

為什麼要自研芯片?

官方的說法是含光800採用的是自研架構,這是什麼意思呢?就是含光800的指令集是自己設計的,不會受制於任何廠家,不需要別人的授權。就這點好處嗎?不是,當指令集,微架構,操作系統(阿里雲平臺)都是自己設計的時候,軟硬件的結合才能發揮最大的功效。

AI芯片屬於專用處理芯片不同於CPU這樣的通用處理器,不僅是阿里,谷歌等互聯網企業也在自研AI芯片,對於AI來說另一個比較重要的就是框架,之前Caffe之父賈揚清重磅加盟阿里在知乎也是引起熱論,相信在這方面一定也會有所作為。

阿里平頭哥發佈第一顆量產芯片含光800,性能全球最快

阿里有龐大的用戶數據可以訓練,有眾多的應用場景,當含光800在平臺上應用起來之後就可以進入改進,迭代升級的軌道。不管從哪方面來說含光800的正式應用都具有重大的意義,在我看來意義可能等同於阿里當年的去IOE,但是這只是第一步,未來的路還很長。

含光800的性能

在業界標準的ResNet-50測試中,含光800推理性能達到78563 IPS,比目前業界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。

根據雲棲大會的現場演示,在城市大腦中實時處理杭州主城區交通視頻,需要40顆傳統GPU,延時為300ms,使用含光800僅需4顆,延時降至150ms。拍立淘商品庫每天新增10億商品圖片,使用傳統GPU算力識別需要1小時,使用含光800後可縮減至5分鐘。

老實講,這個等於10顆GPU還是有點宣傳的意味的,因為GPU並非專用的AI芯片,推理的話可能還有很多的剪枝,自己定製效果肯定更好。

阿里平頭哥發佈第一顆量產芯片含光800,性能全球最快

下面這個圖對比比較直接,可以看到性能,能耗比都遠超寒武紀MLU270,集成了高達170億個晶體管,晶體管越多性能越強?未必,這還要看微架構的設計能力自己製程等,目前來看在這些方面平頭哥的含光800都是做的很優秀的。

這有些像手機領域的蘋果和高通,大家都知道iPhone的A系列處理器性能是所有手機中最高的,因為他們是自研自用可以根據自己的語言定製,die size也大,而高通是做出來賣給第三方廠商的設計的時候還要考慮成本,顧客等很多因素就會保守一些。平頭哥的含光800同樣如此,自研自用根據需要自己設計,有能力就可以大膽的堆晶體管了。

阿里平頭哥發佈第一顆量產芯片含光800,性能全球最快

芯、雲、AI三位一體

含光800並不對外出售,而是用在阿里巴巴內部核心業務中,目前基於含光800的AI雲服務已經正式上線,含光800通過阿里雲AI雲服務的形式為企業提供服務。

阿里的定位不是零售商而是基礎服務的提供商,芯片,AI與雲計算是三位一體的,雲是外在的綜合體。AI算法基於AI芯片發揮最大效能為雲服務提供了更強的性能,而云計算本身則加速了人工智能應用的大規模落地,不僅為自己也為更多的客戶提供服務。目前阿里雲穩居全球雲計算廠商前三、亞太第一的位置,超過一半的中國A股上市公司和80%中國科技類企業在使用阿里雲的服務。

含光的來歷和玄鐵、無劍一樣,都是以神兵利器做命名的,下一個命名是什麼?魚腸?霜之哀傷?(好像名字有點怪,逃)


分享到:


相關文章: