技術分享 安富利
人工智能(AI)正在以一種超預期的速度向我們的生活滲透。但是坦率地講,這種滲透有時候顯得有些“勉強”。究其原因,就是大家的想象力到了,市場需求也有了,但是真正實施起來人們卻發現“沒有合適的處理器可用”。當下,很多AI應用都是跑在傳統架構的處理器上,其結果有時也就有些差強人意了。
周所周知,AI專門的算法是需要算力性能相匹配的計算架構做支撐的。為此專門做一個ASIC固然好,但是這種技術路徑風險太大:
- ASIC高研發費用,決定了不是誰都玩得起,而且如果前期沒看準,一不留神就可能掉坑裡。
- AI應用範圍越來越廣,從雲端到邊緣端各種應用差異大、變化快,因此一個具有通用性和靈活性的計算處理平臺才更合適。
如果我們拿AI市場和自然界做個類比,可以說AI正在改變市場環境,而在這個環境中的處理器“物種”自然也要做適應性的調整,才能生存和發展。在自然界中,一個新物種的出現是漫長進化的結果;而在AI市場中,造物的魔法棒則是掌握在工程師的手中,今天他們正在用何種方式創造AI市場中的處理器“新物種”,讓我們一起來看看。
異構處理
AI應用中處理器的核心挑戰,就是計算任務越來越複雜和多樣化,它既要完成機器學習等密集計算任務,也有諸如控制和連接等工作。對於我們概念中傳統的單一計算架構,這是無法完成的任務。解決問題的方法只有一個,那就是異構處理,即在一個處理器中集成多種計算架構,各司其職,分別完成其最擅長的工作,以做到性能的最大化和效率的最優。
異構處理的概念也不算新鮮事,比如賽靈思公司多年前就推出的Zynq FGPA SoC平臺,在單一器件中集成了Arm處理器和可編程邏輯電路,使其成為兼具高性能和靈活性的典範。是不是可以在這個基礎上更進一步,創造出適應AI市場需要新的異構處理器?
答案是肯定的,而且在這個方向上賽靈思已經邁出了實質性的一大步,這就是全新的ACAP(Adaptive Compute Acceleration Platform,自適應計算加速平臺)架構。基於ACAP架構的Versal器件也已經發布。
這個採用7nm半導體工藝的計算平臺囊括了三種計算架構:
- 標量引擎(CPU),即Arm處理器子系統,通常用於控制面應用、操作系統、通信接口、以及更低級別或更復雜的計算。
- 自適應引擎(FPGA),即可編程邏輯電路,用於執行數據操作和傳輸、非基於向量的計算和連接功能。
- 智能引擎(矢量處理器),也被成為AI引擎,用於向量實現中的計算密集型功能。
圖1,Versal ACAP功能框圖(圖片來源:賽靈思)
其中,AI引擎無疑是最大的新意和亮點。由於針對計算密集型任務進行了優化,在做此類計算處理時,AI引擎與可編程邏輯電路(PL)相比,單位芯片面積的計算容量提高了3到8倍,執行相同功能功耗降低50%。這顯然會為AI應用提供更強的算力。
圖2,AI引擎分塊細節(圖片來源:賽靈思)
賽靈思希望在ACAP的架構基礎上,能夠擴展出全新系列的異構計算平臺,適應多種不斷變化的算法,適用於從雲到網絡邊緣的任何應用,再配以驅動程序、中間件、庫和軟件框架等全面的軟件支持,最大限度地讓各類應用的開發者從中受益。
ML處理器
在“創造AI處理器新物種”這件事上,賽靈思的Versal ACAP架構的示範和引領作用是毋庸置疑的。不過,Versal ACAP架構再怎麼說也只是一家廠商創造的“新物種”,如何能讓更多的芯片開發者有機會參與到“造物”中來,加快AI處理器新品推出的速度?解決這個問題,就需要從芯片設計更底層的IP核考慮了。做這個事情,最合適的無疑就是Arm。
作為在嵌入式處理器領域具有統御地位的IP核供應商,實際上當前很多AI應用都是在Arm之前推出的MCU/MPU Core上運行的,Arm也一直在不斷優化相關的產品組合,以跟隨AI市場的腳步。不過儘管如此,Arm並沒有放棄推出一個專門適應AI應用的處理器芯核,並在2018年發佈了機器學習(ML)處理器。
圖3,Arm ML處理器架構
從ML處理器架構中可以看到,它包含兩個核心的處理單元:實現高效卷積操作的固定功能引擎(Fixed-function Engine)和實現高效的可編程性的可編程層引擎(Programmable Layer Engine),這樣的架構既提供了足夠的運算能力,也針對不斷演進的NN算法和架構保持了靈活性。根據Arm提供的數據,其第二代ML處理器峰值性能達到了5TOP/s,功耗僅為1W。
從目前ML處理器的特性來看,它更適合網絡邊緣AI的應用。不過按照Arm的規劃,該處理器架構將具有極強的擴展性,未來從每秒2 GOP物聯網邊緣智能,到性能高至每秒150 TOP的服務器型應用,都可以“通吃”,這種多重配置的效率可達到現有解決方案的數倍!
圖4,憑藉可擴展性,Arm ML處理器覆蓋廣泛的應用
儘管目前ML處理器整體研發進程給人的感覺不是很快,但人們有理由相信,憑藉Arm完整的開發生態鏈支持,ML處理器有望從“基因”層面重新定義AI處理器的未來。
不誇張地講,我們正處在AI處理器“新物種”大爆發的前夜,未來處理器市場的樣貌也會隨之而改變。這個時候,作為應用開發者應該如何應對,考驗大家判斷力和實力的時候又到了。
閱讀更多 AI工信科創 的文章