歷經兩年研發,Arm中國首款AI產品周易AIPU迎落地首秀

上月,全志科技發佈了新款智能語音專用處理器,這是Arm中國耗時兩年研發的周易AIPU的落地首秀。近日,雷鋒網與Arm中國產品研發副總裁劉澍和全志科技副總裁陳風進行了深度交流,瞭解到了Arm中國的產品進展以及Arm中國與全志科技定製周易AIPU的更多細節。

歷經兩年研發,Arm中國首款AI產品周易AIPU迎落地首秀

Arm和Arm中國的AI產品衝突了嗎?

Arm中國在2018年註冊成立,中方投資團隊佔股51%,Arm公司佔股49%,接管Arm在國內的所有業務。同時,Arm中國也會研發更符合中國市場需求的產品。據悉,Arm中國從2018年開始就在推進3個產品線,分別是:周易AIPU、山海平臺安全解決方案、星辰處理器。

劉澍透露:“這三個產品線從團隊建立、到產品開發到發佈客戶、到客戶芯片流片回來測試的工作,目前一切進展順利。今年第一季度恰好都有客戶的芯片返回而且工作正常。”

周易AIPU屬於當下最受關注的AI產品品類,也是Arm中國最先看到落地應用的產品。“與Arm不久前推出的配合Arm Cortex-M處理Ethos-U55和配合Cortex-A處理器的Ethos N系列NPU相比,Arm中國周易AIPU更加通用,既可以跟Cortex-M或Cortex-A一起工作,也可以作為處理器進行獨立工作。”劉澍對雷鋒網表示。

歷經兩年研發,Arm中國首款AI產品周易AIPU迎落地首秀

也就是說,周易AIPU既不是CPU處理器,也不是神經網絡加速器。這是因為,周易AIPU定義了一套新的適用於AI算法的指令集,通過指令來驅動裡面的向量處理單元和固定的AI算法處理單元,從而完成各種複雜網絡的組合的操作。

歷經兩年研發,Arm中國首款AI產品周易AIPU迎落地首秀

但作為一款AI處理器,周易AIPU也必須尋找通用性和效率的平衡點,以提升產品的競爭力。周易AIPU的做法是,用向量處理單元Vector/Tensor Process的並行的8-bit向量陣列進行向量計算,Arm中國為Vector/Tensor Process定義了一整套向量處理指令集,有點類似於Arm此前的NEON指令集。

另外,周易AIPU中的AI Fix Function把常見的AI網絡裡所通用的部件和單元固化為硬件,通過指令就可以驅動硬件工作,提升效率。

標量部分,周易AIPU也有標量單元,這個單元並非完成的CPU,但有類似標量處理器的功能。

因此,周易AIPU用標量處理單元Scalar Unit、向量處理單元TensoCre Ellxe.Cell,還有能提升AI效率的AI Fix Function,最終實現通用性和效率的兼顧。

除此之外,周易AIPU的架構中還有可擴展的安全架構和可擴展的用戶定義架構。“可擴展的用戶定義架構其實就是給像全志科技這樣的戰略合作伙伴準備的,因為有的客戶可能很簡單地把AIPU集成下來就可以了,但也有一些比較有深入研究的芯片公司,會對裡面的算子有自己定製的理解和需要。”劉澍進一步指出,

“我們開放了這樣的接口,可以用特殊的指令來驅動用戶定義的算子。因此,不同周易AIPU平臺的產品最終的效能可能不同。”

當然,周易AIPU也是一些列高度可配置的處理單元,開發者既可以配置通用的Tensor算力,也也已配置AI Fix Function專用算力。

周易AIPU單核性能為0.2TOPS-4TOPS,用多核配置組成系統最高可實現64TOPS的算力。

歷經兩年研發,Arm中國首款AI產品周易AIPU迎落地首秀

全志科技最新發布的R329語音專用SoC中集成的正是定製的周易AIPU。

定製化是AI處理器提升競爭力的關鍵

全志科技R329中集成了定製的周易Z1-0701,1代表的是Arm中國第一代周易AIPU架構,07指它有2的7次方個硬件MAC,01表示還有一個通用的Tensor處理單元。

劉澍說:“0701是專門針對智能家居、智能樓宇、智能機器人這樣的場景深度定製的,它可以非常高效地運行在本地的ASR的各種語音算法。同時,它也有相對比較簡單的視覺的分析能力,比如說圖像和人臉識別以及感知。”

歷經兩年研發,Arm中國首款AI產品周易AIPU迎落地首秀

劉澍也表示,Arm中國是根據全志科技給出的市場定位,在周易AIPU 的處理器上又花了數月的時間進行定製,最終做出全志科技所需要、在市場上具備競爭力的產品。這樣,通過全志科技這個戰略合作伙伴,不僅帶來了準確的市場需求信息,更用頂實話的方式開發IP保證Arm中國的產品最切合客戶需求。

全志科技副總裁陳風也說:“當下僅僅把芯片做好還不夠,在過去幾年裡,我們花了非常多時間進行市場信息蒐集,涉及市場需求,實現方式、手段、技術細節等。所以,在我們雙方探討合作的時候,Arm中國也發現全志科技擁有非常多有價值的市場需求信息和思考,這也促成了雙方的迅速合作。”

“通過跟非常多的友商和算法公司進行了大量的交流,發現大家對專用算力是有明確需求的,所以我們就推出了全志科技R329這樣的芯片,經過了10個月左右的研發,這款新品已經有樣片和樣機。”陳風也透露。

“各家知名的算法廠商,包括訊飛、思必馳還有其他的合作伙伴都已經開始做了算法的工作,他們的反饋現在都是非常好的。”

對於算法公司而言,算法移植的難度以及與硬件匹配的軟件的易用程度成為關鍵。據悉,通過Arm中國和全志科技的合作,可以實現TensorFlow模型的24小時移植。未來,周易AIPU還會支持更多的業界主流的AI框架。

不過,在AI框架之下,還需要Arm的Compute Library或者是Open AI Lab的異構計算庫,進一步去支持像Arm NN、安卓NN比較流行的接口。像全志這樣有實力的公司,則會有自研的Tina OS和Runtime的框架,只要把周易AIPU的驅動層接進去都可以正常工作。

歷經兩年研發,Arm中國首款AI產品周易AIPU迎落地首秀

陳風介紹,Tina OS在全志科技內部使用已經有5、6年的歷史,它是一個輕量級的Linux OS,使用Tina OS的名稱後已經迭代了三個大的版本,整個OS完全開源,並且啟動速度非常快,現在全球已經有累計超過5千萬臺的設備使用了Tina OS,包括音箱、掃地機、冰箱和微波爐等。

品質和靠譜是AI芯片落地的關鍵

成立於2007年的全志科技,早在2011年就開始進入智能音箱產品,但那時的智能音箱是能連上Wi-Fi就叫智能,和2013年之後我們所說的智能音箱的概念還是有所不同。全志科技新發布的AI芯片會以智能音箱為切入點,然後滲入到智慧城市,包括智能樓宇、智慧工業以及智慧生活當中。

歷經兩年研發,Arm中國首款AI產品周易AIPU迎落地首秀

陳風預計,家電產品應該在2020年和2021年左右開始迎來第一波的智能化的普及浪潮。

他指出,語音面板看起來不起眼,實際上量非常大的市場。因為工業控制器、電梯、汽車的駕駛平臺以及一些專業的電子設備都會有控制面板,這個面板的語音化現在也已經開始全面啟動了。

談及全志科技AI產品的核心競爭力,陳風說:“我們現在是有非常明確的答案和信心的,任何一個產品或者是技術的落地,需要的是非常可靠的一種實現方式。我所說的可靠,不僅來源於全志科技有實力,過去的經歷也證明我們公司能夠向客戶提供極其持久的技術支持和產品支持。”

另外就是品質,“電子產品是否可靠,在消費電子領域、工業電子領域,以及在智慧家庭領域有截然不同的等級要求。在家電領域,品質也是客戶重點考量的對象,要求的級別可能是99.9%,也可能是99.99%,最高達到了99.9999%,這麼高的可靠性要求,背後也是客戶精細化經營的要求。”陳風指出,“通過類似的場景大家可以感受到,語音技術在商品化的過程中,靠譜這兩個字是有多麼重要,它擺在了先進性之前。”

雷鋒網小結

Arm的AI產品的發佈和落地進展在業界都並非最快,這其中很重要的原因就是Arm在權衡NPU的效率和靈活性花了更多時間。在Arm中國的產品中,周易AIPU作為Arm中國的首款AI產品,通過一套新的AI算法指令集適應AI處理器的需求,兼顧通用性和效率。並且,周易AIPU的指令集設計和架構設計都由Arm中國完成,因此這也是一個Arm中國自主可控的產品。

Arm中國與全志科技的合作,是周易AIPU的首秀,最終的競爭力到底如何,我們將保持關注。另外,Arm中國除了將周易AIPU授權給智能家居領域的公司,還授權給了汽車應用領域、手機領域和安防監控等領域的芯片合作伙伴,周易AIPU的表現值得期待。

還有一個值得關注的問題,周易AIPU和Ethos NPU在中國市場會如何協同發展?


分享到:


相關文章: