自動駕駛知多少-計算平臺篇

這幾周其實國內的大事件就要屬2年一次的上海車展盛會啦。每次車展都會展示出很多新奇的東西以及未來的一些技術動向。


自動駕駛知多少-計算平臺篇


本次車展上自動駕駛大放光彩,不光是傳統車企的ADAS功能展示或者自動駕駛的規劃,還是初創車企或者初創自動駕駛企業的方案展示,還是輔助自動駕駛所必需的傳感器,計算平臺等等,都在本次車展上做了一些發佈。

關於車展的自動駕駛相關的報道,我就不再做出詳細說明了,好多媒體以及公眾號都有過詳細報道。

本文還是主要聊聊自動駕駛裡面的一些東西,今天就和大家一起聊聊計算平臺。

眾所周知,自動駕駛任務非常複雜,意味著開發人員需要兼顧軟件和硬件的協同。當前幾篇裡所說的傳感器接受到信息後,導入到計算平臺,由各種芯片處理。因此計算平臺的選擇會直接影響到自動駕駛系統的實時性和魯棒性。

為了保證自動駕駛的實時性需求,軟件響應的最大延遲必須在可接受範圍內,這對計算資源的要求相應的變得極高。目前,自動駕駛軟件的計算量達到了10個TOPS(每秒萬億次操作)或者更高,這使得我們不得不重新思考對應的計算架構。


自動駕駛知多少-計算平臺篇


那麼我們來聊聊計算平臺多少種方案?

1,基於GPU

GPU有多核心,高內存帶寬的優點,所以它在並行計算,浮點運算時性能時CPU的數十倍甚至上百倍。特別時當人工智能在自動駕駛廣為應用的時候,使用GPU運行深度學習模型,在本地或者雲端對目標物體進行切割,分類和檢測,不僅花費時間縮減,同時比CPU更高的應用處理效率。

就如NVIDIA當年發佈會上的對比一樣。


自動駕駛知多少-計算平臺篇


然後下圖是CPU的處理信息。


自動駕駛知多少-計算平臺篇


而這個時GPU的處理信息。


自動駕駛知多少-計算平臺篇


所以,GPU憑藉強大的計算能力以及對深度學習應用的有力支持,GPU正逐漸成為自動駕駛技術開發的主流平臺解決方案。

說到這個就一定要說說NVIDIA了。

英偉達在其自動駕駛汽車平臺上投入巨資,提供了開發和運行汽車AI所需的一整套硬件和軟件。英偉達最近宣佈其下一代驅動AGX平臺和驅動星座模擬器的可用性。

該公司正在建設幫助開發和測試人工智能模型的基礎設施。除了快速的人工智能芯片,英偉達還為客戶提供了一個雲平臺,用於培訓和測試基於“軟件定義的汽車”的人工智能模型,以加速安全自動駕駛汽車的開發和測試。英偉達在中國的投資令人印象深刻,數千名工程師和數千臺專用gpu已經到位。一款安全的自動駕駛汽車必須克服的障礙是驚人的,英偉達正在利用人工智能、VR和超級計算技術,與儘可能多的汽車公司一起率先進入市場。

自動駕駛汽車行業必須應對的挑戰,比人類登月等困難許多數量級。考慮到這一點,在我看來,英偉達的端到端方式對豐田、戴姆勒奔馳、大眾、奧迪、沃爾沃等公司將是非常有吸引力的,更不用說像博世、大陸和ZF這樣的一線供應商了。硬件為計算、功率和價格提供了廣泛的選擇,汽車製造商可以在此基礎上開發支持其品牌的獨特駕駛體驗。

2,基於FPGA

FPGA就是現場可編程邏輯門陣列。它其實就是一個高能低耗的可編程芯片。用戶可以自定義芯片內部的電路連接來實現特定功能。而且時可擦寫,所以用戶可以根據不同時期的產品需求進行重複的擦了寫,寫了擦。

這個其實已經存在很久了,長期在通訊,醫療,工控和安防等佔有一席之地。

相比GPU而言,它的主要優勢在於硬件配置靈活,能耗低,性能高以及可編程等,比較適合感知計算。目前出現針對FPGA的編程軟件平臺,進一步降低了准入門檻,使得FPGA在感知領域應用非常廣。

就拿前幾年上市的奧迪A8來說,它裡面搭載了zFAS平臺,其中由Altera提供的的Cyclone V SoC就是基於FPGA技術打造的視覺解決方案。可以說是最早的在車上的應用吧(如果不對請及時提出哈)。

這裡面的巨頭就不得不提收購深鑑科技的FPGA巨頭:賽靈思了。


自動駕駛知多少-計算平臺篇


作為FPGA的發明者,賽靈思發展至今取得了不少傲人的成就,是全球首個無線晶圓發明者,現在全球擁有4300多項專利。

賽靈思的嵌入視覺解決方案主要包括計算機視覺和機器學習。

而在實際應用中,ADAS在嵌入視覺方面一般有低時延、低功耗和低成本三大要求。“很多工程師可能會立馬想到看上去完美符合這三項要求的ASIC。但我想提醒一下,人工智能的發展速度非常快,每天都會產生大量新的神經網絡,這就意味著ASIC得具有高度靈活性才能跟上快速的上市進程。賽靈思的SOC通過片內緩存數據的方式,搭載上大量的線上內存,最終有效降低了系統時延。

3,基於DSP

DSP也稱為數字信號處理器,是一種特別適合進行數字信號處理運算的微處理器。它在數學運算以及數據移動方面有著優異的性能。

這個相對來說美國德州儀器(TI),是這個解決方案的領導者。

它推出了TDA2x汽車系統芯片SoC,在低功耗封裝中將高能,視覺分析,圖形以及通用處理內核進行結合,實現包括遷至相機,環視等在內的ADAS應用。

而且授權的CEVA公司發佈的圖像和視覺處理產品CEVA-XM4可以支持實時三維深度圖生成和擁宇三維點雲數據處理。功耗只有現GPU的10%左右。

典型的混合式CPU/GPU的處理架構方案相比,建基於DSP架構的CNN引擎,能提供高達近三倍的性能。而且,DSP引擎除了所需電源比GPU小30倍之外,所需的內存帶寬,也只有約GPU的五分之一。CNN算法,屬於乘法和加法密集型(Multiply-accumulate, MAC),因此本質上十分適合運用DSP。也就是說,若要在嵌入式系統中實現CNN,DSP不僅能夠取代GPU和CPU,而且成本和功耗更低。

4,基於ASIC

ASIC就是專用集成電路,是為某種特定需求而定製的芯片。一旦設定製造完成,內部電路以及算法就無法改變。它的優勢在於體積小,功耗低,性能以及效率高,大規模出貨的話,成本非常低。

它和FPSG最明顯的區別就是,FPSG就像樂高,可以在開發過程中各種變更,但是量產後成本也降不下來。ASIC類似開模生產,投入高,量產後成本低。所以一般前期開發階段多用FPSG,量產多用ASIC。

這裡比較知名的應用ASIC技術開發芯片的廠商就是Mobileye了,已經被英特爾收購了,而同樣也是被英特爾收購的Nerbana也是屬於ASIC芯片供應商。

總結

儘管現階段採用GPU架構、GPU+FPGA異構化、ASIC架構的車企並行存在,但綜合來看,車企更傾向於選擇ASIC專用型芯片,以自身更好的軟件算法同時滿足高性能和低功耗的要求。

專屬AI芯片的研發只有少數科技巨頭如谷歌、英特爾參與其中。國內如地平線是面向中國智能駕駛場景所研發的專用芯片,相比Mobileye,其芯片方案要更適合於中國場景,這是國內企業在AI芯片領域的突破,也是具有創新性的中國方案。


自動駕駛知多少-計算平臺篇


此外,國內寒武紀、西井科技等也在AI專用芯片領域有所佈局。

通用芯片GPU、CPU、FPGA在某些特定場景下會造成功能浪費,面積和功耗的冗餘。ASIC專用芯片可以根據特定的算法實現計算能力和計算效率的專用定製化,隨著各類應用場景在自動駕駛不同領域的滲透,即時性應用場景在深度學習上所需要的推理能力越來越強,在雲端進行軟件升級並進行計算已無法滿足特定場景的即時性要求(5G時代的來臨或許有可能解決這一數據傳輸速率的瓶頸),因此,各類應用場景將推動AI專用芯片的研發。

綜上所述,各芯片架構並存的現象還將會延續一段時間,在自動駕駛車進入量產階段後,GPU、CPU將會更廣泛應用於一些較為通用的場景,大規模AI芯片的需求量將使ASIC前期的成本顯著降低,車企選擇ASIC架構的AI芯片或將成為趨勢。因此,國內AI初創企業應緊跟自動駕駛對於AI芯片的需求,針對中國智能駕駛應用場景,採用軟硬件一體的結合方案,使算法在硬件上得到最優化,從而在與整車廠的合作中,能夠針對特定需求定製芯片,擴大自身優勢,在AI芯片領域佔據一席之地。


自動駕駛知多少-計算平臺篇

乖乖,無論哪個計算平臺建立自動駕駛,都需要程序員來開發啊,好像是廢話


分享到:


相關文章: