FPGA適合AI邊緣計算嗎?

新一輪的AI熱潮對芯片提出了更高要求,不過,AI芯片的定義還沒有嚴格和公認的標準。因此,可以運行深度學習算法的CPU、GPU以及FPGA和ASIC都可以被稱為AI芯片。雖然都稱為AI芯片,但在2019年AI落地的大背景下,AI芯片的效率更值得關注。

那麼,在邊緣端,FPGA能與專為邊緣AI設計的ASIC共同推動AI的普及嗎?

FPGA适合AI边缘计算吗?

三大FPGA公司整體向上

歷經併購和整合,目前全球排名前三的FPGA供應商分別是賽靈思、英特爾、萊迪思。有意思的是,前兩大供應商在今年相繼推出“最大”FPGA。8月,賽靈思宣佈推出全球最大容量的FPGA Virtex UltraScale+ VU19P,這款FPGA基於臺積電16nm工藝,集成350億個晶體管、900萬個系統邏輯單元,有每秒達1.5 Terabit的DDR4存儲器帶寬、每秒達f 4.5 Terabit的收發器帶寬和超過2000個用戶I/O。

三個月後的11月,英特爾宣佈推出全球容量最大的FPGA Stratix 10 GX 10M,採用14nm工藝製造,集成了443億個晶體管,核心面積約1400平方毫米,在70×74毫米的封裝面積內擁有1020萬個邏輯單元,還有25920個數據接口總線(EMIB),是此前記錄的兩倍多,每個接口吞吐量2Gbps,內部總帶寬6.5TB/s,另有308Mb存儲、6912個DSP(18×19排列)、2304個用戶I/O針腳、48個收發器(0.84Tb/s帶寬)。

顯然,賽靈思和英特爾推出更大容量的FPGA為的是滿足大數據以及雲端AI的需求,將FPGA的應用從工業和汽車更多地拓展到數據中心。在半導體行業,頭部效應尤為明顯,即便市場份額排名第三,如果萊迪思也推出大容量FPGA,境遇可能會非常艱辛。

賽靈思和英特爾在FPGA市場的調整也給了萊迪思市場拓展的機遇。過去幾年,萊迪思都專注於消費類市場,但消費類市場迭代速度非常快,需要根據不同的市場需求推出相應的產品。

FPGA适合AI边缘计算吗?

萊迪思亞太區產品市場部總監陳英仁表示:“在市場需求不明確且快速變化的時候,技術很難複用。我們現在採用平臺化的新模式,這樣能夠最大化設計複用,降低開發成本及加速產品迭代。”

FPGA适合AI边缘计算吗?

萊迪思亞太區產品市場部總監陳英仁

FPGA適合邊緣AI嗎?

由此看來,萊迪思在市場的變化中找到了合適的定位和產品路線。

不過FPGA要在邊緣AI計算中應用,高成本和開發難度大是兩個問題。對此,陳英仁表示,很多客戶都用我們的FPGA進行量產,所以我們的FPGA價格非常友好。並且過去四年,萊迪思出貨的FPGA數量在10億片的量級,這也證明我們的產品非常可靠。

至於設計門檻,陳英仁指出,由於FPGA的生態環境不像C語言那樣方便,所以大家覺得FPGA的設計門檻比較高。這又可以分成兩部分,一部分是工具,萊迪思全新推出的平臺CrossLink-NX會使用Radiant 2.0,調試工具做了很大改善,也支持業界標準的SDC,還加了ECO編譯器,還有信號完整的分析,並且將持續保持更新,讓懂FPGA的工程師能夠更方便的使用。

另一部分是參考設計,對於那些不太懂FPGA的工程師,他們不知道這些工具的差異,需要一些參考設計才更容易上手,這也是萊迪思的強項。另外我們推出的sensAI,包含了評估、開發和部署基於FPGA的機器學習和人工智能解決方案所需的模塊化硬件平臺、演示示例、參考設計、神經網絡IP核、軟件開發工具和定製設計服務。這些都能夠降低FPGA的設計門檻。

FPGA适合AI边缘计算吗?

還有一點,FPGA本身就是並行處理,深度學習算法很多都需要並行處理,通過sensAI把AI模型轉換之後,FPGA執行AI推理非常適合。

價格友好且設計門檻在降低,但FPGA想在邊緣端應用,還需要有相對ASIC明顯的優勢才具備吸引力。對此,陳英仁對雷鋒網表示:“我們專注於把FPGA的優勢發揮出來,比如低延遲。另一個是FPGA能夠快速導入市場。還有就是FPGA的彈性,因為FPGA本身就有可編程性的優勢,I/O、配置都非常靈活。I/O接口的靈活性非常適合邊緣端,可以接入各種傳感器。”

他進一步解釋靈活性在邊緣端的重要性,如果從性能和功耗比的角度衡量, FPGA相比ASIC會顯得沒有優勢。但FPGA可以提供不同的接口,這樣就可以接不同的傳感器,並且能夠滿足產品智能化升級的需求。特別是AI技術還在不斷地演進,要對現有產品做升級的時候,由於ASIC的拓撲結構已經固化,如果一個電子廣告牌想要增加一個傳感器更好滿足需求時,ASIC就很難,而用FPGA無論是用SPI還是USB接口都能輕鬆接入。

什麼樣的FPGA更適合邊緣AI?

FPGA适合AI边缘计算吗?

既然FPGA從成本、性能、開發門檻方面都在改變滿足邊緣AI的需求,那到底什麼樣的FPGA可以更好滿足邊緣AI需求?萊迪思給出的答案就是前面提到的CrossLink-NX。CrossLink-NX基於萊迪思NEXUS平臺,有功耗降低75%、可靠性提升100倍、最小尺寸以及高性能網絡邊緣計算能力的特性。

FPGA适合AI边缘计算吗?

具體而言,CrossLink-NX有192個可編程I/O,D-PHY速度達到2.5Gbps,邏輯單元達到40K,主要應用於視頻橋接處理。

低功耗的實現是因為萊迪思在CrossLink-NX中使用了三星28nm FD-SOI的工藝,陳英仁介紹,我們選用的工藝中有一個很薄的Buried Oxide,可以把失效率降低100倍,也就是可靠性增加了100倍,並且靜態功耗最高可以比競爭對手降低75%。

FPGA适合AI边缘计算吗?

在性能方面,CrossLink-NX提供了17K-40K的邏輯單元,可以提供低功耗以及高性能模式,並且增加了很多嵌入式存儲RAM,再加上DSP模塊,讓CrossLink-NX嵌入式存儲器/邏輯比達到170bit,比競爭對手的產品高几倍,可以更有效地處理圖形和AI推理。

FPGA适合AI边缘计算吗?

高存儲器/邏輯比的同時還實現了小尺寸,CrossLink-NX採用的是優化4輸入查找表,使其產品能夠實現小尺寸,在6x6mm的面積上就具備40K的邏輯單元。陳英仁認為,4輸入的查找表到目前為止,甚至以後的產品都綽綽有餘,因為我們追求的不是最高性能,而是低功耗以及由此帶來的成本以及方便性。

FPGA适合AI边缘计算吗?

當然,讓CrossLink-NX更適合邊緣AI的還有超快的I/O啟動以及快速地I/O傳輸。在傳輸速度上,萊迪思使用的是硬核的I/O提升速率,通過MIPI D-PHY,速度從之前的1.5Gbps提升到了2.5Gbps。陳英仁表示,現在大部分的SoC的速度都是2.5Gbps,所以我們的FPGA可以更容易與SoC配合滿足嵌入式視覺和邊緣AI的需求。

啟動速度方面,CrossLink-NX的I/O配置速度小於3ms,器件配置小於8ms,這個速度不僅相比MCU或SoC時間段很多,並且通過先把I/O配置好,電壓已經固定,系統也就比較穩定。

雷鋒網瞭解到,CrossLink-NX一開始會先支持工業級的溫度,然後會進行車規認證。目前,CrossLink-NX已經有30多個客戶開始試用,供貨時間也比預期更加提前。

陳英仁還表示,軟件和IP也準備就緒,未來sensAI也將支持CrossLink-NX。針對AI應用,我們還可能與第三方合作提供一站式方案,通過硬件成品在搭配上參考設計,讓不懂FPGA以及AI算法的客戶能夠更加方便的應用。

雷鋒網小結

邊緣AI以及AI市場潛力巨大,在AI對芯片算力提出更高要求的時候,所有的芯片提供商都不想錯過AI帶來的機會。FPGA公司也不例外,只是FPGA本身更加擅長信號處理和網絡加速等,但為了能夠在大數據的AI的時代發揮更大的價值,排名第一和第二的FPGA公司都推出更大規模的FPGA,更好地滿足雲端AI市場。這給萊迪思一個很好的機會,通過計算平臺化的方式,最大化複用技術的同時,還能向上一步進入工業和汽車市場。

為了更好地把握好這個機會,萊迪思的新品通過性能、穩定性、I/O各方面的優化,發揮FPGA在邊緣AI中低延遲、高靈活性的特性,儘可能滿足邊緣AI計算的需求。對於市場而言,增加一種有競爭力的選擇當然一件好事,至於市場的接受度如何,我們將保持關注。


分享到:


相關文章: