人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

溫馨提示:如需原文檔,可在PC端登陸www.vzkoo.com搜索下載本報告。

一、人工智能芯片發展現狀及趨勢

1.1、深度學習算法對芯片要求更為苛刻,通用CPU性價比相對較差

經歷了60多年的起起伏伏之後,人工智能終於迎來了第三次爆發。第三次爆發的核心引爆點是深度學習算法的出現,但其背後的支撐是數據和算力。對整個AI行業來講,算法、數據和算力三大基本要素中,數據尤其是海量數據的獲取和處理難度在下降,算法也在深度學習模型的基礎上不斷優化,而負責將數據和深度算法統一協調起來的芯片能否獲得大的飛躍,成為市場關注的焦點。

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

深度學習算法對芯片性能需求主要表現在三個方面:一、海量數據在計算和存儲單元之間的高速通信需求。這不但需要芯片具備強大的緩存和片上存儲能力,而且還需要計算和存儲單元之間有較大的通信帶寬。二、專用計算能力需求高。深度學習算法中有大量卷積、殘差網絡、全連接等特殊計算需要處理,還需要提升運算速度,降低功耗。三、海量數據自身處理同樣也對芯片提出了新的要求,尤其是非結構化數據的增多,對傳統芯片結構造成了較大的壓力。

通用CPU在深度學習中可用但效率較低。比如在圖像處理領域,主要用到的是CNN(卷積神經網絡),在自然語言識別、語音處理等領域,主要用到的是RNN(循環神經網絡),雖然這兩種算法模型有著較大的區別,但本質上都是向量和矩陣運算,主要是加法和乘法,輔助一些除法和指數運算。傳統CPU可用於做上述運算,但是CPU還有大量的計算邏輯控制單元,這些單元在AI計算中是用不上的,造成了CPU在AI計算中的性價比較低。

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

1.2、GPU、FPGA以及ASIC各有優劣,成為當前AI芯片行業的主流

正因為CPU在AI計算上的弱點,給了可以實現海量並行計算且能夠對進行計算加速的AI芯片留下了市場空間。從廣義上講,面向AI計算的芯片都可以稱為AI芯片,包括基於傳統架構的GPU、FPGA以及ASIC(專用芯片),也包括正在研究但離商用還有較大差距的類腦芯片、可重構AI芯片等。

雲端訓練芯片市場較為集中,而推理市場雲、邊兩端均有大量企業參與

按照部署位置劃分,AI芯片可以分為雲端芯片和邊緣端芯片。雲端芯片部署位置包括公有云、私有云或者混合雲等基礎設施,主要用於處理海量數據和大規模計算,而且還要能夠支持語音、圖片、視頻等非結構化應用的計算和傳輸,一般情況下都是用多個處理器並行完成相關任務;邊緣端AI芯片主要應用於嵌入式、移動終端等領域,如攝像頭、智能手機、邊緣服務器、工控設備等,此類芯片一般體積小、耗電低,性能要求略低,一般只需具備一兩種AI能力。

按照承擔的任務分,AI芯片可以劃分為訓練芯片和推理芯片。訓練是指通過大量標記過的數據在平臺上進行“學習”,並形成具備特定功能的神經網絡模型;推理則是利用已經訓練好的模型輸入新數據通過計算得到各種結論。訓練芯片對算力、精度要求非常之高,而且還需要具備一定的通用性,以適應多種算法的訓練;推理芯片更加註重綜合能力,包括算力能耗、時延、成本等因素。

綜合來看,訓練芯片由於對算力的特殊要求,只適合在雲端部署,而且多采用的是“CPU+加速芯片”類似的異構模式,加速芯片可以是GPU,也可以是FPGA或者是ASIC專用芯片。AI訓練芯片市場集中度高,英偉達和谷歌領先,英特爾和AMD正在積極切入。推理在雲端和終端都可進行,市場門檻相對較低,市場參與者較多。雲端推理芯片除了傳統的英偉達、谷歌、賽靈思等芯片大廠外,Groq等國際新興力量也在加入競爭,國內寒武紀、比特大陸也有不錯表現;終端推理芯片市場較為分散,場景各異,參與者除了英偉達、英特爾、ARM和高通之外,國內企業如寒武紀、地平線、雲知聲、雲天勵飛等在各自細分領域均有所建樹。

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

GPU擅長雲端訓練,但需與CPU異構、功耗高且推理效率一般

GPU(GraphicsProcessingUnit)是一種由大量核心組成的大規模並行計算架構,專為同時處理多重任務而設計的芯片。正是由於其具備良好的矩陣計算能力和並行計算優勢,最早被用於AI計算,並在雲端獲得大量應用。GPU中超過80%部分為運算單元(ALU),而CPU僅有20%,因此GPU更擅長於大規模並行運算。以英偉達的GPUTITANX為例,該產品在深度學習中所需訓練時間只有CPU的1/10不到。但GPU用於雲端訓練也有短板,GPU需要同CPU進行異構,通過CPU調用才能工作,而且本身功耗非常高。同時,GPU在推理方面需要對單項輸入進行處理時,並行計算的優勢未必能夠得到很好的發揮,會出現較多的資源浪費。

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

FPGA芯片算力強、靈活度高,但技術難度大國內差距較為明顯

FPGA(Field-ProgrammableGateArray)即現場可編程門陣列,該芯片集成了大量的基本門電路以及存儲器,其靈活性介於CPU、GPU等通用處理器和專用集成電路ASIC之間,在硬件固定之前,允許使用者靈活使用軟件進行編程。FPGA在出廠時是“萬能芯片”,用戶可根據自身需求,用硬件描述語言對FPGA的硬件電路進行設計;每完成一次燒錄,FPGA內部的硬件電路就有了確定的連接方式,具有了一定的功能;輸入的數據只需要依次經過各個門電路,就可以得到輸出結果。

FPGA應用於AI有以下優勢:

(1)算力強勁。由於FPGA可以同時進行數據並行和任務並行計算,在處理特定應用時效果更加明顯,對於某一個特定的運算,FPGA可以通過編輯重組電路,生成專用電路,大幅壓縮計算週期。從賽靈思推出的FPGA產品看,其吞吐量和時延指標都好於CPU和GPU產品。

(2)功耗優勢明顯。FPGA能耗比是CPU的10倍以上、GPU的3倍。由於在FPGA中沒有取指令與指令譯碼操作,沒有這部分功耗;而在複雜指令集(X86)的CPU中僅僅譯碼就佔整個芯片能耗的約50%,在GPU裡取指與譯碼也會消耗10%至20%的能耗。

(3)靈活性好。使用通用處理器或ASIC難以實現的下層硬件控制操作技術,利用FPGA可以很方便的實現,從而為算法的功能實現和優化留出了更大空間。

(4)成本相對ASIC具備一定優勢。FPGA一次性成本(光刻掩模製作成本)遠低於ASIC,在芯片需求還未成規模、深度學習算法暫未穩定需要不斷迭代改進的情況下,利用具備可重構特性的FPGA芯片來實現半定製的人工智能芯片是最佳選擇。

正因為存在上述優勢,FPGA被廣泛用於AI雲端和終端的推理。國外包括亞馬遜、微軟都推出了基於FPGA的雲計算服務,而國內包括騰訊雲、阿里雲均在2017年推出了基於FPGA的服務,百度大腦也使用了FPGA芯片。

從市場格局上看,全球FPGA長期被Xilinx(賽靈思)、Intel(英特爾)、Lattice(萊迪思)、Microsemi(美高森美)四大巨頭壟斷。其中,賽靈思和英特爾合計佔到市場的90%左右,賽靈思的市場份額超過50%,國內廠商剛剛起步,差距較大。

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

專用芯片(ASIC)深度學習算法加速應用增多,可提供更高能效表現和計算效率

ASIC(ApplicationSpecificIntegratedCircuits),即專用芯片,是一種為特定目的、面向特定用戶需求設計的定製芯片,具備性能更強、體積小、功耗低、可靠性更高等優點。在大規模量產的情況下,還具備成本低的特點。

ASIC與GPU、FPGA不同,GPU、FPGA除了是一種技術路線之外,還是實實在在的確定產品,而ASIC只是一種技術路線或者方案,其呈現出的最終形態與功能也是多種多樣的。近年來,越來越多的公司開始採用ASIC芯片進行深度學習算法加速,其中表現最為突出的ASIC就是Google的TPU(張量處理芯片)。

TPU是谷歌為提升AI計算能力同時大幅降低功耗而專門設計的芯片。該芯片正式發佈於2016年5月。TPU之所以稱為AI專用芯片,是因為它是專門針對TensorFlow等機器學習平臺而打造,該芯片可以在相同時間內處理更復雜、更強大的機器學習模型。谷歌通過數據中心測試顯示,TPU平均比當時的GPU或CPU快15-30倍,性能功耗比(TFOPS/Watt)高出約30-80倍。

但是,ASIC一旦製造完成以後就不能修改了,且研發週期較長、商業應用風險較大,目前只有大企業或背靠大企業的團隊願意投入到它的完整開發中。國外主要是谷歌在主導,國內企業寒武紀開發的Cambricon系列處理器也廣泛受到關注。其中,華為海思的麒麟980處理器所搭載的NPU就是寒武紀的處理器IP。

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

1.3、短期內GPU仍將是AI芯片主導,長期看三大技術路線將呈現並行態勢

短期內GPU仍將主導AI芯片市場,FPGA的使用將更為廣泛

GPU短期將延續AI芯片的領導地位。GPU作為市場上AI計算最成熟、應用最廣泛的通用型芯片,應用潛力較大。憑藉其強大的計算能力、較高的通用性,GPU將繼續佔領AI芯片的主要市場份額。

當前,兩大GPU廠商都還在不斷升級架構並推出新品,深度學習性能提升明顯,未來應用的場景將更為豐富。英偉達憑藉著其在矩陣運算上的優勢,率先推出了專為深度學習優化的PascalGPU,而且針對GPU在深度學習上的短板,2018年推出了Volta架構,正在完成加速-運算-AI構建的閉環;AMD針對深度學習,2018年推出RadeonInstinct系列,未來將應用於數據中心、超算等AI基礎設施上。我們預計,在效率和場景應用要求大幅提升之前,作為數據中心和大型計算力支撐的主力軍,GPU仍具有很大的優勢。

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

FPGA是短期內AI芯片市場上的重要增長點,FPGA的最大優勢在於可編程帶來的配置靈活性,在當前技術與運用都在快速更迭的時期,FPGA具有明顯的實用性。企業通過FPGA可以有效降低研發調試成本,提高市場響應能力,推出差異化產品。在專業芯片發展得足夠完善之前,FPGA是最好的過渡產品,正因為如此,科技巨頭紛紛佈局雲計算+FPGA的平臺。隨著FPGA的開發者生態逐漸豐富,適用的編程語言增加,FPGA運用會更加廣泛。因此短期內,FPGA作為兼顧效率和靈活性的硬件選擇仍將是熱點所在。

長期來看GPU、FPGA以及ASIC三大類技術路線將並存

GPU主要方向是高級複雜算法和通用型人工智能平臺。(1)高端複雜算法實現方向。由於GPU本身就具備高性能計算優勢,同時對於指令的邏輯控制上可以做的更復雜,在面向複雜AI計算的應用方面具有較大優勢。(2)通用型的人工智能平臺方向。GPU由於通用性強,性能較高,可以應用於大型人工智能平臺夠高效地完成不同種類的調用需求。

FPGA未來在垂直行業有著較大的空間。由於在靈活性方面的優勢,FPGA對於部分市場變化迅速的行業最為實用。同時,FPGA的高端器件中也可以逐漸增加DSP、ARM核等高級模塊,以實現較為複雜的算法。隨著FPGA應用生態的逐步成熟,FPGA的優勢也會逐漸為更多用戶所認可,並得以廣泛應用。

ASIC長遠來看非常適用於人工智能,尤其是應對未來爆發的面向應用場景的定製化芯片需求。ASIC的潛力體現在,AI算法廠商有望通過算法嵌入切入該領域,以進入如安防、智能駕駛等場景。由於其具備高性能低消耗的特點,可以基於多個人工智能算法進行定製,以應對不同的場景,未來在訓練和推理市場上都有較大空間。

1.4、國內外AI芯片市場需求將保持較快增長勢頭,雲端、邊緣均具備潛力

近年來,伴隨著全球AI產業的快速增長,AI芯片需求大幅上升。按照Gartner最新數據,2018年全球AI芯片市場規模達到42.7億美元。未來幾年,全球各大芯片企業、互聯網巨頭、初創企業都將在該市場上進行角逐,預計到2023年全球市場規模將達到323億美元。未來五年(2019-2023年)平均增速約為50%,其中數據中心、個人終端、物聯網芯片均是增長的重點。

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

國內人工智能芯片行業發展仍處在起步階段。長期以來,我國在CPU、GPU和DSP設計上一直處於追趕狀態,絕大多數芯片依靠國外的IP核進行設計,自主創新能力不足。但我們也看到,國內人工智能產業的快速發展,也為國內芯片產業實現換道超車創造了機會。由於國內外在芯片生態上並未形成壟斷,國內芯片設計廠商尤其是專用芯片設計廠商,同國外競爭對手還處在同一起跑線上。

目前國內人工智能芯片市場呈現出百花齊放的態勢。AI芯片的應用領域廣泛分佈在金融證券、商品推薦、安防、消費機器人、智能駕駛、智能家居等眾多領域,催生了大量的人工智能創業企業,如地平線、深鑑科技、寒武紀、雲知聲、雲天勵飛等。我們認為,未來隨著國內人工智能市場的快速發展,生態建設的完善,國內AI芯片企業將有著更大的發展空間,未來5年的市場規模增速將超過全球平均水平。

二、AI芯片主要應用場景

2.1、數據中心(雲端)

數據中心是AI訓練芯片應用的最主要場景,主要涉及芯片是GPU和專用芯片(ASIC)。如前所述,GPU在雲端訓練過程中得到廣泛應用。目前,全球主流的硬件平臺都在使用英偉達的GPU進行加速,AMD也在積極參與。亞馬遜網絡服務AWSEC2、GoogleCloudEngine(GCE)、IBMSoftlayer、Hetzner、Paperspace、LeaderGPU、阿里雲、平安雲等計算平臺都使用了英偉達的GPU產品提供深度學習算法訓練服務。

在雲端推理市場上,由於芯片更加貼近應用,市場更多關注的是響應時間,需求也更加的細分。除了主流的CPU+GPU異構之外,還可通過CPU+FPGA/ASIC進行異構。目前,英偉達在該市場依然保持著領軍位置,但是FPGA的低延遲、低功耗、可編程性優勢(適用於傳感器數據預處理工作以及小型開發試錯升級迭代階段)和ASIC的特定優化和效能優勢(適用於在確定性執行模型)也正在凸顯,賽靈思、谷歌、WaveComputing、Groq、寒武紀、比特大陸等企業市場空間也在擴大。

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

2.2、自動駕駛

自動駕駛汽車裝備了大量的傳感器、攝像頭、雷達、激光雷達等車輛自主運行需要的部件,每秒都會產生大量的數據,對芯片算力有很高的要求,但受限於時延及可靠性,有關車輛控制的計算不能再依託雲端進行,高算力、快速響應的車輛端人工智能推理芯片必不可少。

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

目前,自動駕駛所使用的芯片主要基於GPU、FPGA和ASIC三條技術路線。但由於自動駕駛算法仍在快速更迭和進化,因此大多自動駕駛芯片使用GPU+FPGA的解決方案。未來算法穩定後,ASIC將成為主流。按照SAEInternational的自動駕駛等級標準,目前已商用的自動駕駛芯片基本處於高級駕駛輔助系統(ADAS)階段,可實現L1-L2等級的輔助駕駛和半自動駕駛(部分宣稱可實現L3的功能);而面向L4-L5超高度自動駕駛及全自動駕駛的AI芯片離規模化商用仍有距離。

根據豐田公司的統計數據,實現L5級完全自動駕駛,至少需要12TOPS的推理算力,按照NvidiaPX2自動駕駛平臺測算,差不多需要15塊PX2車載計算機,才能滿足完全自動駕駛的需求。AI芯片用於自動駕駛之後,對傳統的汽車電子市場衝擊較大,傳統的汽車電子巨頭(恩智浦、英飛凌、意法半導體、瑞薩)雖然在自動駕駛芯片市場有所斬獲,但風頭遠不及英特爾、英偉達、高通甚至是特斯拉。國內初創企業如地平線、眼擎科技、寒武紀也都在積極參與。在自動駕駛芯片領域進展最快以及競爭力最強的是英特爾和英偉達,英特爾強在能耗,英偉達則在算力和算法平臺方面優勢明顯。

英特爾進入自動駕駛芯片市場雖然較晚,但通過一系列大手筆收購確立了其在自動駕駛市場上的龍頭地位。2016年,公司出資167億美元收購了FPGA龍頭Altera;2017年3月以153億美元天價收購以色列ADAS公司Mobileye,該公司憑藉著EyeQ系列芯片佔據了全球ADAS70%左右的市場,為英特爾切入自動駕駛市場創造了條件。收購完成之後,英特爾形成了完整的自動駕駛雲到端的算力方案——英特爾凌動/至強+MobileyeEyeQ+AlteraFPGA。英特爾收購Mobileye之後,後者也直接推出了EyeQ5,支持L4-L5自動駕駛,預計在2020年量產。

英偉達在汽車AI芯片的競爭中不落下風。英偉達在2015年推出了世界首款車載超級計算機DrivePX,緊接著2016年推出DrivePX2,2018年推出新一代超級計算機DriveXavier,同年,基於雙DriveXavier芯片針對自動駕駛出租車業務的DrivePXPegasu計算平臺面世。2019CES上,英偉達推出了全球首款商用L2+自動駕駛系統NVIDIADRIVEAutoPilot。DRIVEAutoPilot的核心是Xavier系統級芯片。該芯片處理器算力高達每秒30萬億次,已經投產。

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

2.3、安防

安防市場是全球及國內AI最為確定以及最大的市場,尤其是AI中的圖像識別和視頻處理技術正在全面影響安防產業。其中,在安防產品中,攝像頭、交換機、IPC(網絡攝像機)、硬盤刻錄機、各類服務器等設備都需要芯片,這些芯片也決定了整個安防系統的整體功能、技術指標、能耗以及成本。在安防芯片中,最為關注的還是四類與監控相關的芯片(ISP芯片、DVRSoC芯片、IPCSoC芯片、NVRSoC芯片)。

ISP芯片(ImageSignalProcessing,圖像信號處理)主要負責對前端攝像頭所採集的原始圖像信號進行處理;DVR(DigitalVideoRecorder,數字硬盤錄像機)SoC芯片主要用於模擬音視頻的數字化、編碼壓縮與存儲;IPC(IPCamera,IP攝像機)SoC芯片通常集成了嵌入式處理器(CPU)、圖像信號處理(ISP)模塊、視音頻編碼模塊、網絡接口模塊等,具備入侵探測、人數統計、車輛逆行、丟包檢測等一些簡單的視頻分析功能;NVR(NetworkVideoRecorder,網絡硬盤錄像機)SoC芯片主要用於視頻數據的分析與存儲,功能相對單一,但由於多與IPC聯合使用,市場增長也較快。

通常情況下,安防視頻監控模擬攝像機的核心部件包括一顆圖像傳感器和一顆ISP芯片,安防視頻監控網絡攝像機的核心部件包括一顆圖像傳感器和一顆IPCSoC芯片。單從國內來看,未來國內視頻監控行業增速仍將保持12%-15%左右的水平增長,其中網絡監控設備增長更為迅速,相關芯片產品需求十分旺盛。

安防AI芯片市場上,除了傳統芯片以及安防廠商,還有大量的創業企業在湧入。國外芯片廠商主要有英偉達、英特爾、安霸、TI、索尼、特威、三星、谷歌等;國內廠商主要有海思(華為)、國科微、中星微、北京君正、富瀚微、景嘉微、寒武紀、深鑑科技、雲天勵飛、中科曙光等。英偉達、英特爾等企業憑藉著通用處理器以及物聯網解決方案的優勢,長期與安防巨頭如海康、大華、博世等保持緊密聯繫;國內寒武紀、地平線、雲天勵飛等企業,都有AI芯片產品面世,海思本身就有安防攝像機SoC芯片,在新加入AI模塊之後,競爭力進一步提升。

從安防行業發展的趨勢來看,隨著5G和物聯網的快速落地,“雲邊結合”將是行業最大的趨勢,雲端芯片國內企業預計很難有所突破,但是邊緣側尤其是視頻處理相關AI芯片還是有較大潛力,國產化替代將加速。但也看到,AI芯片離在安防領域實現大規模快速落地仍有距離。除了功耗和算力約束外,工程化難度大也是困擾行業的重要因素,尤其是在安防這種產業鏈長而高度碎片化的產業,新技術落地需要長時間的積累與打磨,以及人力資源的不斷投入。

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

2.4、智能家居

智能家居近年來也成為人工智能重要的落地場景。從技術應用上講,人類90%的信息輸出是通過語音,80%的是通過視覺,智能家居領域應用最多的就是智能語音交互技術。近年來,正是看到語音交互技術與智能家居深度融合的潛力,谷歌、蘋果、微軟均將其作為進入智能家居領域的重要切入口,發佈了多款軟硬件平臺,如亞馬遜推出的智能音箱設備。國內智能語音龍頭企業科大訊飛較早就切入了該領域,聯合地產商推出了硬件平臺魔飛(MORFEI)平臺,電視、咖啡機、電燈、空調、熱水器等產品都能通過融入相關平臺實現智能化。

當前,無論是智能音箱還是其他智能家居設備,智能功能都是在雲端來實現,但云端存在著語音交互時延的問題,對網絡的需求限制了設備的使用空間,而且由此還帶來了數據與隱私危機。為了讓設備使用場景不受侷限,用戶體驗更好,端側智能已成為一種趨勢,語音AI芯片也隨之切入端側市場。國內主要語音技術公司憑藉自身在語音識別、自然語言處理、語音交互設計等技術上的積累,開始轉型做AI語音芯片集成及提供語音交互解決方案,包括雲知聲、出門問問、思必馳以及Rokid。

市場上主流的AI語音芯片,一般都內置了為語音識別而優化的深度神經網絡加速方案,以實現語音離線識別。隨著算法的精進,部分企業的語音識別能力得到了較快提升,尤其是在遠場識別、語音分析和語義理解等方面都取得了重要進展。雲知聲在2018年5月,推出語音AI芯片雨燕,並在研發多模態芯片,以適應物聯網場景,目前公司芯片產品已經廣泛用於智能家電如空調之中;出門問問也在2018年推出了AI語音芯片模組“問芯”MobvoiA1;Rokid也發在2018年發佈了AI語音芯片KAMINO18;思必馳利用其聲紋識別等技術優勢,2019年初推出基於雙DSP架構的語音處理專用芯片TH1520,具有完整語音交互功能,能實現語音處理、語音識別、語音播報等功能。

由於語音芯片市場過於細碎,需要企業根據場景和商業模式需要設計出芯片產品,這對傳統的通用芯片企業的商業模式是一種顛覆,以致於在2018年以前都很少有芯片巨頭進入該領域,這也給了國內語音芯片企業較大的施展空間。而對算法公司來說,通過進入芯片市場,進而通過解決方案直接面向客戶和應用場景,通過實戰數據來訓練和優化算法。

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

2.5、機器人

機器人是人工智能行業最早的落地形態,也是現在和將來重要的應用方向。機器人主要包括兩類——製造環境下的工業機器人和非製造環境下的服務機器人。工業機器人主要是面向工業領域的多關節機械手或多自由度機器人。服務機器人則是除工業機器人之外的、用於非製造業並服務於人類的各種先進機器人。

隨著雲物移大智等信息及智能化技術的發展,機器人在某些領域的工作效率高於人類,並在工業和服務場景中得到了大量應用。據國際機器人聯盟統計,2017年,全球工業機器人產量達到38.1萬臺,同比增長30%,預計2018-2021年全球工業機器人產量將保持10%以上增速增長,2021年產量預計將達到63.0萬臺。中國是全球最大的工業機器人生產國,2017年產量達到13.79萬臺,同比大幅增長60%。服務機器人主要用於物流、防務、公共服務、醫療等領域,雖然規模不大,但是增長迅速。2017年全球產量為10.95萬臺,同比大幅增長85%。預計2018年全球專業服務機器人產量將達到16.53萬臺,同比增長32%,2019-2021年平均增速將保持在21%左右。

機器人尤其是國內產業規模的快速擴大,將大幅帶動國內機器人相關智能芯片產業的發展。機器人由控制、傳感、驅動和電源四大裝置構成,其中控制裝置是機器人的“大腦”,核心是AI芯片。機器人芯片需要具備強大的數據計算、自主判斷思考和執行能力,國外廠商如高通、英特爾、英偉達都在積極部署該領域,國內企業目前處於追趕狀態,相關企業包括瑞芯微、珠海全志、炬力等。

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

三、國內外AI芯片廠商概覽

3.1、整體排名

近年來,各類勢力均在發力AI芯片,參與者包括傳統芯片設計、IT廠商、技術公司、互聯網以及初創企業等,產品覆蓋了CPU、GPU、FPGA、ASIC等。在市場調研機構CompassIntelligence2018年發佈的AIChipsetIndexTOP24榜單中,前十依然是歐美韓日企業,國內芯片企業如華為海思、聯發科、Imagination(2017年被中國資本收購)、寒武紀、地平線機器人等企業進入該榜單,其中華為海思排12位,寒武紀排23位,地平線機器人排24位。

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

3.2、芯片企業

芯片設計企業依然是當前AI芯片市場的主要力量,包括英偉達、英特爾、AMD、高通、三星、恩智浦、博通、華為海思、聯發科、Marvell(美滿)、賽靈思等,另外,還包括不直接參與芯片設計,只做芯片IP授權的ARM公司。其中,英偉達、英特爾競爭力最為強勁。

英偉達:AI芯片市場的領導者,計算加速平臺廣泛用於數據中心、自動駕駛等場景

英偉達創立於1993年,最初的主業為顯卡和主板芯片組。其主板芯片組主要客戶以前是AMD,但是在AMD收購ATI推出自研芯片組之後,英偉達在該領域的優勢就蕩然無存。於是,公司全面轉向到GPU技術研發,同時進入人工智能領域。2012年,公司神經網絡技術在其GPU產品的支持下取得重大進展,並在計算機視覺、語音識別、自然語言處理等方面得到廣泛應用。

2016年,全球人工智能發展加速,英偉達迅速推出了第一個專為深度學習優化的PascalGPU。2017年,英偉達又推出了性能相比Pascal提升5倍的新GPU架構Volta,同時推出神經網絡推理加速器TensorRT3。至此,英偉達完成了算力、AI構建平臺的部署,也理所當然成為這一波人工智能熱潮的最大受益者和領導者。公司的戰略方向包括人工智能和自動駕駛。

人工智能方面。英偉達面向人工智能的產品有兩個,Tesla系列GPU芯片以及DGX訓練服務器。Tesla系列是專門針對AI深度學習算法加速設計GPU芯片,DGX則主要是面向AI研究開發人員設計的工作站或者超算系統。2018年,公司包含這兩款產品的數據中心業務收入大幅增長52%,其中TeslaV100的強勁銷售是其收入的主要來源。

自動駕駛方面。英偉達針對自動駕駛等場景,推出了Tegra處理器,並提供了自動駕駛相關的工具包。2018年,基於Tegra處理器,英偉達推出了NVIDIADRIVEAutoPilotLevel2+,並贏得了豐田、戴姆勒等車企的自動駕駛訂單。同時,2018年,公司也正在積極推動Xavier自動駕駛芯片的量產。

值得關注的是,英偉達還正在通過投資和併購方式繼續加強在超算或者數據中心方面的業務能力。2019年3月,英偉達宣稱將斥資69億美元收購Mellanox。Mellanox是超算互聯技術的早期研發和參與者。通過與Mellanox的結合,英偉達將具備優化數據中心網絡負載能力的能力,其GPU加速解決方案在超算或者數據中心領域的競爭力也將得到顯著提升。

英特爾加速向數字公司轉型,通過併購+生態優勢發力人工智能

英特爾作為傳統的CPU設計製造企業,在傳統PC、服務器市場有著絕對的統治力。隨著互聯網時代的到來以及個人電腦市場的飽和,公司也在開始加快向數字公司轉型。尤其在人工智能興起之後,英特爾憑藉著技術和生態優勢,打造算力平臺,形成全棧式解決方案。

英特爾主要產品為CPU、FPGA以及相關的芯片模組。雖然CPU產品在訓練端的應用效率不及英偉達,但推理端優勢較為明顯。英特爾認為,未來AI工作週期中,推理的時長將是訓練時長的5倍甚至10倍,推理端的芯片需求也會放量。同時,即使是雲端訓練,GPU也需要同CPU進行異構。

目前,英特爾在人工智能芯片領域主要通過三條路徑:1)通過併購快速積累人工智能芯片相關的技術和人才,並迅速完成整合。英特爾在收購了Altera後,還先後收購了Nervana、Movidius與Mobileye等初創企業。在完成上述一系列併購之後,英特爾設立了AI事業群,整合了Xeon、XeonPhi、Nervana、Altera、Movidius等業務和產品,同時將原有的自動駕駛業務板塊併入Mobileye。2)建立多元的產品線。目前,英特爾正建構滿足高性能、低功耗、低延遲等差異化芯片解決方案,除了Xeon外,包括可支持雲端服務Azure的MovidiusVPU與FPGA。3)通過計算平臺等產品,提供強大的整合能力,優化AI計算系統的負載,提供整體解決方案。

在英特爾收購的這些企業中,除了前面已經提到的Altera、Mobileye之外,Nervana也非常值得關注。2016年8月,英特爾斥資超過3.5億美元收購這家員工人數不超過50人的創業公司,但是經過不到三年的成長,這家公司已經成為英特爾AI事業部的主體。依託Nervana,英特爾成功在2017年10月推出了專門針對機器學習的神經網絡系列芯片,目前該芯片已經升級至第二代,預計2019年下半年將正式量產上市,該芯片在雲端上預計能和英偉達的GPU產品一較高下。

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

3.3、IT及互聯網企業

AI興起之後,互聯網及IT企業憑藉著在各大應用場景上技術和生態積累,也在積極拓展AI相關市場,其中AI芯片是部署重點之一。相較而言,互聯網企業憑藉著數據和場景先天優勢,在AI算法和芯片領域優勢更為明顯,如美國谷歌、國內的BAT。IT企業如IBM,在人工智能領域較早開始研究,2018年年中曾經推出專門針對深度學習算法的原型芯片。

谷歌:TPU芯片已經實現從雲到端,物聯網TPUEdge是當前佈局重點

谷歌可謂是AI芯片行業的一匹黑馬,但是競爭力強勁。谷歌擁有大規模的數據中心,起初同其他廠商的數據中心一樣,都採用CPU+GPU等異構架構進行計算加速,用來完成圖像識別、語音搜索等計算服務。但是,隨著業務量的快速增長,傳統的異構模式也很難支撐龐大的算力需求,需要探索新的高效計算架構。同時,谷歌也需要通過研發芯片來拓展AI平臺TensorFlow的生態。因此,2016年,Google正式發佈了TPU芯片。

從谷歌TPU的本質來看,它是一款ASIC(定製芯片),針對TensorFlow進行了特殊優化,因此該產品在其他平臺上無法使用。第一代CloudTPU僅用於自家雲端機房,且已對多種Google官方雲端服務帶來加速效果,例如Google街景圖服務的文字處理、Google相簿的照片分析、甚至Google搜尋引擎服務等。CloudTPU也在快速改版,2017年推出第二代,2018年推出第三代芯片TPU3.0。同時,谷歌對TPU的態度也更為開放,之前主要是自用,目前也在對用戶開放租賃業務,但沒有提供給系統商。

除了雲端,谷歌針對邊緣端推理需求快速增長的趨勢,也在開發邊緣TPU芯片。2017年11月,Google推出輕量版的TensorFlowLite(某種程度取代此前的TensorFlowMobile),使得能耗有限的移動設備也能支持TensorFlow,2018年推出的EdgeTPU芯片即是以執行TensorFlowLite為主,而非TensorFlow。EdgeTPU性能雖然遠不如TPU,但功耗及體積大幅縮小,適合物聯網設備採用。EdgeTPU可以自己運行計算,不需要與多臺強大計算機相連,可在傳感器或網關設備中與標準芯片或微控制器共同處理AI工作。

按照谷歌的規劃,EdgeTPU將提供給系統商,開放程度將進一步提升。如果EdgeTPU推廣順利,支持的系統夥伴將進一步增多,谷歌將盡快推出下一代EdgeTPU產品。即使推廣不順利,Google也可能自行推出Edge網關、Edge設備等產品。

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

阿里巴巴:推出自研神經網絡處理芯片,同時加速對AI企業投資佈局

阿里巴巴作為國內AI領域的領軍企業,在底層算力、算法技術以及應用平臺方面都有較強積累。同Google類似原因,阿里巴巴也在近年來開始開發AI芯片,同時加大對相關領域的投資佈局。

2017年,阿里巴巴成立阿里達摩院,研究領域之一就是AI芯片技術。2018年4月,阿里達摩院對外宣佈正研發一款Ali-NPU神經網絡芯片,預計將在2019年下半年問世。這款芯片將主要應用於圖像視頻分析、機器學習等AI推理計算。

阿里巴巴在自研AI芯片之前,主要在通過投資的方式佈局AI芯片領域。目前,寒武紀、深鑑科技、杭州中天微等都有阿里巴巴的入股,其中2016年1月份還成為了AI芯片設計企業杭州中天微的第一大股東。

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

百度:通過自研、合作以及投資等多種方式部署AI芯片

百度作為搜索企業,其對AI芯片的需求更為明確。早在2011年,百度就在FPGA和GPU進行了大規模部署,也開始在FPGA的基礎上研發AI加速器來滿足深度學習運算的需要。此後,百度就不斷通過合作、投資和自研的方式來推進該業務。

1)加強同芯片設計及IP企業合作。2017年3月,百度發佈了DuerOS智慧芯片,並與紫光展銳、ARM、上海漢楓達成戰略合作。這款芯片搭載了對話式人工智能操作系統,可以賦予設備可對話的能力,能廣泛用於智能玩具、藍牙音箱、智能家居等多種設備。2017年8月,百度又與賽思靈(Xilinx)發佈了XPU,這是一款256核、基於FPGA的雲計算加速芯片。同在2017年,百度同華為達成合作,推動終端AI芯片的落地。

2)參與AI芯片企業投資。2018年2月5日,美國初創公司Lightelligence宣佈獲得了1000萬美元種子輪融資,由百度風投和美國半導體高管財團領投。Lightelligence主要利用基於光學的新技術,來加速人工智能的工作負載,通過光子電路的新興技術來加速信息處理。

3)自研芯片也正在加速部署。2018年7月,百度正式發佈了自研的AI芯片“崑崙”,這是當時國內第一款雲端全功能AI芯片,其中包含訓練芯片崑崙818-300,推理芯片崑崙818-100。崑崙AI芯片是基於百度CPU、GPU、FPGA的AI加速器研發,能夠在100W左右的功耗下,提供高達260萬億次/秒的運算速度,算力處於業界領先水平。

人工智能研究 :AI芯片行業現狀、趨勢及廠商情況分析

3.4、創業企業

寒武紀:公司同時發力終端和雲端芯片,技術綜合實力較強

寒武紀發源於中科院,是目前全球領先的智能芯片公司,由陳天石、陳雲霽兄弟聯合創辦,團隊成員主要人員構成也來自於中科院,其中還有部分參與龍芯項目的成員。2018年6月公司,公司獲得數億美元投資,此輪融資之後,寒武紀科技估值從上年的10億美金大幅上升至25億美元。公司是目前國內為數不多的同時具備雲端和終端AI芯片設計能力的企業。

公司最早發力的是終端芯片,主要為1A系列,包括1A、1H8和1H16,公司通過IP授權的模式賦能終端或者芯片設計企業,目前主要合作伙伴包括華為,其中麒麟970就採用其1A處理器。另外,公司還推出了面向低功耗場景視覺應用的寒武紀1H8,高性能且擁有廣泛通用性的寒武紀1H16,以及用於終端人工智能產品的寒武紀1M。2018年9月,華為發佈的麒麟980依然集成了優化版的寒武紀1H新一代智能處理器。

公司雲端芯片也取得較大突破。雲端芯片一直是英特爾、英偉達等公司的領地,國內企業很難進入。2018年5月,寒武紀推出算力達到128Tops的MLU100雲端智能芯片,可用於訓練和推理。MLU100相比傳統的GPU和CPU芯片,MLU芯片擁有顯著的性能功耗比和性能價格比優勢,適用範圍覆蓋了圖像識別、安防監控、智能駕駛等多個重點應用領域。

綜合來看,公司在AI芯片方面競爭力較強。公司擁有自己的處理器架構和指令集,而且通過硬件神經元虛擬化、開發通用指令集、運用稀疏化處理器架構解決了ASIC用於深度學習時存在的三大問題。這三大問題是:雲端算力的挑戰、能效瓶頸、手機端和雲端超大規模計算場景應用問題。

地平線機器人:公司芯片和計算平臺在嵌入式及智能駕駛領域具備優勢

地平線成立於2015年,主要從事邊緣人工智能芯片和計算平臺業務,場景聚焦於智能駕駛和AIoT邊緣計算。2018年起,公司逐漸實現產品化落地。2019年2月,公司官方宣佈已獲得6億美元B輪融資,SK中國、SKHynix以及數家中國一線汽車集團(與旗下基金)聯合領投。B輪融資後,地平線估值達30億美元。

2017年12月,地平線發佈中國首款全球領先的嵌入式人工智能視覺芯片征程(Journey)系列和旭日(Sunrise)系列。旭日1.0處理器面向智能攝像頭等應用場景,具備在前端實現大規模人臉檢測跟蹤、視頻結構化的處理能力,可廣泛用於智慧城市、智慧零售等場景。征程1.0處理器面向智能駕駛,具備同時對行人、機動車、非機動車、車道線、交通標誌牌、紅綠燈等多類目標進行精準的實時檢測與識別的處理能力,同時滿足車載嚴苛的環境要求以及不同環境下的視覺感知需求,可用於高性能L2級別的高級駕駛輔助系統ADAS。

2018年2月,地平線自主研發的高清智能人臉識別網絡攝像機,搭載地平線旭日人工智能芯片,提供基於深度學習算法的人臉抓拍、特徵抽取、人臉特徵值比對等功能。可以在攝像機端實現人臉庫最大規模為5萬的高性能人臉識別功能,適用於智慧城市、智慧零售等多種行業。

2018年4月,公司發佈地平線Matrix1.0自動駕駛計算平臺。目前已經更新到性能更強的升級版本,地平線Matrix自動駕駛計算平臺結合深度學習感知技術,具備強大的感知計算能力,能夠為L3和L4級別自動駕駛提供高性能的感知系統。地平線Matrix自動駕駛計算平臺已向世界頂級Robotaxi廠商大規模供貨,成功開創了中國自動駕駛芯片產品出海和商業化的先河。

四、投資建議

從當前AI芯片競爭格局和市場前景看,我們認為,國內企業在邊緣端的機會多於雲端。一方面,在邊緣場景,國內在語音、視覺等領域已經形成了一批芯片設計企業隊伍,相關芯片產品已經在安防、數據中心推理、智能家居、服務機器人、智能汽車等領域找到落地場景,未來隨著5G、物聯網等應用的興起,相關企業的市場空間將進一步擴大。另一方面,在雲端,國內企業也正在加速追趕,未來也有望取得突破。尤其是寒武紀,作為雲端芯片重要的技術廠商,有望通過授權等方式為下游芯片設計、服務器企業賦能。

AI芯片上市公司標的較為稀缺,覆蓋標的中,重點推薦中科曙光、科大訊飛、中科創達以及四維圖新。中科曙光作為“芯-服務器-雲”一體化企業,將直接成為國內AI芯片發展的受益者。除了AMD授權的海光X86處理器之外,公司也正在和同為中科體系的寒武紀合作,預計將在AI服務器、智能芯片等方面獲得突破;科大訊飛作為語音交互領域的龍頭,不但持有寒武紀的股份,而且還在同外部合作研發AI芯片Castor(北河二),目前該芯片已經完成測試工作,未來可用於智能家居等語音交互場景;中科創達在嵌入式人工智能領域有著較強的積累,主要為手機及安防終端提供軟件解決方案,近年來開始向底層芯片發力,2017年11月跟投了國內神經網絡處理器廠商——耐能;四維圖新作為自動駕駛領域的重點標的,其收購的傑發科技,車規級MCU已經實現量產,為後續進軍自動駕駛,實施“汽車大腦”戰略打下了良好的基礎。


分享到:


相關文章: