特斯拉揮錘之後,英偉達:新芯片名為“雷神之父”

特斯拉“重錘砸門”之後,英偉達發佈了一款名為“雷神之父(Orin)”的芯片。

不談其中到底有什麼“倫理梗”,單就產品而言,黃教主在GTC China 2019現場給出了幾項技術參數:

  • 170億個晶體管

  • 8個核心64位CPU

  • 200 TOPS深度學習算力

  • 兼容L2-L5級自動駕駛開發

  • 達到ISO 26262 ASIL-D等系統安全標準

  • 2022年SOP

解讀一下——

相比上一代系統級芯片Xavier,Orin的算力提升了將近7倍,且向下兼容Xavier

Orin支持自家新一代GPU架構和Arm Hercules CPU內核同步運行,提升容錯性

提供針對OEM的低成本版本,滿足用一個單路攝像機來做L2級自動駕駛,同時能利用整個自動駕駛產品線中的軟件棧

“皮衣黃”高度濃縮出了三個關鍵詞:“可擴展”、“可編程”、“軟件定義”。

可是,相比往年“幾分鐘一個新品”的核彈級發佈速度,這樣一小塊SoC芯片根本堵不住在場6100多人的嘴:“搞芯片的英偉達,怎麼就展示了一個硬件產品?”

這讓臺上與去年打扮一模一樣的黃仁勳,顯得硬核,卻不夠性感。

特斯拉挥锤之后,英伟达:新芯片名为“雷神之父”

更何況,在公司剛剛發佈的Q3季度財報中,汽車業務拿出的數據並不好看。雖然在集中採訪時媒體朋友們對此普遍嘴下留情,但仍舊無法掩蓋汽車行業整體疲軟帶來的業績下滑:公開數據顯示,英偉達汽車業務在延續了前7個季度增長勢頭後,於2019年Q3中止,同比下滑6%。

要知道,三年來這家企業汽車對應業務的營業額同比增幅一度高達63%。而在車企因為收縮成本而放緩汽車電子與自動駕駛方面投入的當下,J.D Power Survey的一份報告顯示,截至2034年,此方面預算預計只佔整體汽車銷售份額的10%左右。

英偉達,這位汽車電子爆發增長紅利的最大獲益者,就要告別百年汽車產業了嗎?

算力=硬核?

從技術路線來看,英偉達始終堅稱自家GPU是深度學習的完美架構。

特斯拉挥锤之后,英伟达:新芯片名为“雷神之父”
特斯拉挥锤之后,英伟达:新芯片名为“雷神之父”

(“隨著摩爾定律的終結,GPU加速計算將成為未來的發展方向,這一點現在已得到公認。”

“出色的芯片只是起點。”)

話雖如此,但或許是困於芯片“上車”後的功耗問題,英偉達打算基於ARM架構許可開始從零打造自己的CPU架構,未來產品也將由供應商逐步迭代更替至自研。

畢竟在特斯拉FSD芯片剛剛問市時,英偉達搬出了AGX Pegasus雙芯片的320 TOPS拿來對飈。可更現實的問題是,相比功耗200W左右的FSD芯片,英偉達兩塊芯片的佈局功耗高達500W。有媒體測算稱,這就相當於一輛電動汽車每小時要多消耗小半度電。

這就很好地解答了我們的問題:對於自動駕駛芯片來說,強算力就等於超硬核嗎?

答案顯然是否定的。算力並不能作為衡量AI芯片性能的唯一指標。就實際使用而言,在多業務切換情況下,尤其是衡量節點端芯片和雲端芯片性能時,計算核的性能表現理論上應該被視作一項重要的標準。

此外,AI加速硬件也十分依賴存儲器帶寬。所以在相同算法及計算量的情況下,計算核對於帶寬的使用效率也決定著系統的整體性能。而據報道,英偉達自家的NV Link 2.0多芯片數據傳輸標準目前能夠提供的帶寬為100GB/s,特斯拉則擁有2TB帶寬的SRAM。

換句話說,320 TOPS算力的英偉達AGX Pegasus對於特斯拉可以說毫無價值。畢竟後者是在為降低全自動駕駛汽車的Robotaxi項目運營成本而奮鬥,馬斯克也直接喊話:“關鍵在於芯片中有多少TOPS能夠真正應用於自動駕駛相關的圖像處理和行為預測?”

相比特斯拉嚴絲合縫卡死各項指標,為自己量身定製的FSD芯片,英偉達在對抗中的話語權明顯就要減弱許多。某種程度上,特斯拉代表著絕大多數主機廠在市場中的真實需求。

畢竟汽車行業內存在太多針對固定功能的專用芯片,他們尺寸小、成本低、功耗低,這些特質幾乎正中車廠下懷。

而這在英偉達眼中,卻是“可編程性低”的代名詞。專用芯片無法處理先進高級自動駕駛所需要的複雜工作負擔,其中涵蓋了十個以上攝像頭、毫米波雷達、激光雷達等多種傳感器融合需要的多元化數據處理,並留出足夠安全冗餘,這就需要至少幾百TOPS的算力支撐。

“在通過神經網絡進行深度學習訓練這件事上,只存在兩個人工智能超級計算機。一個來自特斯拉,一個來自英偉達。”英偉達汽車事業部高級總監Danny Shapiro十分篤定。

按他所言,英偉達是唯一一家對所有類別都提交測試申請,且各項類別均排名第一。其全套軟件堆棧能夠支持所有主流AI框架。要知道,要想實現自動駕駛,除了軟硬件之外還需要很多處理前與處理後的工作配套。

特斯拉挥锤之后,英伟达:新芯片名为“雷神之父”

以“新面孔”Orin為例,其獨特的設計點在於多處理器的運用,包括GPU、ARM架構CPU、可編程處理器、編解碼器。由於Orin和Xavier均可通過開放的CUDA、TensorRT API及各類庫進行編程,因此開發者能夠在一次性投資後使用跨多代的產品。

顯然,在成本嚴格把控、量產即交付的主機廠對比下,英偉達目前的客戶群恐怕更多在於致力於高階自動駕駛的科技公司。後者在同一塊開發板上不斷完成軟件迭代,似乎才能將英偉達的價值最大化。

而努力接觸同樣一波客戶的,還有華為。就在4個月之前,徐直軍在“地表最強芯”的大屏幕下一口氣發佈了昇騰910和昇騰310兩款AI芯片,就連以此為基礎推出的MDC車載技術單元,都同時指向了英偉達在芯片行業中的壟斷地位。

根據當時的描述,昇騰910算力256 TOPS,昇騰310算力較弱,但兼顧功耗,更適合自動駕駛汽車。“昇騰910對標谷歌和英偉達的AI算力芯片,訓練AI模型。具體定價還未定,但肯定比英偉達和谷歌低。”徐直軍笑著說道。

生態:商業頭腦

事實上,徐直軍想要對標的不只是算力,而是直抵英偉達最高的護城河。

2020年Q1,MindSpore將正式開源,“像英偉達一樣建立自己的生態”。

這很好地解釋瞭如今黃仁勳為何只帶來一件硬件產品,卻依舊不慌不忙。在公司內部,軟件開發人員已經遠遠超過了硬件工程師的數量。而Danny Shapiro話裡話外也提到,英偉達Drive系統的意義在於為客戶提供預訓練模型,進而打開生態系統加入GPU雲。

到2019年這個節點上,賣出15億塊GPU的英偉達已經不必遮掩自己的野心。市面上在用的每塊GPU都兼容CUDA,這個平臺背後是豐富的庫、工具和應用程序。就在2018年,英偉達發佈了500多個SDK和庫,通過優化軟件棧提高GPU性能,讓深度學習訓練在三年內提高4倍,深度學習推理在一年內提高2倍。

特斯拉挥锤之后,英伟达:新芯片名为“雷神之父”

時至今日,英偉達再次決定向交通運輸行業開源NVIDIA DRIVE自動駕駛汽車開發深度神經網絡。

也就是說,藉助英偉達開源的預訓練AI模型和訓練代碼,自動駕駛汽車開發者只要願意加入這套生態系統,就能通過一套NVIDIA AI工具自由擴展和自定義模型,以此提高其自動駕駛系統的穩健性與能力。

這套產品運行在DRIVE AGX平臺上深度神經網絡核心,由數十個深度神經網絡組成的,它們可以處理冗餘和不同任務,以確保精確的感知、定位和路徑規劃,完成交通信號燈和交通標識檢測、目標檢測(車輛、行人、自行車)、路徑感知以及車載眼球追蹤和手勢識別等任務。

除了開源深度神經網絡之外,NVIDIA還發布了一套先進工具,讓開發者可以使用自己的數據集和目標特徵集自定義並增強NVIDIA的深度神經網絡。這套工具使用主動學習、聯邦學習和遷移學習來訓練深度神經網絡。

英偉達產品既往在圈內各家初創企業之間的風靡或許信服力不強,但如今互聯網巨頭滴滴出行的買賬,說明了一切。

在滴滴自動駕駛部門正式升級為獨立公司後,其找到的第一個重磅產業鏈合作伙伴就是英偉達。按照官方說法,滴滴將在數據中心使用NVIDIA®GPU訓練機器學習算法,並採用NVIDIA DRIVE™為其L4級自動駕駛汽車提供推理能力。

為了訓練NVIDIA DRIVE的多個深度神經網絡,滴滴將採用NVIDIA GPU數據中心服務器。在雲計算方面,滴滴還將構建領先的AI基礎架構,並推出計算型、渲染型和遊戲型vGPU雲服務器。目前,滴滴雲已與NVIDIA等行業合作伙伴攜手服務交通出行、AI、圖形渲染、電子遊戲及教育培訓等多個領域。

特斯拉挥锤之后,英伟达:新芯片名为“雷神之父”

早先不算好看的財務報表,似乎並未擊退業內人士的橄欖枝。

在計算機組件更新迭代週期異常短暫的半導體行業,任何競爭格局的重大變化都天然會帶來嚴重的下行風險。這讓半導體廠商的長期業績判斷變得異常複雜,過度依賴供應鏈其他業務來管理庫存、維持資本支出的特徵,使其在供應鏈中的位置會大概率導致需求出現短期的快速惡化。

這些資本層面的“壞習慣”重要,卻也沒有那麼重要。競爭性技術公司總是可以直接搶佔下一波芯片的市場份額。英偉達汽車部門中,信息娛樂處理器與Drive平臺相關項目在Q3季度中的表現格外突出,在整體下滑的同時,這部分業務收入每年增長30%,達到了2.09億美元。首席財務官科萊特·克雷斯(Colette Kress)反覆強調,公司必須要將這一領域視為長期增長動力。

資本數據層面的表現時刻印證著老黃的判斷。整個2019年,從年初GTC到年末GTC China,“CUDA生態”都是前後貫穿其演講的重要關鍵詞。

GPU發家的英偉達產品確實並非為人工智能而生,與專用芯片相比其在效率層面的缺陷暴露無遺。於是,英偉達選擇“將錯就錯”,針對特定AI芯片在不同軟件API以及系統框架轉移中出現的碎片化問題,“GPU+CUDA生態”的超強組合提供了“同一類硬件,同一種框架”來解決所有問題的可能。

對於英偉達GPU這個“人工智能基石”般的存在,其押注的競爭力早已不在芯片產品本身。也有從業者評價稱,公司早年研發的在GPU上做通用計算的CUDA生態,在經過數年艱苦經營後成為了人工智能開發者的首選。

相對其身後仍在玩命“拼性能”的廠商來說,CUDA生態已經形成了超維打擊,並且不可撼動地組建起英偉達GPU在人工智能領域的最高護城河。


分享到:


相關文章: