特斯拉又融資!馬斯克用自動駕駛畫5千億大餅,然時間表值得懷疑

據華爾街日報當地時間 5 月 2 日報道,特斯拉宣佈了新的融資計劃:增發至少 20 億美元的股票和可轉換債券組合。

這一混合融資計劃將是特斯拉現金枯竭的資產負債表新的資金源頭。特斯拉向美國證監會提交的文件顯示,公司已將新股的公開發行量從 270 萬股增至 310 萬股,每股發行價格 243 美元。

此次融資計劃之前,特斯拉正在經歷一段艱難的時期,尤其是其面向大眾市場的 Model 3 轎車的生產規模上,公司同時向歐洲和中國的客戶交付汽車也遭遇物流問題。另外,馬斯克過去一直強調特斯拉已經不需要融資了,但今年第一季淨虧損超 7 億美元的財報顯然又讓他改口了。

融資計劃宣佈之後,特斯拉管理層與高盛、花旗等機構舉行了投資者電話會議。在這個電話會議中,自動駕駛成為馬斯克穩住投資者的最大王牌。

據彭博社援引兩名知情人士透露,馬斯克在投資者電話會議中稱,自動駕駛對特斯拉來說是“革命性的”,是根本驅動力,也是特斯拉成為一家“市值 5000 億美元的公司”的關鍵。在電話會議中,馬斯克再次承諾了他此前關於特斯拉自動駕駛技術的時間表:最快明年年中,路上將會有 100 萬輛擁有全自動駕駛能力的特斯拉電動車,而且到那時,車主可以通過 Robotaxi 貢獻自己車輛進行盈利,每年可獲利三萬美元。

然而,馬斯克對特斯拉自動駕駛如此自信,特斯拉所謂功能完整的自動駕駛汽車能在多大程度上解放駕駛者?自動駕駛技術真的已經到了臨界的突破點嗎?特斯拉的自動駕駛技術和時間表真的能夠支撐馬斯克5000 億市值“大餅”嗎?

這些問題都值得深入探討,予以釐清。

特斯拉又融資!馬斯克用自動駕駛畫5千億大餅,然時間表值得懷疑

在軟件工程領域有一個被稱為“90-90 法則”的幽默格言,據傳第一個講這個笑話的人是貝爾實驗室的 Tom Cargill。它是這樣說的:“(開發軟件時)前 90% 的代碼要花費 90% 的開發時間,剩餘的 10% 的代碼要再耗上另 90% 的開發時間。

接下來,我們要基於這個角度來解讀一下特斯拉自動駕駛技術的集中體現——自動駕駛芯片這件事情。

在 4 月 22 日特斯拉舉辦的自動駕駛活動日中,他向世人展示了該公司在完全自動駕駛技術領域最新取得的令人矚目的進展。特斯拉還展示了一款新的神經網絡計算芯片 FSD,似乎已經可以與這一領域的領導者英偉達(Nvidia)競爭。

特斯拉也向人們解釋了 FSD 如何利用自己龐大的客戶及其車輛來收集數據,從而可以被用來幫助訓練其神經網絡。

馬斯克這次想要向人們傳達的一個重要信息是,特斯拉距離拿下完全自動駕駛汽車的“聖盃”已經近在咫尺。馬斯克說道,按照計劃到今年年底,特斯拉的自動駕駛汽車將能夠達到,在沒有任何人為操作干涉的情況下,在地面街道或者高速公路上的任何兩點之間自動駕駛。

在達成這一目標之後,按照馬斯克的術語,自動駕駛汽車就已經到達“功能完整(feature complete)”了,但在這一階段,自動駕駛汽車仍然不時需要人類駕駛員來監控車輛並在發生突發狀況時進行人為干預。不過按照馬斯克的推測,之後只需要六個月的時間,自動駕駛軟件就能夠擁有足夠的可靠性,不需要人為監督干涉就可以完全自動駕駛。按照馬斯克的期待,到 2020 年底,特斯拉將擁有數千輛特斯拉自動駕駛汽車,來為使用類似於優步等出租車服務的乘客提供無人駕駛出租車服務。

馬斯克的理解也許是,一旦特斯拉的自動駕駛汽車在今年下半年達到了所謂的“功能完整(feature complete)”,它們就已經完成了自動駕駛開發的前 90%的工作了。但是在這裡,最大的問題是,真的已經完成了 90% 了嗎?或者按照 Tom Cargill 的 90-90 法則來看,剩下的工作真的只需要 10% 的開發時間嗎?

自動駕駛研發難在第二階段

特斯拉又融資!馬斯克用自動駕駛畫5千億大餅,然時間表值得懷疑

圖丨 Waymo 公司的工程師使用上圖所示的的複雜的圖表來顯示道路情況(來源:Waymo)

我們可以將把自動駕駛汽車的開發分為兩個階段來進行。在第一階段,開發的重點是建立自動駕駛汽車對世界的靜態理解。比如說,現在汽車正在行駛的這條路在哪裡?周圍的其他車又在哪裡?附近是否有行人或自行車?現在所在的特定區域有什麼交通法規?

當汽車軟件能夠完成自動駕駛第一階段的任務之後,理論上講,自動駕駛汽車就應該能夠在空曠道路上的任意兩點之間完美駕駛了,甚至即使在擁擠的道路上,它也應該能夠做到避免碰到任何其他事物。這也就是被馬斯克稱為「功能完整」的自動駕駛程度。Waymo 公司在 2015 年左右實現了這種自動駕駛水平,而特斯拉的目標是在今年晚些時候也達到這一目標。

但是,如果你想讓自己的汽車達到可以為人們提供無人駕駛出租車服務的水平,你還需要深入第二階段的開發,這一階段的重點是如何處理與周圍其他事物之間各種複雜的交互場景,包括與其他駕駛員、行人和其他道路使用者的各種複雜交互。

如果解決不了第二階段的問題,自動駕駛汽車就會經常因無法做出決策而“凍結”在原地。它將很難完成在較為擁擠的情況下上高速,在環形交叉路口導航以及在無保護的情況下打左轉等各種任務。而且你有可能會發現,在有很多行人過馬路的地方,這輛自動駕駛汽車會因為擔心有人會突然跳到車前而不知所措,或者在建築工地或繁忙的停車場附近時,它也會不知道該做何反應。

這些僅僅解決第一階段卻未解決第二階段任務的自動駕駛汽車,當然最終也很可能會將你帶到目的地,但其乘坐過程很可能是一個緩慢且不穩定的過程,以至於用過一次之後,就沒有人想再用它。這樣的汽車很有可能因為其笨拙的駕駛風格而令道路上的其他人抓狂,甚至可能導致整個公眾都會反對使用自動駕駛技術。

除此之外,在第二階段的開發中,開發人員還需要處理各種越來越不尋常的“罕見狀況”,比如在單行道上遇到逆行的汽車怎麼辦;比如一輛卡車在結冰的路面上突然失控而且開始向後打滑駛向後面的車隊怎麼辦;又或者是突然遇到了森林大火、洪水或龍捲風而使道路無法通行,該如何應對。這一階段要處理的有些情況可能如此罕見,以至於公司可能測試其軟件許多年,也無法真正囊括所有這些在現實中可能碰到的情況。

在過去三年裡,Waymo 公司一直都處於自動駕駛開發的第二階段。而相比之下,馬斯克似乎認為第二階段的開發就顯得有點微不足道了。馬斯克似乎相信,只要特斯拉的汽車能夠識別道路上的車道標記和其他物體,它就已經做好準備迎接完全無人駕駛階段的到來了。

特斯拉新型自動駕駛芯片,優勢能維持多久?

特斯拉又融資!馬斯克用自動駕駛畫5千億大餅,然時間表值得懷疑

圖丨一輛特斯拉無人駕駛開發樣車,使用是英偉達的 Drive PX 2 AI計算引擎

在過去十年中,通過更深層的網絡、更多的數據和更多計算能力的組合,研究人員對神經網絡的性能已經做出了不斷改進,在深度學習領域實際上已經進行了革命性的進展。在早期的深度學習實驗中,主要是通過並行使用消費級的 GPU 來進行的。而在最近,谷歌和英偉達等公司已經開始專門為深度學習工作負載而設計定製的芯片。

自從 2016 年以來,特斯拉自動駕駛汽車的先進駕駛輔助系統(Autopilot)一直是由英偉達公司的 Drive PX 平臺來支持的。但在去年,特斯拉已經棄用英偉達的平臺,轉而採用自己的定製芯片 FSD。

在發佈會上,馬斯克邀請了自己在 2016 年從蘋果公司聘請的芯片設計師 Pete Bannon 來解釋他的工作。Bannon 在活動中表示,開發這款新的系統主要目的就是直接代替之前的整個基於英偉達平臺的系統。

Bannon 說到,“這是兩臺互相獨立的計算機,它們獨自啟動並運行自己的操作系統。每臺計算機都有獨立的電源,即使其中一臺計算機崩潰,汽車也還將能夠繼續正常駕駛。”

Bannon 說,每個自動駕駛芯片都擁有 60 億個晶體管,該系統被設計用於以大規模的並行方式來執行神經網絡中所使用的各種操作。每個芯片都有兩個計算引擎,可以在每個時鐘週期執行 9,216 次乘加運算——乘加運算也是神經網絡計算的核心運算。每個 FSD 系統將擁有兩個這樣的芯片,FSD 系統的總計算能力為每秒 144 萬億次運算。

特斯拉說,這款新的芯片比該公司之前使用的英偉達芯片優化了 21 倍。當然,比起 2016 年供特斯拉用的那款芯片,英偉達也早已開發生產出更新的芯片;但特斯拉仍表示,即使與英偉達公司目前最新的運算速度為 21 TOPS(即每秒 21 萬億次運算)的 Drive Xavier 芯片相比,特斯拉的這款 FSD 芯片也更強大,FSD 芯片的運算速度為 144 TOPS。

但是英偉達認為,上面的比較方法並不公平。該公司表示,首先自己的 Xavier 芯片可提供 30 TOPS 的運算速度,而不是 21 TOPS。更重要的是,英偉達稱它們通常會將 Xavier 封裝在擁有強大 GPU 芯片的芯片上,從而使其擁有 160 TOPS 的計算能力。而且,和特斯拉的做法一樣,英偉達也將這些系統成對封裝,以增強其冗餘可靠性。因此他們的 Xavier 芯片的整個系統最終擁有 320 TOPS 計算能力。

當然最終真正重要的,並不是系統的理論操作速度,而是整個系統面對實際工作負載時的實際運算執行情況。特斯拉稱,自己的芯片專門為高性能和低功耗而設計,因此十分適用於自動駕駛應用,在自動駕駛領域可以提供比英偉達用途更廣泛、性能更好的芯片。

不過無論如何,兩家公司都在研究下一代芯片和系統設計,這樣看來,目前兩家公司所擁有的任何優勢都可能轉瞬即逝。

馬斯克信賴“數據護城河”

神經網絡的一個最經典的,也是與自動駕駛汽車關聯很大的一個應用,應該就是圖像識別了。自動駕駛軟件需要辨別附近的物體是汽車、自行車、行人、路燈柱子,還是一袋垃圾。這些信息可以幫助軟件來判定某一個對象在未來可能會如何移動,以及可能遇到的問題的嚴重程度。

神經網絡非常適合來處理這種圖像分類問題。為了訓練神經網絡,程序員們通常會建立一個大型的圖像數據庫,並對數據庫中所包含的對象進行類型標記。然後,系統會使用稱為反向推測的技術來“訓練”網絡,從而達到可以正確地對各種圖像進行分類。

在過去十年中,研究人員發現,隨著投入的數據越來越多,計算能力越來越高,深度神經網絡也變得越來越準確。但至關重要的一個問題是,只有這些增加的數據可以真正代表現實世界的完全複雜性時,才能為深度學習的訓練真正增加價值。神經網絡的學習非常直觀,如果它在學習時所看到的訓練數據一直都只是某種類型的數據,那麼它也只能學習識別這種特定類型的對象。

特斯拉的人工智能領域的大師 Andrej Karpathy 在 4 月 22 日的演講中給出了一個很好的例子。Karpathy 說,當特斯拉的汽車在實際駕駛中遇到異常情況,特斯拉公司可以調回當時的異常情況的數據並進行分析。比如說,如果公司擔心自己的軟件在識別固定在車輛上的自行車方面做得還不夠好,它可以要求特斯拉的車輛在駕駛時尤其注意附近的自行車和汽車的圖像。然後特斯拉可以僱用人員來專門檢查這些圖像,並驗證它們是否包含掛在車輛尾部的自行車,再將這些圖像添加到特斯拉的圖像訓練數據集中,從而幫助軟件今後的版本可以更好地理解自行車和車輛組合在一起的各種情況。

在自動駕駛開發的最後階段,“長尾”將十分消耗時間(長尾在本文中指那些出現頻率低、但危險性可能很高的情況)

特斯拉所提出的策略,也許非常適合讓特斯拉完成前述的自動駕駛開發的第一階段:只要道路不是那麼擁擠,整個過程中沒有什麼突發的、奇怪的事情發生,它將使自動駕駛汽車能夠實現在任何兩點之間行駛的程度。

之後,特斯拉將進入開發的第二階段:處理複雜的與人類之間的互動情況,以及之後的一長串的罕見但卻存在有很大的潛在危險的各種情況。

特斯拉在活動中對此問題的基本論點是,它們將能夠從特斯拉的車隊中獲取數據,這些數據將使特斯拉在解決第二階段的各種問題方面具有很大的優勢。

Karpathy 說,“解決這些問題需要先從所有實際收集到的數據中識別出這些情況,然後進行軟件迭代,最後才能夠真正為神經網絡提供正確的處理解決這類問題的數據,而上面所說的整個過程的速度,與能夠從實際駕駛過程中收集到的數據中包含這些情況的頻率成正比”。

但是,雖然特斯拉可能有能力獲得大量的數據,但並沒有足夠的帶寬來將特斯拉汽車的每一分鐘駕駛的記錄數據反饋給公司總部。相反,只有在特斯拉的工程師告訴汽車需要注意哪些類型的情況,並且之後當汽車真正遇到與其中一種類型匹配的情況時,汽車才會將現場的短視頻剪輯反饋給特斯拉總部。

這也就意味著只有工程師有足夠的先見之明,發送了從汽車那裡請求這種類型數據的指令時,特斯拉總部才會收集到這類極少數情況下的數據。如果某些情況十分罕見奇怪,以至於工程師們從來都沒有考慮過會發生這類情況,那麼這類情況的數據即使特斯拉汽車曾經遇到過,其現場數據也可能永遠都不會進入到特斯拉的自動駕駛訓練數據集中。

幸運的是,特斯拉有一些其他技術來標記自己的軟件不能很好理解的情況。當人類駕駛員在發現自動駕駛儀(Autopilot)做錯了什麼的時候,軟件會記錄下來這種情況。此外,即使當人類駕駛員在操作且自動駕駛儀處於非活動狀態時,特斯拉汽車仍然會在“陰影模式”下啟動運行其自動駕駛軟件,來計算假如自動駕駛儀處於活動狀態時會採取哪種措施。

這種做法有一個問題就是,他們所處理的通常是一個非常嘈雜的信號。人類駕駛員每天都要停用數十萬次自動駕駛儀,對於需要從這些數據中搜集一場情況的人類來說,這些數據實在是太多太細微了。而且軟件越好,這種方法的使用就越像是在大海撈針。

當然,這並不是說特斯拉的這種方法不起作用。僱傭人員來從特斯拉車隊收集的數十億英里的數據中尋找異常情況,當然比 Waymo 僱用人類駕駛員來駕駛數百萬英里的方法更省人力成本。但正如 Karpathy 所說的那樣,“在接近 100% 之前的 99.99……% 中的最後幾個 9 的工作,將是非常困難棘手的。”無論公司有多麼多的原始數據,這一過程都將非常耗費時間。

瞭解人類的行為,真的很難

特斯拉又融資!馬斯克用自動駕駛畫5千億大餅,然時間表值得懷疑

圖丨 Delphi 的駕駛界面,其中描繪了自動駕駛汽車的視圖。

自動駕駛汽車不僅需要建立對世界在這一秒的靜態理解,它還需要建立對世界的動態理解,即世界在未來幾秒內會如何變化,尤其是,自動駕駛軟件需要了解人類的行為方式。

特斯拉的這次活動中所關注到的最具遠見的問題之一就是上述這個關鍵話題。而特斯拉也給出了自己對這一問題的解答。

在發佈會上,有人提問:“特斯拉的這款自動駕駛系統確實在理解路標、物體的位置以及汽車的驅動方式已經做的很好;但是對於各種非科學的情況下呢,比如說停車時,在環形交叉路口誰先誰後,以及道路上還有類似於馬車等非人類駕駛的交通方式存在的情況下,自動駕駛系統如何處理?”

馬斯克的回答是,“我們的芯片實際上已經做的確實很不錯,它會使用類似於插件的工具,將可以很好地處理這類問題。”

而 Karpathy 則提出了一個更具體的回答:“我們現在正在使用大量的機器學習來訓練自動駕駛系統的預測能力,首先給自動駕駛創建一個世界的形象表示,在這個形象表示之上又會有一個明確的計劃器和一個控制器,這裡還有各種用於預測的如何進行遍歷和談判的各種啟發式方法等。

確實,我們必須解決最後的“罕見情況”,而且自動駕駛的長尾會有特別多的情況,在對視覺環境的處理上會有“罕見情況”,在對於各種情況的反應或者與其他道路使用者的談判方面也會有“罕見情況”需要解決。但是我們有很大自信是,這些“長尾“問題,最終肯定是靠一種車隊機器學習組建來解決的。因為我認為,如果靠人工編寫各種程序或者規則來解決這類問題,將很快遇到瓶頸。”

活動中的這些談話已經從幾個方面向我們透露了一些信息。

首先,很明顯 Karpathy 比馬斯克更深入地思考了這個問題。這一問題的切入點雖然是自動駕駛需要能夠預測另一個駕駛員行為的各種情況,但實際上這是在路上最簡單常見的人與人之間的互動。馬斯克回答的特斯拉汽車在這一方面做的“相當不錯”,並不能說明特斯拉採用的方法是可行的。

相比之下,Karpathy 似乎更深地認識到這其中的複雜性。他說道,“最終肯定是靠一種車隊機器學習組件(a fleet-learning component)來解決的”,這表明特斯拉在為針對這類問題所需開發的組件方面尚未取得很大的進展。相反,他承認 Autopilot 的計劃模塊使用了“大量啟發式”方法來處理所遇到的與其他道路使用者之間的交互。

馬斯克說:“從本質上講,現在人工智能和神經網絡主要被用於物體的識別,我們基本上仍然將它用作處理靜止幀上的物體,並也將對象識別為靜止幀,然後再將其綁定在之後的感知/路徑規劃層中。”

從馬斯克的這些答案來看,要想實現馬斯克制定的實現自動駕駛的激進的開發計劃,可能時間有點緊張了。支持特斯拉可以比其競爭對手實現更快的開發速度的論點,是特斯拉可以使用神經網絡訓練從特斯拉車隊收集到的大量數據。

但是,即使 Karpathy 和馬斯克自己也承認,特斯拉才開始嘗試使用神經網絡來處理更復雜的感知和路徑規劃方面的問題。很難令人相信,特斯拉能夠在僅僅 15 個月的時間內,就可以完成使用神經網絡完全重寫其感知和路徑規劃軟件,然後對這一軟件進行各種嚴格測試的所有的工作。

即使 Waymo 公司已經擁有在機器學習領域的眾多優勢,這一問題還是困擾了它們三年或更長時間。那麼,特斯拉要在未來幾年內就達到與 Waymo 不相上下的水平,這個說法有說服力嗎?

棄用激光雷達和高清地圖是愚蠢的?

特斯拉又融資!馬斯克用自動駕駛畫5千億大餅,然時間表值得懷疑

圖丨由 Ouster 的相機和激光雷達系統拍攝的三層圖像示例。

這次活動的另一個主題是,馬斯克認為激光雷達和高清晰度地圖在自動駕駛方面是不適用的。他認為,依賴這些系統的自動駕駛系統將會是“不堪一擊”並且容易出現故障的。特斯拉的競爭對手最終也將不得不放棄使用這些系統。

馬斯克的說法可能是正確的,但我們不知道的是,開發這樣的系統是需要兩年、十年還是三十年的時間來實現這一目標。

確實,如果軟件過度依賴於激光雷達或高清地圖,其效果可能會適得其反。例如,自動駕駛汽車可能會盲目地沿著高清地圖上佈置的路徑行駛,而不檢查周圍的情況,以確認真實場景是否比地圖創建時發生了變化。

但是,如果可以聰明地使用它們,激光雷達和高清地圖仍將可以帶來很多其他價值。特斯拉的粉絲總喜歡說,只要你有足夠好的視覺算法,激光雷達是完全不需要的,但自動駕駛軟件其實也只是通過內在概率來做出判斷。

例如,軟件可能會計算出一個對象有 97%的可能性是一個燈柱,另一個十分難以辨別的對象有 83%的可能性只是一個傳感器的偽影(偽影:指由於傳感器的物理原理或算法而導致的拍攝或掃描影像中出現了實際不存在的各種形態的影像)。

而如果汽車可以藉助高清地圖幫助,它將可以在地圖上檢查該位置是否應該確實是一個燈柱。如果是這樣,那麼汽車將可以更有信心地前進。如果高清地圖上沒有顯示這裡有燈柱,那麼汽車就需要考慮其他的可能的解釋。

相似地,激光雷達也可以幫助自動駕駛系統確認在明顯的傳感器偽影方向上是否確實存在實際物體,進而幫助汽車判斷是否可以安全地忽略它。

汽車感知世界的方式越多,某個傳感器的誤導性數據最終導致自動駕駛系統的錯誤性操作的可能性就越小。激光雷達和高清地圖都為無人車提供這類數據,它們可以幫助自動駕駛軟件確認或取消來自其他傳感器的數據。

但更值得注意的是,馬斯克對激光雷達的批評點,主要關注於對車輛周圍構建靜態物體模型的相對簡單的任務上。

在演講中,Karpathy 專門花時間解釋了特斯拉使用相機來檢測車道線,以及確定相機框架中的物體距離的策略。也許特斯拉已經在不使用激光雷達和相機的情況下,快速取得了解決這些問題的進展。

但實際上,Waymo 已經在過去的許多年或多或少解決了這些問題,也許 Waymo 嚴重依賴激光雷達和高清地圖的方案,可能並不是解決此問題最具成本效益或技術優雅的方案。但這一系統一直運作良好。對於一家也仍在努力解決同樣問題的公司來說,特斯拉將 Waymo 的解決方案視為不可行,實在有點難以理解。

-End-

參考:

https://www.wsj.com/articles/tesla-seeks-raise-as-much-as-2-7-billion-up-from-2-3-billion-11556886130

https://www.wsj.com/articles/tesla-looks-to-raise-as-much-as-2-3-billion-in-debt-and-equity-11556800692

https://www.bloomberg.com/news/articles/2019-05-02/musk-is-said-to-make-500-billion-autonomy-pitch-to-investors?srnd=technology-vp

https://arstechnica.com/cars/2019/05/2-34-billion-fundraise-gives-tesla-much-needed-breathing-room/

https://arstechnica.com/cars/2019/04/teslas-autonomy-event-impressive-progress-with-an-unrealistic-timeline/

關注 DeepTech 發現改變世界的新興科技(微信號:deeptechchina)


分享到:


相關文章: