2020 自動駕駛技術報告:Waymo、特斯拉、沃爾沃技術方案大揭祕

想更及時獲取科技資訊和乾貨,不妨關注​“「創科前沿」

”吧


2020 自動駕駛技術報告:Waymo、特斯拉、沃爾沃技術方案大揭秘

自動駕駛要完全實現無人化,技術還需進行不斷的迭代和發展。

進入 2020 年,自動駕駛技術的跨越式路線與漸進式路線之間的陣營劃分已經十分明顯。但最終自動駕駛要完全實現無人化,其技術還需要進行不斷的迭代和發展。

對於自動駕駛的技術進展,WEVOLVER 發佈的《2020 自動駕駛技術報告》進行了全面的闡釋。

2020 自動駕駛技術報告:Waymo、特斯拉、沃爾沃技術方案大揭秘

報告從感知、規劃、執行三個層面表述了自動駕駛汽車技術的最新發展狀況,涉及了傳感器、數據處理、機器學習、SLAM 與傳感器融合、路徑規劃等多個領域,同時提供了多個自動駕駛公司的案例,包括特斯拉、Volvo、Waymo 等。

來源:《2020 自動駕駛技術報告》

1感知

自動駕駛汽車是在一個未知的動態環境中運行的,所以它需要事先構建出環境地圖並在地圖中進行自我定位,而執行同步定位和映射過程(SLAM,即時定位和地圖構建)的輸入則需要傳感器和 AI 系統的幫助。

報告指出,傳感器可分為有源傳感器和無源傳感器,各種傳感器都有其優缺點,沒有一種單一傳感器能夠適用於所有路況。通常情況下,想要可靠、安全地操控一輛自動駕駛汽車,需要同時使用多個傳感器。

2020 自動駕駛技術報告:Waymo、特斯拉、沃爾沃技術方案大揭秘

一般情況下,自動駕駛汽車包含的傳感器主要有五種類型:

1、遠程雷達:信號能夠透過雨、霧、灰塵等視線障礙物進行目標檢測。

2、照相機:一般以組合形式進行短程目標探測,多應用於遠距離特徵感知和交通檢測。

3、激光雷達:多用於三維環境映射和目標檢測。

4、短程/中程雷達:中短程目標檢測,適用於側面和後方避險。

5、超聲波:近距離目標檢測。

前面提到,各類傳感器均有其優缺點,而自動駕駛汽車需要從技術上對傳感器進行判斷、選擇,篩選的條件主要有以下幾個方面:

  • 掃描範圍,決定了傳感器對被感知的物體做出反應的時間;
  • 分辨率,傳感器可以為自動駕駛車輛提供的環境細節;
  • 視野/角度分辨率,決定自動駕駛汽車需要多少傳感器來覆蓋感知的區域;
  • 3D 環境下區分靜態對象和動態對象的能力;
  • 刷新率,決定傳感器信息更新的頻率;
  • 在不同環境條件下的總體可靠性和準確性;
  • 成本、尺寸和軟件兼容性;
  • 生成的數據量。

以下是 Waymo、Volvo-Uber、Tesla 的傳感器方案示意圖:

2020 自動駕駛技術報告:Waymo、特斯拉、沃爾沃技術方案大揭秘

2020 自動駕駛技術報告:Waymo、特斯拉、沃爾沃技術方案大揭秘

2020 自動駕駛技術報告:Waymo、特斯拉、沃爾沃技術方案大揭秘

另外,關於無源傳感器和有源傳感器,報告中也作了詳盡的介紹:

無源傳感器

無源傳感器能夠探測環境中物體反射的現有能量,如光、輻射等。但在弱光環境下,由於沒有自己的傳播源,無源傳感器的性能將有所下降。並且在產生的數據方面,對比有源傳感器,無源傳感器產生的數據量更多,約 0.5-3.5 Gbps。

即便如此,無源傳感器仍具有多方面特點,主要包括:

1.涵蓋整個視野寬度的高分辨率的像素和顏色;

2.在視野中保持恆定的幀頻;

3.兩個攝像頭可以生成一個 3D 立體視圖;

4.缺乏發射源減少了來自其他車輛的干擾的可能性;

5.技術成熟,成本低;

6.系統生成的圖像便於用戶理解和交互。

如果在自動駕駛汽車上使用無源攝像頭傳感器套件,需要覆蓋汽車周邊的各個環境。這可以通過使用在特定時間間隔拍攝圖像的旋轉相機來實現,或者通過軟件將 4-6 個相機的圖像拼接在一起。

此外,這些傳感器需要一個超過 100 分貝的高動態範圍(場景中高光和陰影的成像能力),使它們能夠在各種光照條件下工作,並區分不同的對象。

有源傳感器

有源傳感器具有信號傳輸源,依靠 TOF 原理感知環境,ToF 能夠通過等待信號的反射返回來測量信號從源到目標的傳播時間,信號的頻率決定了系統所使用的能量及其準確性。因此,確定正確的波長在選擇系統時起著關鍵的作用。

關於有源傳感器的類型,報告主要介紹了以下三種:

超聲波傳感器:也稱為聲納;聲音導航測距。在有源傳感器中,聲波的頻率最低(波長最長),因此聲波更容易被幹擾,這也意味著超聲波傳感器很容易受到不利環境條件的影響,如下雨和灰塵。另外,其他聲波產生的干擾也會影響傳感器的性能,需要通過使用多個傳感器和依賴額外的傳感器類型來緩解干擾。

雷達:主要通過無線電波進行測距。無線電波以光速傳播,在電磁波譜中頻率最低(波長最長),基於無線電波的反射特性,雷達傳感器可以探測到前方物體之外的東西。

不過,雷達信號容易被具有相當導電性的材料(如金屬物體)反射,並且其他無線電波的干擾也會影響雷達的性能,造成雷達傳感器無法對物體進行探測。在確定被探測目標的形狀方面,雷達的能力不如激光雷達。

激光雷達:以脈衝激光的形式使用光。激光雷達傳感器能夠以每秒 50,000- 200,000 個脈衝的速度覆蓋一個區域,並將返回的信號編譯成一個 3D 點雲,通過比較連續感知的點雲、物體的差異檢測其運動,由此創建一個 250 米範圍內的 3D 地圖。


2規劃

根據自動駕駛汽車傳感器套件捕獲的原始數據和已有地圖,自動駕駛系統需要通過同時定位和映射算法構建和更新具體的環境地圖,跟蹤其具體定位,從而開始規劃從一個點到另一個點的路徑。

SLAM與傳感器融合

SLAM 是一個複雜的過程,因為定位需要地圖,而繪製地圖需要良好的位置估計。為了更準確地執行即時定位和地圖構建,傳感器融合開始發揮作用。

傳感器融合是將多個傳感器和數據庫的數據結合起來以實現信息改進的過程。它是一個多層次的過程,能夠處理數據間的聯繫和相關性,對數據進行組合,與使用單個數據源相比,能夠獲得更便宜、更高質量、相關性更高的信息。

2020 自動駕駛技術報告:Waymo、特斯拉、沃爾沃技術方案大揭秘

在自動駕駛汽車 AI 架構中,主要有兩種方法:

1. 逐步處理。把整個駕駛過程拆解為一系列逐層連接的流水線,其中的每一步,比如感知、定位、地圖、路徑導航、運動控制,都分別由各自的具體軟件組件處理。

2. 端到端。基於深度學習的解決方案,一次性處理所有這些功能。

通過傳感器的融合,自動駕駛汽車獲得了數據,不過,如何從傳感器信號中提取有用的信息,並基於現有信息執行任務,則需要利用機器學習算法——CNN、RNN、DRL。

CNN(卷積神經網絡):主要用於處理圖像和空間信息,提取感興趣的特徵和識別環境中的對象。這些神經網絡是由一個卷積層構成的:一個過濾器的集合,它試圖區分圖像的元素或輸入數據來標記它們。這個卷積層的輸出被輸入到一個算法中,該算法將它們結合起來預測圖像的最佳描述。最後的軟件組件通常稱為對象分類器,因為它可以對圖像中的對象進行分類,例如一個路標或另一輛汽車。

RNN(遞歸神經網絡):主要用於處理視頻信息,在這些網絡中,先前步驟的輸出將作為輸入進入到網絡中,從而允許信息和知識能夠在網絡中持久存在並被上下文化。

DRL(深度強化學習):DRL 方法允許軟件定義的“代理”學習在虛擬環境中使用獎勵函數實現目標的最佳可能操作。這些面向目標的算法將學習如何實現目標,或如何在多個步驟中沿著一個特定的維度最大化。目前,深度強化學習在無人駕駛汽車中的應用還處於起步階段。

這些方法不一定是孤立存在的。為了避免過度擬合,在深度學習中通常會進行多任務訓練網絡。當機器學習算法被訓練用於一個特定的任務時,它會變得如此專注於模仿它所訓練的數據,以至於試圖進行插值或外推時,它的輸出會變得不現實。

通過在多個任務上訓練機器學習算法,網絡的核心將專注於發現對所有目的都有用的通用特性,而不是專注於一個任務,以便輸出更加實際有用的應用程序。

利用傳感器提供的所有數據和這些算法,自動駕駛汽車能夠探測到周圍的物體。接下來,它需要找到一條路徑。


3路徑規劃

車輛瞭解其環境中的物體及其位置後,可以使用 voronoi 圖(車輛與物體之間的最大距離)、佔用網格算法或駕駛廊道算法來確定車輛的大尺度路徑。然而,這些傳統方法並不能夠滿足車輛在動態環境下的移動。

2020 自動駕駛技術報告:Waymo、特斯拉、沃爾沃技術方案大揭秘

報告指出,部分自動駕駛汽車不僅依靠機器學習算法來感知環境,還依靠這些數據來控制汽車。路徑規劃可以通過模仿學習的方式傳授給 CNN,在模仿學習中,CNN 試圖模仿駕駛員的行為。

通常情況下,這些機器學習方法會與經典的運動規劃和軌跡優化方法相結合,以確保路徑的魯棒性。此外,出於其他目的(例如減少燃料使用),汽車製造商還會在模型中提供最佳路徑參考。

車輛運行過程中的神經網絡訓練和推理需要巨大的計算能力,由於汽車需要對新數據作出及時反應,因此,操作車輛所需的部分處理需要在車上進行,而模型的改進可以在雲上完成。

目前,機器學習的最新進展在於有效處理自動駕駛汽車傳感器產生的數據,減少計算成本。此外,芯片製造和微型化的進步正在提高可安裝在自動駕駛汽車上的計算能力。隨著網絡協議的進步,汽車或許能夠依靠低延遲的基於網絡的數據處理來幫助它們進行自主操作。


4執行

那麼,車輛是如何行動的呢?

在人類駕駛的汽車中,汽車的轉向、剎車或信號等動作通常由駕駛員控制。來自駕駛員的機械信號由電子控制單元(ECU)轉換成驅動命令,再由車上的電動或液壓執行器執行。

在(半)自動駕駛汽車中,這種功能被直接與 ECU 通信的驅動控制軟件取代。這些軟件能夠改變車輛的結構,減少部件的數量;尤其是那些專門用於為 ECU 將機械信號從駕駛員轉換為電信號的部件。

自動駕駛汽車通常包含多個 ECU,一般車輛大約有 15-20 個,高端車型可能達到 100 個。

ECU 是一個簡單的計算單元,有獨立的微控制器和內存,以此處理接收到的輸入數據,並將其轉換為其子系統的輸出命令,例如,轉換自動變速箱。

一般來說,ECU 既可以負責控制車輛的操作,也可以負責安全功能,運行信息娛樂和內部應用程序。並且,大多數 ECU 支持單個應用程序,如電子動力轉向,能夠在本地運行算法和處理傳感器數據。

挑戰一:系統複雜性

工程師需要為系統設計正確的電子體系結構,以便進行傳感器融合,將決策同步分發到按指令行事的較低層子系統,這對需求的增加和複雜性提出了挑戰。

理論上,在一種極端情況下,人們可以選擇一種完全分佈式的架構,其中每個傳感單元處理其原始數據並與網絡中的其他節點通信。在光譜的另一端存在一個集中的架構,其中所有的遠程控制單元(RCUs)都直接連接到一箇中央控制點,該控制點收集所有信息並執行傳感器融合過程。

而在這個範圍的中間是混合解決方案,它將在更高抽象級別工作的中央單元與執行專用傳感器處理,或與執行決策算法的域相結合。這些域可以基於車輛內部的位置,例如汽車前部和後部的域,它們控制的功能類型,或者它們處理的傳感器類型(例如照相機)。

在集中式體系架構中,來自不同傳感器的測量值是獨立的量,不受其他節點的影響。數據在系統的邊緣節點上沒有被修改或過濾,為傳感器融合提供了最大可能的信息,並且具有較低的延遲。這一架構挑戰在於,大量的數據需要傳送到中央單元並在那裡進行處理。這不僅需要一個強大的中央計算機,而且還需要一個高帶寬的重型線束。

分佈式架構可以用更輕的電氣系統實現,但更復雜。儘管在這樣的架構中,與帶寬和集中處理相關的需求大大減少,但它在驅動和傳感階段之間引入了延遲,增加了對數據驗證的挑戰。

挑戰二:動力、熱量、重量和尺寸的增加

除了增加系統的複雜性之外,自動化還會增加車輛部件的功耗、熱足跡、重量和尺寸。無論架構是分佈式的還是集中式的,auton - omous 系統的功耗需求都是巨大的,而在這之中,主要的驅動因素是競爭需求。

全自動汽車的競爭需求比目前生產的最先進的汽車高出近 100 倍。對純電動汽車來說,行駛里程容易受到這種動力需求的負面影響。因此,Waymo 和福特等公司選擇專注於混合動力汽車,而 Uber 則使用全汽油 suv。然而,專家指出,全電動最終會成為動力系統的選擇,因為內燃機在為車載電腦發電方面效率低下。

增加的處理需求和更高的功率吞吐量會使系統升溫,但為了使電子元件正常可靠地工作,不管車外部條件如何,電子元件必須保持在一定的溫度範圍內,這就需要冷卻系統的存在。但是,冷卻系統進一步增加車輛的重量和尺寸,特別是液體冷卻。另外,額外的組件、額外的佈線和熱管理系統也會對車輛任何部分的重量、尺寸和熱性能造成壓力。

針對於此,自動驅動元件的供應商正改變著產品,從減輕像 LIDARs 的大型元件重量,到構建像 semicon - ductor 這樣的微型元件。同時,半導體公司正在製造佔地面積更小、熱性能更好、干擾更小的元件,發展各種硅元件,如 MOSFET、bipo - lar 晶體管、二極管和集成電路。

不僅如此,該行業還考慮使用新材料——氮化鎵(GaN)。與硅相比,氮化鎵可以更有效地傳導電子,從而能夠在給定的導通電阻和擊穿電壓下,製造出更小的器件。

一輛全自動駕駛汽車所包含的代碼可能比迄今為止所開發的任何軟件平臺或操作系統都要多,要自行處理所有的算法和過程需要顯著的計算能力和強大的處理。目前,GPU 的加速處理正成為行業的標準。

在 GPU 領域, Nvidia 是這個市場領導者。Nvidia 的競爭主要集中在張量處理單元(TPU)的芯片設計上,加速了作為深度學習算法核心的張量運算。另外,GPU 用於圖形處理也阻止了深度學習算法充分利用芯片的能力。

可見,隨著車輛自動化水平的提高,車輛的軟件形態將發生顯著的變化。除此之外,車輛更大的自主權也會影響用戶與車輛的互動方式。



分享到:


相關文章: