百度研究人員研發新型自動調諧框架 爲自動駕駛車輛更好規劃路徑

核心提示:據外媒報道,中國互聯網巨頭百度的研究人員最近研發出一種自動調諧框架,專為基於阿波羅自動駕駛平臺、由數據驅動的自動駕駛車輛設計。該框架在arXiv網站發佈,包括新的強化學習算法和離線培訓策略,以及自動收集和標記數據的方法。

百度研究人員研發新型自動調諧框架 為自動駕駛車輛更好規劃路徑

據外媒報道,中國互聯網巨頭百度的研究人員最近研發出一種自動調諧框架,專為基於阿波羅自動駕駛平臺、由數據驅動的自動駕駛車輛設計。該框架在arXiv網站發佈,包括新的強化學習算法和離線培訓策略,以及自動收集和標記數據的方法。

用於自動駕駛的路徑規劃器(motion planner)是一個系統,專為目的地設計安全且舒適的路徑。設計並優化此類系統,使它們在不同的駕駛條件下都能表現良好是一項艱鉅的任務,目前,全球有幾家公司的研究人員們都在努力解決此問題。

進行該項研究的一名人員表示:“自動駕駛汽車的路徑規劃存在許多具有挑戰性的問題,主要挑戰之一是必須處理成千上萬的不同場景。通常,我們會定義一個獎勵/成本功能調諧,可以適應不同場景的差異。但是,此任務非常艱鉅。”

一般來說,獎勵-成本功能調諧需要代替研究人員進行大量工作,同時在模擬和道路測試中需要花費大量資源和時間。此外,隨著時間的推移,環境會發生顯著變化,駕駛條件也會變得越來越複雜,調諧路徑規劃器的性能變得越來越困難。

該研究人員表示:“為了系統地解決該問題,我們研發了一個基於Apollo自動駕駛框架、由數據驅動的自動調諧框架。自動調諧就是從人類的駕駛數據中學習參數。例如,我們想要從數據中瞭解人類駕駛員如何在遇到障礙物時,平衡速度和進行便利駕駛”。

百度研究人員研發新型自動調諧框架 為自動駕駛車輛更好規劃路徑

百度研發的自動調諧框架包括新強化學習算法,可以從數據中學習,並隨著時間推移改善其性能。與大多數的逆強化學習算法相比,該框架可有效應用於不同駕駛場景。此外,該框架還包括離線培訓策略,為研究人員在公共道路上測試自動駕駛汽車之前調整參數提供了一種安全的方法。此外,它還可從專業駕駛員和環境信息中收集數據,自動標記數據,以便通過強化學習算法分析對其進行分析。

研究人員評估了一個路徑規劃器,在模擬和公共道路測試中都使用其框架對該路徑規劃器進行了調整。與現有方法相比,數據驅動的方法能夠更好地適應不同的駕駛場景,在各種條件下的表現保持良好。


分享到:


相關文章: