20分鐘教會車道保持功能!Wayve 公司的強化學習算法有點牛

20分钟教会车道保持功能!Wayve 公司的强化学习算法有点牛

雷鋒網按,AI 學會控制一輛汽車沿著道路標線行駛到底要花多久?答案是 20 分鐘。鑑於許多人一輩子都搞不清如何開車走直線,這樣的成績確實令人驚歎。

掌握這項“神技”的是一家名為 Wayve 的英國公司,Wayve 的班底都是來自劍橋大學工程學院的大牛,而他們能完成這項壯舉主要靠的是“強化學習”(reinforcement learning)算法。Wayve 公司在博文上表示,只需一位安全司機配合,他們的算法在 15-20 分鐘內就能教會一輛車沿著道路標線行駛。

所謂的強化學習又可稱之位再勵學習、評價學習,是一種重要的機器學習方法,在智能控制機器人及分析預測等領域有許多應用。此前,就有許多公司就展現過這項技術的高效,最好的例子就是 DeepMind 旗下橫掃人類棋手的 AlphaGo 和 OpenAI 旗下迅速進步的 Dota 2 AI 機器人(每天訓練量相當於人類選手 180 天)。

不可否認的是,讓 AI 在複雜的棋類和即時戰略類遊戲中擊敗人類已經讓人驚掉下巴了,而在短時間內教會一輛車如何自我控制更是讓人驚歎。

該團隊還在 YouTube 頻道上傳了車輛的學習過程,他們還強調,這是世界上第一個將“強化學習帶上自動駕駛汽車的範例”。

從視頻可以看出,最初車輛會像嬰兒一樣蹣跚學步,在路上蜿蜒前行,但當車輛開始偏離標線,安全駕駛員就會及時介入,將車輛拉回原來的軌道。這樣一來,車載算法就知道自己犯了錯誤,而如果算法長時間不犯錯,它們還會拿到獎勵的“糖豆”。

據雷鋒網知悉:除了強化學習,Wayve 還用到了“深度卷積神經網絡”,它能接收單圖片輸入,然後只靠一塊車載 GPU 就能完成數據處理。與其他自動駕駛汽車不同,Wayve 的改裝版雷諾小車不需要“海量模型、武裝到牙齒的傳感器和無窮無盡的數據”,它只需秉承 Wayve 的哲學,使用“一個聰明的訓練程序,就能快速和高效的完成學習任務。”

據雷鋒網瞭解,今年 5 月份,它們還參加了 TechCrunch 大會,Wayve聯合創始人 Amar Shah 當時就表示:“我們想賦予自動駕駛汽車的是更棒的大腦,而不是更多的硬件。”

“下一步,我們的任務就是擴展這項技術,以應對更多更復雜的駕駛任務,畢竟現在 AI 只不過學會了車道保持這項功能而已。未來,我們希望這套系統能驅動車輛識別交通燈,在環形道路和十字路口應對自如。”Amar Shah 解釋道。


分享到:


相關文章: