英偉達打算教機器人通過觀察人類來學習

工業機器人大都是一遍又一遍地重複已經明確編程好的任務。然而,越來越多的研究人員正在思考機器人如何在充滿人類的環境裡工作,甚至向他們學習。

英偉達公司目前在西雅圖的新機器人實驗室裡專注於一項研究——該公司的研究團隊今天在澳大利亞布里斯班舉辦的機器人與自動化國際會議(ICRA)上展示了機器人觀察人類的實驗,並介紹了其最近的一些關於機器人教學的工作。

英偉達打算教機器人通過觀察人類來學習

雖然有可能通過機械的重複來訓練某個算法,好讓它能成功地玩電子遊戲,並教導它從錯誤中學習,但福克斯認為,這種訓練機器人的方式可能會因為機器人要做決策的內容太多而無法有效地完成。相反,由Stan Birchfield和Jonathan Tremblay領導的英偉達研究小組開發了一個新系統,能允許機器人算法通過簡單地觀察人來得到教導,以執行新的任務。

英偉達打算教機器人通過觀察人類來學習

這個例子中的任務非常簡單——只需要堆疊幾個彩色的積木即可。但這也是在這整個漫漫長征路中邁出的重要一步,好讓人類能夠快速教授機器人的新任務。

研究人員首先訓練了一系列的神經網絡來檢測積木,推斷積木之間的關係,然後生成一個程序,來讓它反覆目睹人類表演的各個步驟。研究人員說,這個新系統能讓他們訓練機器人在現實世界中只通過一次演示來完成這個堆疊任務。

這個系統的一個很好的地方在於——它可以對正在執行的步驟產生一個可讀的描述。這樣,研究人員就能更容易地找出發生錯誤時的具體情況。

英偉達的Stan Birchfield告訴我,該團隊旨在為非專業人員提供機器人培訓,並且很少有其他任務能夠比展示堆疊積木等基本的任務更容易。在這個例子中,正如英偉達團隊在布里斯班展出的那樣,有一臺攝影機負責觀看現場,人類只是走上前去,拿起積木並堆疊起來。然後機器人反覆地重複這個任務。這聽起來很簡單,但對於機器人來說這是一項非常艱鉅的任務。

英偉達打算教機器人通過觀察人類來學習

為了訓練核心模型,英偉達團隊主要使用模擬環境中的合成數據。正如Birchfield和Fox所強調的那樣,這些模擬可以快速地訓練機器人。畢竟,在現實世界中進行培訓需要更長的時間,而且還會更加危險。對於大多數任務,並沒有提前可供參考的培訓數據。

Birchfield指出:“我們認為模擬是一種強有力的範例,可以讓機器人訓練以前不可能做的事情。”Fox回應了這一說法,並指出這種模擬的需求正是英偉達認為其硬件和軟件非常適合這種研究的原因。畢竟,這個培訓過程有著非常強烈的視覺效果,而英偉達在圖形硬件方面的專業背景肯定會有所幫助。

福克斯承認,仍有大量的研究需要繼續完成(畢竟,大多數模擬並非是實際情況),但現在至少已經有了核心基礎。

未來,英偉達團隊打算進一步擴大機器人可以學習的任務範圍,並多多找一些辭藻來描述這些任務。


分享到:


相關文章: