伯克利&MIT 最新論文:用面向對象的預測和規劃推理物理交互

伯克利&MIT 最新論文:用面向對象的預測和規劃推理物理交互

加州伯克利大學和麻省理工學院的研究員今天聯合發表了一篇論文:用面向對象的預測和規劃推理物理交互。

該論文入選了明年的 ICLR 大會,以下是論文摘要:基於對象的分解提供了與世界交互的有用抽象級別。

然而,建立明確的對象表示通常需要在實踐中難以獲得的監督信號。

我們提出了一種範式,用於學習物理場景理解的以物體為中心的表示,而無需直接監督對象屬性。

我們的模型,面向對象的預測和規劃(O2P2),共同學習感知功能,從圖像觀察到對象表示,成對物理交互功能,預測對象集合的時間演變,以及渲染功能,映射對象回到像素。

為了評估,我們不僅考慮模型的物理預測的準確性,而且還考慮其對需要可操作的直觀物理表示的下游任務的效用。

在對圖像預測任務訓練我們的模型之後,我們可以使用其學習的表示來構建比訓練期間觀察到的更復雜的塊塔。


分享到:


相關文章: