人類的學習速度快還是人工智能快?

一排糖_gvw

你可能沒有猜到,目前來看,人類的學習速度還是要比人工智能快很多的。

2013年,還鮮為人知的DeepMind Technologies發表了一篇創新性文章,展示了神經網絡通過觀看屏幕來學習翫80年代的電子遊戲。這些神經網絡後來打敗了現實中最出色的人類玩家。

幾個月後,谷歌以4億美元收購了該公司。從此DeepMind開始在各領域應用深度學習,其中最引人注目的應用就是在圍棋比賽中打敗人類。

雖然這項成就給人留下非常深的印象,但它也凸顯了深度學習的侷限性。與人類相比,使用這種技術的機器需要花費大量時間來學習。人類學習有什麼樣的特徵?為什麼這種技能使得我們可以依靠較少的經驗就獲得出色的表現?

加利福尼亞大學伯克利分校的Rachit Dubey團隊給我們提供了某種答案。他們研究了人類與視頻遊戲互動的方式,從而找出我們依靠何種先驗知識來理解遊戲。

事實證明,當我們玩一個新遊戲時,會使用大量的背景知識。這使得遊戲玩起來更容易。但面對那些不涉及這部分知識的遊戲,人類就一籌莫展,而機器卻能夠以相同的方式緩慢學習。

看看上圖左側的電腦遊戲(原版遊戲)。它是基於1984年8位計算機Atari平臺上發行的經典遊戲 Montezuma’s Revenge開發的。

沒有手冊,也沒有說明書;你甚至不知道你操控哪個“精靈”。只有當你完成遊戲後,你才會得到反饋。

你能做到嗎?需要多長時間?

對於大多數人而言,這個遊戲只花費你大約一分鐘時間,在這個過程中你可能會做出大約3000次鍵盤操作。這就是Dubey團隊的發現,當時他們在亞馬遜旗下的眾包網站Mechanical Turk提供了遊戲,支付1美元讓被試去玩。

研究人員說:“結果並不令人意外,人們很容易猜到遊戲的目標是控制機器精靈踩著磚塊物體並使用梯子到達更高的平臺,同時躲開憤怒的粉色物體和火焰,最後找到公主。”

相比之下,遊戲對於機器來說更難:許多標準的深度學習算法根本無法解決這個問題,因為只有完成遊戲後才會提供反饋,機器算法無法評估遊戲內部的進度。

表現最出色的機器算法是基於探索的強化學習算法,該算法花費了四百萬次鍵盤操作才完成遊戲。這相當於大約連續玩了37個小時。

所以,是什麼讓人類表現更好?事實證明,我們不會以一種一無所知的狀態應對這個遊戲。人類玩家操控自己的精靈時,會讓它躲避火焰、跳過空隙,並避免憤怒的敵人接近公主。這些操作都來自我們的先驗知識,我們知道哪些物體是好的,哪些是壞的(怒氣衝衝或帶著火焰);平臺可以支撐物體;梯子可以用來爬;外表相同的物體行動方式也相同;重力會讓物體下墜;甚至“物體”是什麼:與其他事物分隔開來並且具有不同屬性的事物。

相比之下,機器完全不知道這些。

因此Dubey團隊重新設計了這款遊戲,使先驗信息變得不相關,然後測量我們完成遊戲需要多長時間。他們的假設是,時間的增加量可以反映該信息的重要性。

團隊人員解釋到,他們通過使用替代紋理重新渲染各種實體,如梯子、敵人、鑰匙和平臺等,創建了不同版本的視頻遊戲。他們選擇這些紋理來掩蓋各種形式的先驗知識,並且改變遊戲的物理屬性,比如重力的影響,以及遊戲人物與環境的交互方式。在每個版本中,遊戲的目標都是一樣的。

實驗結果還是值得引起關注的。Dubey團隊談到,刪除一些先驗知識會導致人類玩家完成遊戲的速度急劇減慢。事實上,刪除不同種類的先驗信息後,人類完成遊戲所需的時間都有所增加,從1分鐘到超過20分鐘不等。

相比之下,刪除這些信息對機器算法學習速度並沒什麼影響。

該團隊甚至可以通過刪除某類信息後所引起完成遊戲時間增加,來排列不同類信息的重要性。去除諸如兇巴巴的表情和火焰符號這樣的對象語義後,人類需要花更長時間才能完成遊戲。但將“物體”這個概念隱藏起來也會帶來諸多不便,許多Turker玩家拒絕玩該遊戲。Dubey團隊表示,為了鼓勵參與,他們不得不把被試的報酬提高到2.25美元。

這個排名和人類學習方式之間的聯繫很有趣。心理學家發現,在兩個月大的時候,嬰兒擁有一種原始的物體的概念,他們認為物體會以整體連接的形式移動。但在這個年齡段,嬰兒不會識別物體所屬的類別。

3到5個月大的時候,嬰兒學會識別物體類別;18到24個月的時候,嬰兒學會識別單個物體。也是在這個時候,嬰兒也開始學習物體的屬性(用心理學家的話來說,就是客體的動作承載性),嬰兒由此開始知道平坦路面上的臺階可以踩,而懸崖的邊緣則不能。

事實證明,Dubey團隊的實驗排列這種習得的信息的方式同嬰兒學習的順序一致。他們表示:“有趣的是,嬰兒知識的增加順序與不同先驗對象的重要性相匹配。”

他們還認為:“這項工作僅僅是個開始,我們希望通過實驗量化人類在解決視頻遊戲時使用的各種先驗知識的重要性,並且理解先驗知識如何使人類善於處理這類複雜的任務。”

這為計算機科學家開發機器智能提供了有趣的途徑——利用人類從小就獲得的基礎知識來編譯機器的算法。這樣的話,機器就可以趕上人類的學習速度,甚至可能超越人類。

本文原刊自《麻省理工科技評論》中英文APP。


DeepTech深科技

人工智能是模擬人的思維模式,具有人的意識,但是目前人工智能受科技水平的影響還沒有達到真正意義上的智能。就目前來講還是人的學習速度快,因為學習的過程並不是大腦輸入和輸出的過程,需要一定的認知,對比,邏輯思維,而且受環境影響。


分享到:


相關文章: