06.26 團滅!馬斯克的OpenAI在5V5比賽中擊敗人類玩家

高層速讀

關鍵信息:OpenAI今日宣佈,一個由5個神經網絡組成的OpenAI Five,已經開始擊敗Dota 2的業餘玩家隊伍。利用強化學習,模型可以在沒有人類數據的情況下學到可識別的策略,在每秒30幀的遊戲中實時做出決定。可見馬斯克玩起遊戲來也不輸任何人, 玩得了火箭,開通的能了隧道,還能利用遊戲AI擊敗人類。

關鍵數據:OpenAI Five在256個GPU和128,000個CPU內核上進行訓練,每天需要玩180年之久的Dota 2遊戲來進行自我對戰學習。

關鍵意義:OpenAI Five的下一步目標是擊敗專業玩家隊伍。

團滅!馬斯克的OpenAI在5V5比賽中擊敗人類玩家

人工智能與人類的較量是計算機科學的一大傳統,幸運的是,我們還處在一個不是戰爭較量的遊戲階段。花費大量的時間和精力來研究AI如何在遊戲中打敗人類,似乎是一件沒有實際用途的怪事,但這一切都是AlphaGo和深藍把研究方向帶到這裡的延續:建造能夠在看似簡單的遊戲中擊敗人類的機器。

OpenAI一直在Dota 2遊戲中嘗試人工智能與人類玩家對弈的可能性。

OpenAI今日宣佈,一個由5個神經網絡組成的OpenAI Five,已經開始擊敗Dota 2的業餘玩家隊伍。在2017年,其人工智能在Dota2 1v1 比賽中戰勝了人類職業玩家 Dendi。

團滅!馬斯克的OpenAI在5V5比賽中擊敗人類玩家

埃隆•馬斯克與他人共同創立的這家創業公司旨在提高人們對人工智能技術的認識,以及科技行業如何能夠促進未來安全,並讓每個人都從中受益。

與國際象棋或圍棋這樣的回合制遊戲不同,Dota 2是一個需要大量實時決策的遊戲,儘管AlphaGo有時要花幾分鐘來決定如何應對一個精心設計的步驟,但OpenAI Five沒有那麼多奢侈的時間,因為它的對手在此期間也會採取行動。

團滅!馬斯克的OpenAI在5V5比賽中擊敗人類玩家

OpenAI說,這些遊戲的運行速度為每秒30幀,平均為45分鐘,最終產生了大約8萬幀圖像,OpenAI Five在256個GPU和128,000個CPU內核上進行訓練,與之前在1v1的比賽中所做的努力相比,這是一個由五個不同的神經網絡組成的團隊,共同作用於最優秀的人類對手。

團滅!馬斯克的OpenAI在5V5比賽中擊敗人類玩家

OpenAI對OpenAI Five給出了一些有趣的數據,特別是它如何通過每天玩180年之久的Dota 2遊戲來進行自我對戰學習。OpenAI Five為每個英雄使用單獨的一個LSTM,模型可以在沒有人類數據的情況下學到可識別的策略。這表明強化學習即使沒有根本性的進步,也能夠產生大規模但也可接受的長期規劃。

OpenAI Five的目標是在8月的Dota 2電子競技世界錦標賽上與人類玩家進行競爭,在那裡將進行全面的測試。此外,OpenAI將在下個月舉辦一場Twitter直播的Dota 2錦標賽,以展示它與頂級玩家競爭時的場景。


分享到:


相關文章: