在《星際爭霸2》遊戲中,人工智能成為了大師級玩家


在《星際爭霸2》遊戲中,人工智能成為了大師級玩家

上圖《星際爭霸2》是一款頗受歡迎的電腦遊戲,玩家可以在遊戲中看到對手建造文明,並與外星鄰居作戰。攝影:DeepMind /自然。


人工智能系統已達到星際爭霸2 (StarCraft II)的最高級別,這是該領域的里程碑式成就。星際爭霸2是一款極其複雜、廣受歡迎的電腦遊戲。

在這款遊戲中,DeepMindAlphaStar比99.8%的註冊人類玩家表現得更好,達到了大師級的水平。

經過44天的訓練,人工智能系統掌握了這款遊戲。訓練包括從最優秀人類玩家的遊戲記錄中學習,然後與系統自己進行對抗,並且和前一系統版本進行對比迭代。

DeepMind研究員大衛•西爾弗(David Silver)表示:“AlphaStar已成為首個在任何職業電子競技比賽中、在完全不受限制的情況下、在職業許可的條件下,達到了人類最高水平的人工智能系統。”

自從《星際爭霸2》在2010年發佈以來,已經有超過3100萬美元的獎金從數以千計的電子競技比賽中發放出來。玩家從少量的工人單位開始,他們可以收集資源,建造建築,開發新的單位和技術,並執行偵察任務來獲取對手的情報。頂級玩家需要短期和長期的戰略來發展和保衛他們的基地,同時也要摧毀對手。更復雜的是,玩家無法看到整個遊戲的“地圖”,所以只能根據部分信息做出決定。

“自從電腦破解了圍棋、國際象棋和撲克,星際爭霸遊戲成為人工智能的下一個重大挑戰,”西爾弗說。“它被認為是人類能力極限的遊戲。”

DeepMind創造了AlphaStar這個“代理人

”,AlphaStar可以扮演遊戲中的每個種族,即神族、人族和蟲族。每個種族都有不同的能力和技術,這有利於不同的防禦和進攻戰略。AlphaStar最初是通過觀察頂級人類玩家的遊戲來學習基礎知識的。然後,它進入“阿爾法之星聯盟”(AlphaStar league),在那裡,它不僅與自己對弈,還會扮演探索者,與自己較弱的人工智能版本對弈。訓練確保了AlphaStar成為一個強大的對手,對抗所有三個種族和每一種戰略。

DeepMind團隊限制了AlphaStar的能力,比如確保它不能以超人的速度移動。事實證明,這對人工智能的成功至關重要,因為它不僅要通過速度打敗人類,還必須學會玩遊戲的長期戰略。該項目的首席研究員奧里奧爾·維尼亞爾斯(Oriol Vinyals)表示,像AlphaStar這樣的人工智能有可能被用於改進個人助理、自動駕駛汽車、天氣預報和氣候模型。這項研究發表在《自然》科學雜誌上。

加州大學伯克利分校的計算機科學教授丹·克萊因(Dan Klein)沒有參與這項研究,但他表示,這是一項由關鍵技術推動的令人興奮的成就。他說:“《星際爭霸》作為人工智能測試平臺的偉大之處在於,

它所有的複雜性同時發生。”

謝菲爾德大學人工智能和機器人技術榮譽教授諾爾•夏基(Noel Sharkey)表示,儘管DeepMind表示,它將永遠不會參與軍事工作,而星際爭霸2也不是一個現實的戰爭模擬,但軍方肯定會對研究結果感興趣。今年3月,美國政府的一份報告描述了人工智能如何豐富了戰場模擬,並允許戰爭玩家評估不同戰術的潛在結果。

軍事分析人士肯定會把成功的AlphaStar實時戰略視為人工智能在戰場規劃方面優勢的一個明顯例子。但這是一個極其危險的想法,有可能造成人道主義災難。AlphaStar在一個特定的環境中從大數據中學習策略。來自敘利亞和也門等衝突的數據太少,沒有用處。

正如DeepMind在最近的一次聯合國活動中所解釋的那樣,這種方法對武器控制來說將是非常危險的,因為這些行動是不可預測的,而且可能以意想不到的方式發揮作用。這顯然違反了有關武裝衝突的法律。”


分享到:


相關文章: