在《星際爭霸2》遊戲中，人工智能成為了大師級玩家游戲頭條網

上圖《星際爭霸2》是一款頗受歡迎的電腦遊戲，玩家可以在遊戲中看到對手建造文明，並與外星鄰居作戰。攝影：DeepMind /自然。

人工智能系統已達到星際爭霸2 (StarCraft II)的最高級別，這是該領域的里程碑式成就。星際爭霸2是一款極其複雜、廣受歡迎的電腦遊戲。

在這款遊戲中，DeepMind的AlphaStar比99.8%的註冊人類玩家表現得更好，達到了大師級的水平。

經過44天的訓練，人工智能系統掌握了這款遊戲。訓練包括從最優秀人類玩家的遊戲記錄中學習，然後與系統自己進行對抗，並且和前一系統版本進行對比迭代。

DeepMind研究員大衛•西爾弗(David Silver)表示：“AlphaStar已成為首個在任何職業電子競技比賽中、在完全不受限制的情況下、在職業許可的條件下，達到了人類最高水平的人工智能系統。”

自從《星際爭霸2》在2010年發佈以來，已經有超過3100萬美元的獎金從數以千計的電子競技比賽中發放出來。玩家從少量的工人單位開始，他們可以收集資源，建造建築，開發新的單位和技術，並執行偵察任務來獲取對手的情報。頂級玩家需要短期和長期的戰略來發展和保衛他們的基地，同時也要摧毀對手。更復雜的是，玩家無法看到整個遊戲的“地圖”，所以只能根據部分信息做出決定。

“自從電腦破解了圍棋、國際象棋和撲克，星際爭霸遊戲成為人工智能的下一個重大挑戰，”西爾弗說。“它被認為是人類能力極限的遊戲。”

DeepMind創造了AlphaStar這個“代理人

”，AlphaStar可以扮演遊戲中的每個種族，即神族、人族和蟲族。每個種族都有不同的能力和技術，這有利於不同的防禦和進攻戰略。AlphaStar最初是通過觀察頂級人類玩家的遊戲來學習基礎知識的。然後，它進入“阿爾法之星聯盟”(AlphaStar league)，在那裡，它不僅與自己對弈，還會扮演探索者，與自己較弱的人工智能版本對弈。訓練確保了AlphaStar成為一個強大的對手，對抗所有三個種族和每一種戰略。

DeepMind團隊限制了AlphaStar的能力，比如確保它不能以超人的速度移動。事實證明，這對人工智能的成功至關重要，因為它不僅要通過速度打敗人類，還必須學會玩遊戲的長期戰略。該項目的首席研究員奧里奧爾·維尼亞爾斯(Oriol Vinyals)表示，像AlphaStar這樣的人工智能有可能被用於改進個人助理、自動駕駛汽車、天氣預報和氣候模型。這項研究發表在《自然》科學雜誌上。

加州大學伯克利分校的計算機科學教授丹·克萊因(Dan Klein)沒有參與這項研究，但他表示，這是一項由關鍵技術推動的令人興奮的成就。他說：“《星際爭霸》作為人工智能測試平臺的偉大之處在於，

它所有的複雜性同時發生。”

謝菲爾德大學人工智能和機器人技術榮譽教授諾爾•夏基(Noel Sharkey)表示，儘管DeepMind表示，它將永遠不會參與軍事工作，而星際爭霸2也不是一個現實的戰爭模擬，但軍方肯定會對研究結果感興趣。今年3月，美國政府的一份報告描述了人工智能如何豐富了戰場模擬，並允許戰爭玩家評估不同戰術的潛在結果。

軍事分析人士肯定會把成功的AlphaStar實時戰略視為人工智能在戰場規劃方面優勢的一個明顯例子。但這是一個極其危險的想法，有可能造成人道主義災難。AlphaStar在一個特定的環境中從大數據中學習策略。來自敘利亞和也門等衝突的數據太少，沒有用處。

正如DeepMind在最近的一次聯合國活動中所解釋的那樣，這種方法對武器控制來說將是非常危險的，因為這些行動是不可預測的，而且可能以意想不到的方式發揮作用。這顯然違反了有關武裝衝突的法律。”

分享到:

閱讀更多 木法沙和三傻 的文章

關鍵字: 電腦星際爭霸圍棋