比圍棋還複雜的星際爭霸,AI怎麼玩

科技日報記者 唐芳

圍棋AI華麗落幕,巨頭轉戰星際爭霸AI。遊戲一直是衡量人工智能水平的重要指標。

近日,實時戰略遊戲AI比賽中的重磅競賽——2018 AIIDE國際星際爭霸人工智能競賽結果出爐。全球27支團隊在12臺計算機上大戰兩個星期,每個機器人大約參與了2600場比賽,每兩個機器人之間打了100場比賽,總計3萬多局車輪戰後,前三甲花落韓國三星的SAIDA、美國Facebook的Cherry Pi以及我國中科院自動化研究所的CSE。

比圍棋還複雜的星際爭霸,AI怎麼玩

去年,製作Alpha Go的公司谷歌 DeepMind宣佈,他們接下來會把星際爭霸作為研究平臺。同年,Facebook AI實驗室也開始研發星際爭霸AI。巨頭緣何迷上1998年就誕生的經典即時戰略遊戲——星際爭霸?

硬編碼奪魁,但還不敵專業玩家

星際爭霸AI大賽由來已久。2010年起每年舉辦一次,主辦方是紐芬蘭紀念大學的大衛·丘吉爾,贊助方是谷歌 DeepMind、Facebook等多家中外知名機構。AI機器人在《星際爭霸:母巢之戰》遊戲中互相廝殺,最終比賽結果按照整體勝率排序。

季軍團隊張俊格教授介紹,AIIDE規定,參賽機器人通過BWAPI訪問遊戲,每個參賽選手無法通過任何途徑作弊。比賽開啟戰爭迷霧,儘量接近人與人對戰的真實情況。參賽機器人的運行速度不可超時,否則被判為輸掉比賽。

“成為第一個打贏人類職業選手的機器人!”胸懷偉大夢想的韓國三星機器人SAIDA奪魁,該團隊嘗試過機器學習技術,但最終採用非機器學習的硬編碼技術。張俊格介紹,三星公司曾經擁有星際爭霸職業戰隊,在獲取專家知識上存在優勢,去年通過內部編程競賽決出最優異員工,今年1月開始打造SAIDA,目標直指世界冠軍。

去年,傲視群雄的獨立業餘玩家佔參賽選手的一半,今年卻罕見身影。原來,第二名Cherry Pi背後的機構Facebook AI實驗室,聘請了去年競賽排前幾名的若干頂級作者到他們團隊。

中科院自動化所智能系統與工程研究中心開發的CSE獲得季軍。該中心為自動化所獨立建制的科研部門,致力於研究博弈對抗與自主進化智能,包括感知智能與認知決策智能。

“當前AI玩遊戲的主要研究方向是深度強化學習算法。”張俊格表示,這類算法還能用在機器人、自動駕駛領域,“從長遠來看,它更是通往通用人工智能的重要基礎。”未來逐漸成熟的AI技術,將在製造、金融、物流等諸多行業得到重要應用。

難度遠勝圍棋,AI看不清的迷局

AI玩星際爭霸比下圍棋複雜在哪兒?簡單來說,谷歌DeepMind的阿爾法狗即使在圍棋領域戰勝世界冠軍柯潔,在星際爭霸領域也暫時沒有任何對外公開的成果。張俊格表示,衡量一個遊戲的複雜性主要取決於觀測空間、動作空間以及是否能觀測到全部信息。“從這個角度,《星際爭霸》遠超圍棋複雜度。”

觀測空間上,星際爭霸觀測的是整個屏幕中顯示遊戲內容的區域,以及小地圖上的區域,每個像素都是觀測空間的一部分,每個像素又蘊含很多信息,如是否在戰爭迷霧範圍內、當前時間點哪個兵種或建築覆蓋了哪個像素。圍棋的觀測空間只有棋盤361個擺放棋子的位置,每個位置只有黑子、白子、無子三種狀態。

動作空間上,星際爭霸的鼠標可在屏幕任意位置點擊、框選,並對框選單位執行復雜操作。圍棋只能在棋盤上沒有棋子的線與線交叉的點上放棋子。

“由於戰爭迷霧的存在,玩家無法看到距離己方單位超過一定範圍或被障礙物遮擋的場景信息。” 張俊格表示,星際爭霸不可以觀測到全部信息。玩家視角只有主視角以及小地圖上的有限信息,獲取全部的信息要點擊小地圖或編屏、切屏。即使學會這些技巧,依然無法獲得某一時刻戰場上的全部信息,“信息缺失迫使玩家時常偵查、猜測對手採取了哪種策略。”反觀圍棋,整個棋盤對棋手雙方都是可見的、是全部可觀測的。星際爭霸是部分可觀測的,屬於不完全信息博弈。


分享到:


相關文章: