DeepMind星際2 AI擊敗99.8%人類玩家!AlphaStar登上Nature雜誌

距離星際爭霸2官方宣佈人工智能“AlphaStar”正式登陸游戲天梯已經過去三個多月,對於這位非人類選手的數據狀態,“放養者”谷歌DeepMind一直顯得死氣沉沉,未發佈任何聲明報告。

DeepMind星際2 AI擊敗99.8%人類玩家!AlphaStar登上Nature雜誌

然而就在人類玩家們沾沾自喜以為“AlphaStar”這隻“雞”涼掉了的時候,今日最新一期《Nature》雜誌上刊登的一篇論文打了大家的臉:“AlphaStar”在戰網上的排名已超越99.8%的活躍玩家,其三個種族(人族、異蟲、星靈)都打進了地區前200名,也就是我們常說的“宗師”分段。

DeepMind星際2 AI擊敗99.8%人類玩家!AlphaStar登上Nature雜誌

AlphaStar與此前有何不同?

在 DeepMind 的相關博客中,講述了本次研究的四大更新進展:

一、AlphaStar 是通過與人類相同視角的攝像頭來觀察遊戲地圖,對AI的動作頻率限制更為嚴格;

二、AlphaStar 可以用人蟲神三大種族進行1v1對抗;

三、AlphaStar 訓練自動化,不再是從以往的強化學習過的智能體開始,而是從監督學習的智能體開始訓練;

四、AlphaStar 在天梯使用與人類玩家一樣的地圖,在對等條件下進行遊戲。

AlphaStar的訓練過程

論文中展示了AlphaStar的多主體增強學習算法:在該算法中,若干深度神經網絡主體相互競爭,生成大量的持續適應性策略和對策。

DeepMind星際2 AI擊敗99.8%人類玩家!AlphaStar登上Nature雜誌

比如在下方圖片中,開始的藍色方是需要贏的智能體對象,而紅色方則是一個陪練的角色 (Exploiter) ,它不負責贏,但需要幫助核心智能體(藍色方)暴露問題,讓它變得更強。

我們可以把紅色方看做是正在地堡Rush“Jim大神”,一開始他把藍色方的“Zest”修死了

DeepMind星際2 AI擊敗99.8%人類玩家!AlphaStar登上Nature雜誌

然而在訓練過程中,一位名為“Stats”的綠色方學到了如何防守紅色方的地堡Rush。

DeepMind星際2 AI擊敗99.8%人類玩家!AlphaStar登上Nature雜誌

接著,綠色方能通過經濟優勢與兵種組合來擊敗藍色方了,“Zest”你死的好慘啊....

DeepMind星際2 AI擊敗99.8%人類玩家!AlphaStar登上Nature雜誌

然而最後,擁有不動如山防守的綠色方“Stats”,被一位新陪練:棕色方的“sOs”,通過一個正常開的隱刀戰術所擊敗。

DeepMind星際2 AI擊敗99.8%人類玩家!AlphaStar登上Nature雜誌

就像這樣,多個智能體在相互競爭和協調合作的複雜環境中反覆循環,AlphaStar變得越來越強大。

AlphaStar的未來

在論文發表後,人們都很想知道已經躋身頂級玩家行列的AlphaStar下一步要幹什麼?DeepMind CEO哈薩比斯表示:“星際爭霸15年來一直是AI研究人員面臨的巨大挑戰,非常榮幸看到這項工作被《自然》雜誌認可,我們正在以利用人工智能(AI)加速科學發現的道路上繼續邁進。”

DeepMind也在博客中表示,AlphaStar的研究結果證明了通用學習技術可以擴展AI系統,它們能夠在涉及多個參與者的複雜動態環境下工作。

AlphaStar的研究歷程

早在2016年暴雪嘉年華現場,谷歌研究科學家Oriol Vinyals就登臺簡述了有關谷歌Deepmind人工智能與《星際爭霸2》緊密合作的最新進展及未來的計劃。他透露,谷歌正在研製新一代的人工智能,將在未來的《星際爭霸2》中為玩家、甚至是全人類帶來幫助,以及像不久前Alpha Go與人類對弈圍棋一樣,和人類挑戰《星際爭霸2》。

DeepMind星際2 AI擊敗99.8%人類玩家!AlphaStar登上Nature雜誌

Oriol Vinyals向玩家說明了為什麼會選擇星際2,因為星際2是當今世界上最複雜的一款即時戰略遊戲,運營流程、戰術運用、戰爭迷霧和針對、應激性操作這些不僅難度高,而且不像圍棋那樣套路固定,它需要根據對手的情況作出不同的改變。就如同搏擊一般,招數只能讓你掌握基礎,而實戰的千變萬化則需要你通過經驗的積累和紮實的基本功來千變萬化。

所以對於DeepMind團隊來說,這款遊戲作為人工智能研發平臺再適合不過了,人工智能在未來現實生活中想要幫助人類解決情況,自然會有許多難以預測的突發情況,所以它們必須要既作出正確的對策,還要根據實際情況細微的調整對策。

DeepMind星際2 AI擊敗99.8%人類玩家!AlphaStar登上Nature雜誌

DeepMind選擇星際2作為研究的原因:戰爭迷霧、操作空間、經濟運營、及時性遊戲、大局觀、三個不同種族的互相對抗

谷歌的Deep Mind人工智能團隊將會在未來把遊戲列為研究的重要環節,相對於之前他們研發出的Alpha Go人工智能挑戰人類圍棋更多的是在信息收集上的技術。暴雪日後將開放分享《星際爭霸2》的AI技術,供全世界科學家共同研究開發。

而在未來,谷歌將針對遊戲《星際爭霸2》開發新的人工智能,這種人工智能也會像世界頂級的職業選手發展挑戰,重現圍棋人機對決的一幕。與之前Alpha Go不同的是,未來《星際爭霸2》的人工智能,將不僅僅是對抗,而是旨在輔助玩家能夠把遊戲玩的更好,為玩家和選手提升自身的實力水平提供幫助。未來的星際爭霸AI,將用於實現現實世界在科技領域的發展和便利,成為人類日常生活中的好幫手。

DeepMind星際2 AI擊敗99.8%人類玩家!AlphaStar登上Nature雜誌

2017月8月,《星際爭霸2》開發團隊正式公佈了研究的最新進展:《星際爭霸2》API(人工智能研究方向)現已推出,研究人員、遊戲玩家以及業餘愛好者可以共同使用這套由暴雪開發的機器學習框架,來對AI進行研究和訓練,並最終加速實時戰略遊戲AI的研究。此外暴雪也宣佈,會挑選出十萬份匿名玩家的天梯比賽錄像,以此來作為AI模仿訓練的數據支撐。

此次舉措意味著即使你不是科學家,而只是一個星際2玩家,也可以自己動手來構建任務與模型來解決目前AI研究方向挑戰,並最終在遊戲裡來給暴雪提供反饋數據,協助星際2的AI學習提高。

最後谷歌聲明,感謝暴雪提供的百萬份天梯比賽錄像,目前研發的自主學習AI尚處初級階段,甚至在完整地圖中,連腳本程式的簡單電腦都打不過。而執行微操與預判戰術只能在小地圖中完成,並且需要耗費大量時間運算才能進行下一步。

DeepMind星際2 AI擊敗99.8%人類玩家!AlphaStar登上Nature雜誌

而在《星際爭霸II》的研究環境工具公佈的幾個月後,AlphaGo Zero創造者Julian Schrittwieser在 Reddit 上進行了網友答問活動上提出:星際爭霸2比圍棋更具挑戰性。

DeepMind星際2 AI擊敗99.8%人類玩家!AlphaStar登上Nature雜誌

網友:你們覺得圍棋與《星際爭霸II》誰的研究難度更大?最大的潛在技術障礙是什麼?我們期待的正式更新什麼時候能出來?

Julian Schrittwieser:我們開放《星際爭霸II》的研究環境才過了幾個星期,所以現在還處於早期階段。星際爭霸的行動空間毫無疑問要比圍棋更具挑戰性,而且需要觀測的空間也要大得多。從技術角度而言,我認為最大的難點區別就是圍棋是一個處於在完全的信息展示環境下的遊戲,而星際爭霸由於有著戰爭迷霧,所以信息情報並不完美。

依照研究人員所說,此時的《星際爭霸II》AI尚處在早期階段,它的研發難度比圍棋更大。而在 AlphaGo Zero 誕生後,我們希望谷歌能以此為契機,在《星際爭霸II》AI研究上再做突破。

DeepMind星際2 AI擊敗99.8%人類玩家!AlphaStar登上Nature雜誌

直到2018年6月,DeepMInd才宣佈了研究的最新進展,他們用關係性深度強化學習在星際2六個模擬小遊戲(移動、採礦、建造等)中達到了當前最優水平,其中四個超過人族天梯大師組玩家。

2019年一月份,暴雪與谷歌DeepMind團隊合作研究的星際爭霸2人工智能“AlphaStar”正式通過直播亮相,在與人類職業選手對決的11場比賽中,AlphaStar憑藉 10勝1負 的戰績大勝人類引起了社會各界的廣泛關注。

DeepMind星際2 AI擊敗99.8%人類玩家!AlphaStar登上Nature雜誌

鞭個屍,兩位在 AlphaStar 征服人類前倒下的最初失敗者:TLO、MaNa,歷史會銘記他們。

DeepMind星際2 AI擊敗99.8%人類玩家!AlphaStar登上Nature雜誌

而在今年七月份,星際爭霸2官方放出重磅消息:AlphaStar將登陸歐服戰網,匿名“走進”天梯匹配,與人類玩家進行對戰並回收數據,以助於 DeepMind 的進一步研究。時隔一個月,坐鎮歐服的領軍人物,星際第一人 Serral 發文:

我很確定確信幾天前我搜到過 AlphaStar,它就是來搞笑的。

DeepMind星際2 AI擊敗99.8%人類玩家!AlphaStar登上Nature雜誌

八月底在公佈的AlphaStar對陣職業選手的錄像中,AlphaStar(T)在與Serral(Z)對決16分鐘後依舊不敵。現如今,AlphaStar已經是一位牌面十足的宗師組選手,接班俠也期待未來它能在 Serral 身上找回場子,成功復仇!


分享到:


相關文章: