DeepMind《星際爭霸2》AI碾壓人類遭猛懟:通用智能就是空談

DeepMind《星際爭霸2》AI碾壓人類遭猛懟:通用智能就是空談

針對DeepMind前幾日發佈的《星際爭霸2》智能體AlphaStar進化版,他在Twitter再次提出了自己的質疑。不過這次,Marcus的質疑點並不是AlphaStar遊戲表現本身,而是指向了更高的層面:對未來通用智能研究的意義。

DeepMind《星際爭霸2》AI碾壓人類遭猛懟:通用智能就是空談

Marcus在Twitter上表示:

DeepMind最近的《星際爭霸2》 AlphaStar取得了很不錯的結果,但這能稱得上通向通用智能的重要一步嗎?這裡有幾個問題:

DeepMind《星際爭霸2》AI碾壓人類遭猛懟:通用智能就是空談

星際爭霸要比Atari遊戲難得多,這次DeepMind推出的新版Alphastar性能比1月份那版強力了很多,與真實世界中的玩家實現了複雜場景交互中的對戰。但是:


1、在不經修改的情況下,AlphaStar能制霸其他遊戲嗎?雖然AlphaStar的雛形繼承了擊敗圍棋世界冠軍的AlphaZero,但此次發佈的模型是高度結構化的,其中單位、表示和訓練域等要素都是高度針對《星際爭霸2》開發並調試的。

2、對AlphaStar專有模型的訓練,能否降低和《星際爭霸2》類似的策略遊戲AI的訓練時間?比如《魔獸爭霸3》?人類玩家是可以進行這種跨遊戲的“經驗轉移“的。

3、遊戲內的AlphaStar對於不同地圖、不同種族都能勝任嗎?人類玩家至少會擅長多張地圖和不止一個種族。

4、只憑借大量人類精英玩家生成的數據,AlphaStar的未來迭代版本還能保持成功嗎?系統所需的大量“replay”數據在現實世界中可能很難獲取。

5、人類專業知識對於AlphaStar有多重要?2017年,DeepMind推出了AlphaZero因為宣稱“無需任何人類知識”而引發大量關注,此次AlphaStar的成功離不開在《星際爭霸2》的人類知識和真人對戰的演示視頻。也許現在是時候承認人類知識的重要價值了。

6、在《星際爭霸》領域表現優異的AlphaStar,能否同樣在其他開放端領域同樣出色?如自然語言理解,該領域的句子範圍基本上是無限的。

和上一次對OpenAI魔方機器手的“開炮”相比,本次的6點問題在語氣上和深度上都弱了不少。產生的影響似乎也沒有上次那麼廣泛了。畢竟DeepMind這次發佈的AlphaStar是一款遊戲AI,對於泛化性能也不是重點,只是在博客中提了一嘴。

從Twitter的網友回覆中,也可以看出這一點。大部分網友認為Marcus說的有一定道理,但其實DeepMind在博客中已經承認,不利用人類的先驗知識,幾乎是不可能成功的。

DeepMind《星際爭霸2》AI碾壓人類遭猛懟:通用智能就是空談

還有網友表示,其實星際爭霸這個遊戲,精通多個種族可不是一件容易的事情,比如他自己,就只會玩人族,其它兩個種族就是菜。

DeepMind《星際爭霸2》AI碾壓人類遭猛懟:通用智能就是空談

還有網友提出了新的問題:AlphaStar對戰鬥單位的強度修正(加強和削弱)的變化能做出有效應對嗎?如果一些單位完全被移除,又會出現什麼情況?

DeepMind《星際爭霸2》AI碾壓人類遭猛懟:通用智能就是空談

不過,這條Twitter目前為止熱度一般,回覆和討論比前些日子Marcus質疑OpenAI"魔方機械手”時的熱度差了不少。

到目前為止,DeepMind還沒有做出回應。



DeepMind的《星際爭霸2》遊戲AI “AlphaStar”碾壓99.8%人類玩家

接下來給大家補充一下劇情,馬庫斯這次質疑的DeepMind研究到底是什麼。

今年1月,DeepMind的《星際爭霸2》遊戲AI “AlphaStar”初級版本的發佈曾引發廣泛關注。當時AlphaStar使用神族挑戰了《星際爭霸2》中的兩個專業玩家並獲得了勝利。

時隔9個多月,AlphaStar進化成為完全版,並實現了在戰網真實對戰中的宗師級水平,分位超過了99.8%的人類玩家。刊載相關成果的論文已發表在Nature上。

DeepMind《星際爭霸2》AI碾壓人類遭猛懟:通用智能就是空談

論文地址:

https://www.nature.com/articles/s41586-019-1724-z

DeepMind在近日發佈了博客中特意將新版AlphaStar與舊版做了對比。具體來說,此次的“完全體AlphaStar”與舊版有4點主要區別:

1、 AlphaStar現在和人類在相同的限制條件下游戲,包括通過攝像頭觀察世界,對其動作操作頻率也作出了更嚴格的限制,不會再發生APM高到離譜的現象。

2、 AlphaStar現在可以使用遊戲中三個種族(人族、蟲族、神族)的任意一種與人類玩家進行1v1對戰,而不是像1月份時那樣只會用神族。使用每個種族的智能體都是一個單獨的神經網絡。

3、 智能體在戰網中的訓練是完全自動化的,開始只由監督學習訓練,而不像原來那樣憑藉過去的遊戲經驗進行訓練學習。

4、 此次AlphaStar在暴雪官方戰網和遊戲服務器上進行遊戲,使用的是和人類玩家相同的地圖和條件。

DeepMind表示,新版AlphaStar智能體採用通用機器學習技術,包括神經網絡、通過強化學習的自對戰、多智能體學習、模仿學習等技術。利用這些技術,新版AlphaStar的遊戲水平超過了戰網99.8%的活躍玩家,使用三個種族都拿到了宗師級稱號。



馬庫斯:深度學習懷疑論者,曾質疑OpenAI“單手解魔方”

DeepMind《星際爭霸2》AI碾壓人類遭猛懟:通用智能就是空談

Gary Marcus

加里 · 馬庫斯 (Gary Marcus) 是一位科學家、暢銷書作家和企業家。他是 Robust.AI 公司的創始人和首席執行官,Geometric Intelligence 公司 (2016 年被優步收購) 的創始人兼首席執行官,出版著作包括《代數思維》、《怪誕腦科學 (Kluge)》、《思維的誕生》等,最新著作是與 Ernest Davis 合著的《Rebooting AI : 構建我們可以信任的人工智能》。

馬庫斯也是著名的深度學習懷疑論者。作為認知心理學家,他一直高調參與人工智能辯論,與 Yann LeCun、AAAI 前主席 Thomas Dietterich 等 AI 大牛都展開過激烈辯論。

他曾撰文批判深度學習 (Marcus, 2018), 稱深度學習實際上並沒解決什麼問題。這篇文章引起了人工智能圈極大的反響,幾天之內,成千上萬的人在推特上發表了自己對這個問題的看法,有些人熱情支持馬庫斯的論點(例如,“這是我多年來讀到的有關深度學習和 AI 的最好的觀點),有些相反(例如,“有思考...... 但大部分都是錯誤的”)。

在那篇批判深度學習的文章中,馬庫斯概括了深度學習的十大挑戰,直言深度學習本身雖然有用,但它不可能實現通用人工智能。他建議把深度學習視為 “一種非普遍的解決方法,而只是一種工具。”

他說:“相比純粹的深度學習,我呼籲混合模型,不僅包括深度學習的監督形式,還包括其他技術,例如符號處理(symbol-manipulation),以及無監督學習(它本身也可能被重新概念化)。我也敦促社區考慮將更多的內在結構納入 AI 系統。”

就在前不久,馬庫斯對OpenAI“單手解魔方”提出質疑,認為 OpenAI 還原魔方的博客內容存在誤導性,並表示:“鑑於 OpenAI 仍然沒有更改關於 “解決魔方” 的誤導性博客帖子 (博客標題是 “Solving Rubik’s Cube with a Robot Hand),所以我附上了詳細的分析,將他們的說法和暗示與實際所做的進行了比較。依我之見,這些誤導性對大多數對非專業人士來說並不明顯。”

DeepMind《星際爭霸2》AI碾壓人類遭猛懟:通用智能就是空談

馬庫斯對 OpenAI“解決魔方” 的 7 條質疑如下:

1、這不是神經網絡解決的;而是有 17 年曆史的符號算法做到的。

2、這種算法是先天的,而不是學習的。

3、強化學習在選擇轉向哪個方向 (即大多數人所說的解決了魔方) 時不起作用。

4、所學到的是物體操縱,而不是解魔方。

5、只有一個物體被操縱,並且沒有測試對其他對象的可推廣性。

6、該物體裝配了大量儀器 (如藍牙傳感器),機器手也安裝了 LED。

7、成功率只有 20%;魔方經常從機器人手中掉落。

他說:“我強調一下,這個成果本身給人留下了深刻的印象,但描述有誤導,更恰當的標題應該是’用強化學習操縱魔方’或‘靈巧的機器人手操縱物體的進展” 或類似的句子。”

OpenAI 聯合創始人、機器人團隊負責人 Woj Zaremba

注意到馬庫斯的帖子,反駁道:

1. 你的前三個論點是一樣的。

2. 泛化是從模擬到現實,而不是從一個物體到另一個物體。

3. 我們沒有裝配儀器得到的結果稍微弱一些。

4. 你確信我們不會將性能提升到 100% 嗎?

馬庫斯回應道:

1. 我的前兩個論點完全不同:先天性≠象徵性。這些是不同的。第三個論點有一點重疊,但並不明顯。

2. 我當然知道,但是為了穩健性,你需要推廣到新物體上

3&4:我期待看到其他結果;我相信你們最終會做得更好。

儘管是馬庫斯率先提出質疑,但不少人的回覆並不贊同馬庫斯的說法,有人回覆道:

“這是一個有缺陷的批評,基於對魔方的誤解。魔方不是像圍棋那樣是一種可以學習的任務,而是需要記憶解法和熟練操作的任務;人類玩魔方也遵循一種算法。”

馬庫斯仍表示:總的來說,他們 (OpenAI) 沒有對我的觀點做出回應,我的觀點是那篇博客的框架與論文的內容不相符合,雖然我同意這個工作很重要,但炒作是有誤導性的。

抱著質疑和批判的態度去看待每一項研究,你支持馬庫斯嗎?

校對:黃利

— 完 —

關注清華-青島數據科學研究院官方微信公眾平臺“THU數據派”及姊妹號“數據派THU”獲取更多講座福利及優質內容。


分享到:


相關文章: