輕鬆打敗世界級棋手!Facebook 開源 AI 圍棋源代碼

來自:開源最前線(ID:OpenSourceTop)

整編綜合自:田淵棟(知乎)、https://research.fb.com/facebook-open-sources-elf-opengo/


近日,Facebook AI Research(FAIR)正式宣佈開源基於 ELF 平臺創建的 ELF OpenGo,這是一款 AI 機器人,它已經擊敗了世界冠軍職業棋手。以下為博文內容:


輕鬆打敗世界級棋手!Facebook 開源 AI 圍棋源代碼


受 DeepMind 的啟發,今年早些時候,我們研究開發出了可擴展的、輕量級框架 ELF,期望達到 AlphaGoZero 最近的水平。目標是創建一個開源實現的系統,該系統可以自學圍棋並能夠打敗職業棋手。最後,通過發佈我們的代碼和模型,來激勵更多的人去思考這項技術新的應用和研究方向。

ELF OpenGo 已經成功打敗了其他開源機器人和人類棋手。我們對 LeelaZero(基於Deepmind最新論文的圍棋人工智能)進行了一系列的比賽(198 勝 2 負),2018 年 4 月 25 日),我們還擊敗了 4 位世界排名前 30 的圍棋棋手,14 勝 0 負的記錄。


輕鬆打敗世界級棋手!Facebook 開源 AI 圍棋源代碼


我們還對 2016 年 6 月首次發佈的ELF進行了改進,升級了更高效,更友好的 API 以及支持對數千臺計算機進行分佈式計算的框架。作為 PyTorch 的一部分,ELF 使研究人員能夠輕鬆嘗試不同的強化學習思想,並進行快速靈活的實驗。

如今 ELF OpenGo 已經取得了十分不錯的成績,但田淵棟博士在知乎上發表的一篇感想文章中提到:這個項目不是為了做最好的圍棋程序,不是說要打敗誰。我們做這個是因為以下三個目的:

(1) AlphaGoZero/AlphaZero算法很有意思,我們想知道為什麼它有效果,是怎麼會有效果的,是不是如同宣傳的那樣是百試百靈的通用算法,是不是隻要堆機器,強人工智能馬上就來了?還是說其實這個算法有什麼問題和弱點?DeepMind不開源也不透露細節,文章裡面一些地方也沒有寫得很清楚。我之前寫過Blog討論過,但是沒有第一手經驗總不是很踏實。所以本著研究目的,我們需要復現一下,先有復現,才有創新,這個是做研究的習慣。

(2) 今年年初我重寫了ELF的核心代碼,另外也加了分佈式訓練,需要找個具體應用來測試一下。站在這個角度上,AlphaGoZero/AlphaZero是個完美的選擇,再說之前也有DarkForest的代碼和圍棋程序的經驗,所以把它們拼起來不用花太多力氣。

(3) 不管是通用算法還是分佈式平臺,都可以用來幹很多別的事情,不一定是圍棋,不一定是遊戲。如果我們去看ELF OpenGo的代碼,會發現其實很大一部分和圍棋一點關係也沒有,完全適用於其它方向的工作。而圍棋對我們來說,只是一個把算法和平臺做好的手段。在這一點上,花點時間把圍棋做好是值得的。

田淵棟博士表示,隨著今天 ELF OpenGo 的發佈,這三個目的都已達到。當然,他們更希望的是能夠藉此機會推廣一下 ELF 平臺和 PyTorch 深度學習框架,讓更多的人使用和完善它。

代碼地址:https://github.com/pytorch/ELF


分享到:


相關文章: