梅宏院士揭祕阿爾法狗的下棋思路!


阿爾法狗怎麼做的?

每一個棋,不管是中國象棋、國際象棋甚至我們的五子棋都有一個規則,而且有一個輸贏的標準。所以有這個東西我們實際上是可以建立規則,馬走日象走田一樣。我們形成了一個搜索空間,我們過去的做法都是用計算機去完成的空間的搜索,找出最可能贏的這麼一個套路。

這是過去的做法,按照這個套路計算機圍棋贏幾乎不可能。

梅宏院士揭秘阿爾法狗的下棋思路!

換一個思路大家想想,圍棋高手下棋,很多時候是棋感,對當時棋勢的把握,棋局的把握。很多高手直覺一來,他就知道下一個棋該到那兒,這就是棋感。

這件事情捅破以後,計算機怎麼做?相當於把圍棋盤黑白子變為一個圖片,那麼這件事情恰恰是計算機最擅長的,做圖像的匹配和識別。

所以就這麼一個紙的捅破,把過去完全是用規則的方式,把它變為一個圖像識別。我們做所有的智能,感知智能,我們人臉識別也好,指紋識別也好,再強大的人類高手,你要識別指紋都識別不過計算機。

首先,它是用的數據,這個數據就是人類不可能去想象出來。阿爾法狗用到的數據,三萬多幅人類專業棋手對決的棋譜,三千萬盤自我對弈的棋局。它用人類的棋譜,打譜學習,然後自己又和自己下棋,最新版的阿爾法狗Zero,用了490萬盤,自己和自己對弈。大家想想人類的棋手每年下多少?大概一千盤了不起,腦袋能記多少?再牛的人也記不了多少。

梅宏院士揭秘阿爾法狗的下棋思路!

微軟亞洲研究院鄭宇等人總結的Alphago原理圖

這個圖像一存在,這麼多幅同樣的圖像,差不多這個格局一出現的時候,這個圖像計算機快速一比對,就知道從概率上,下一步棋往哪兒走。

可以預測,在圍棋裡面你再怎麼樣,人類已經不可能贏過計算機了。


分享到:


相關文章: