蒙特卡羅算法和人工智慧

公元20世紀初期,儘管實驗次數數以千計,利用蒙特卡羅方法所得到的圓周率π值,還是達不到公元5世紀祖沖之的推算精度。這可能是傳統蒙特卡羅方法長期得不到推廣的主要原因。

什麼是蒙特卡洛樹搜索

蒙特卡洛樹搜索(MCTS)是一種在人工智能問題中進行決策優化的方法,通常是對於那些在組合遊戲中需要移動規劃的部分。蒙特卡洛樹搜索將隨機模擬的通用性與樹搜索的準確性進行了結合。

蒙特卡羅樹搜索大概可以被分成四步。選擇(Selection),拓展(Expansion),模擬(Simulation),反向傳播(Backpropagation)。

蒙特卡羅算法和人工智能

總體說來,蒙特卡洛就是拿一堆點去模擬一個概率密度分佈,這樣原來概率密度分佈的不確定性就被一堆確定的點所代替。蒙特卡洛的優點很明顯,簡單,計算準確;缺點就是計算的速度慢,收斂慢。用的點越多,對概率密度分佈的模擬就越好,得到的結果就越準確,每一個點都得算一遍啊,所以工作量會及其的大。

圍棋的棋盤,對於AI來說,可以用四個字來形容,叫做浩若煙海。鬼神莫測,變化無窮。

對於特定博弈的領域知識通常會在進行模擬的階段被開發出來,這樣得到的推出或決策(playout)會與人類的選手的動作更加相似。這意味著推出的結果會變的比隨機模擬更加的真實並且節點會在更少的迭代後產生真實可靠的估值。

特定的領域知識提升方法往往需要知道當前博弈已知的一些技巧,如圍棋中的捕捉動作或者六貫棋中的橋指令。它們對當前博弈有巨大的提升效果,不過同時也犧牲了通用性。

蒙特卡羅算法和人工智能

“機器人”與圍棋高手的對決,曾被稱為人工智能的“阿波羅計劃”,因為圍棋有19×19=361個方格,棋手的每一步棋都有361種選擇,一局150個回合出現的選擇多達10170種。難度對於人工智能來說非常大。

但是,蒙特卡洛樹搜索算法,是在海量樣本中找到最佳解決方案(而非唯一解決方案)的算法;它是Google AlphaGo(Master)的核心之一,其價值在於能夠讓人工智能的神經網絡持續地在“勝率”較高的地方推演棋局(而非暴力搜索),以此大幅降低運算量,並判斷在哪裡下子贏的概率會高。

蒙特卡羅方法MCM也稱統計模擬方法,是以概率統計理論為指導的一類非常重要的數值計算方法。是指使用隨機數(或更常見的偽隨機數)來解決很多計算問題的方法。蒙特卡羅方法MCM通過構造符合一定規則的隨機數來解各種實際問題。在金融工程學,宏觀經濟學,計算物理學(如粒子輸運計算、量子熱力學計算、空氣動力學計算)以及人工智能之機器學習等領域應用廣泛。

蒙特卡羅算法和人工智能

尚學堂12大精英團隊+各類實戰項目,真正實現1+1>10的目標效果。幫助學員迅速成長,持久騰飛,成就學員“高富帥”人生;幫助企業技術和團隊成長,成就百年中華名企;助力中國持續成為世界強國而貢獻力量。尚學堂12大精英團隊,覆蓋IT行業十大領域,實戰團隊240人,服務學員累計超過10萬人,就業合作企業數量500+。


分享到:


相關文章: