柯潔對戰的國產圍棋AI“星陣”是什麼水平?

暈暈的Honeybaby

星陣其實已經出來下了很多盤棋,並不是太神秘了。星陣讓先對職業棋手勝率很高,水平是相當高的。但是也表現出一些不穩定,肯定沒有阿法狗水平高,也不如騰訊的絕藝。預計4月27日柯潔對星陣勝機很小,除非星陣出bug。

星陣主要的看點是,它表現出了和其它AI不一樣的特色,如可以動態貼目,局勢評估可以用領先的子數來表示而非勝率。星陣的開局和其它AI不太一樣,確實有自己的特色,如喜歡雙三三開局。

星陣在弈客上與開源的Leela-Zero下了七局,5:2獲勝。其中分先兩局2:0,另外五局也是分先,但是無論星陣執黑執白,第一手都要下在六線以上。星陣有三局下在了六六,兩局下了天元,初始勝率有所降低,但是這讓的肯定不到半個貼目。就這一點降低,讓它對Leela-Zero輸了兩局,感覺有些不穩定。Leela-Zero是模仿AlphaGo-Zero做的,靠愛好者眾籌算力訓練的,但是網絡層數要少不少,訓練盤數也明顯不足,徵子都還有問題,水平遠遠不如AlphaGo。星陣仍然會輸給Leela-Zero,說明還不夠強大。

但是這並不是說星陣不行,其實相對人類棋手是非常強大的。星陣在弈城上對職業棋手讓先下了30局,只輸了兩局,雖然是快棋,但也非常強大了。其中有樸廷桓、連笑等多位一線強手。星陣輸的一局是開局用錯了模板,前四手全都下到6線以上了,這局勢就落後太多了,這局可以說是操作失誤。

但星陣讓先輸給姜東潤的一局就確實暴露了明顯缺陷,開局角上戰鬥就吃了大虧:

星陣發生了誤算。白四子被徵吃。而且,黑粘在A7位,白為了活命還不得不再棄五子。這個局部下完白已經是崩潰了。

總的來說,星陣或者其它一流AI與人類高手下,讓先或者分先下,都是佔優的。但是能不能做到穩勝,就看出不出bug。如果勝率很高,但是偶爾還會出bug,就會認為開發還有缺陷。星陣應該還是屬於有缺陷的AI。目前沒有缺陷的只有AlphaGo,以及騰訊的絕藝,對人類連續多局不出錯,全部碾壓。絕藝還曾經對人類高手讓二子。

星陣的特色是,可以下讓先的棋,就是說可以把貼目從7目半調整為0。而其它AI多半隻能“讓手”,如讓對手先下一手或者二手,但是貼目仍然是7目半,因為估值神經網絡是按7目半的貼目來訓練的。

還有在覆盤時,星陣的後臺能告訴觀察者,它認為現在黑白雙方的差距是多少子,如6.4子(相當於盤面6目多的優勢)。這是比較人性化的,和人類棋手的點目有些相似。其它AI說目前黑白勝率是多少,雖然說也能看出局勢好壞,但人類就幾乎不太可能用勝率去評估局勢。


風雲學會陳經

第三次“人機大戰”結果已經揭曉,星陣圍棋執黑145中盤勝柯潔九段,星陣取得完勝,柯潔通盤沒有機會。

星陣圍棋是深客科技有限公司開發的圍棋人工智能程序,它的前身是清華大學研發的“神算子”,曾在比賽中戰勝世界冠軍孔傑九段。在賽前網上熱身中,星陣與職業棋手進行30盤讓先大戰,取得28 勝2負的佳績,對陣的棋手包括周睿羊、樸廷桓等世界冠軍。因此在本次賽前預測中,外界普遍認為柯潔戰勝星陣將是“小概率事件”。

星陣的前身神算子開發中特別注重深度學習算法上的研究和挖掘,而星陣的開發團隊也曾透露它的兩個特點:第一,星陣圍棋學習和借鑑了AlphaGo 的基本架構,但在特徵體系、模型結構、MCTS算法架構等方面有所創新,力爭用更少的計算資源和更少的訓練樣本完成模型學習,趕超人工智能圍棋的最高水平,比如可以下出更容易讓人理解和學習的圍棋,下出優勢下不退讓的圍棋,進行任意棋盤路數的對局,也可以進行任意貼目數的對局。我們知道,助力 AlphaGo打敗人類的是一大利器是強化學習技術,但星陣所用的技術卻另闢蹊徑,這是“星陣”超越 AlphaGo 的地方。第二,它由中國人工智能團隊傾心打造。

星陣這個有特點的名字其實是圍棋的別稱之一。圍棋棋盤有361個交叉點,中心點“天元”象徵著混元一周天的度數,棋盤上的九個星標座與易理八卦相通,整個棋局用黑白兩種符號組合排列,隱含太極陰陽。每顆棋子著在棋盤上,象徵星星在周天排列陣勢,借喻指圍棋。


天涯棋人

“星陣”開始出現在公眾視野中,也就是最近半個月的事情。對包括多名世界冠軍在內的一線職業棋手28勝2負,還全是讓先。對柯潔慢棋完勝。

這個水平應該是可以讓一線職業棋手兩子的水平。

因為大家對層出不窮的AI已經習慣了,所以輿論好像不怎麼驚訝,但其實“星陣”是很了不起的。

-

“星陣”的前身是“神算子”,是清華大學由小川教授團隊開發的圍棋AI,仿效了AlphaGo的模型,也屬於第三代計算機圍棋程序。大家往往覺得一學AlphaGo,就能變的很厲害,其實也不是的。

“神算子”最開始一兩年,雖然進步很快,但一直都是業餘水平。去年的時候,由小川老師經常在高校群裡喊人給“神算子”陪練,那時候程序的水平大概是業餘6段左右的水平。在這個水平上,程序似乎遇到了點瓶頸,感覺好幾個月都看出明顯的進步。

然而幾個月後,“神算子”變成了升級版的“星陣”,一下子從一線職業棋手可以讓兩子的水平,狂飆到了可以讓一線職業棋手兩子的水平,這真是個了不起的進步。

從“神算子”到“星陣”的進步,可以說這個程序突破了瓶頸,才實現了大幅度的飛躍。很多人只能看到現在“星陣”戰勝柯潔,卻不知道去年的時候這個程序還完全不行。開發團隊突破瓶頸,一定做出了很大的努力,攻克了某些難關,並不是僅僅模仿那麼簡單。

-

雖然大家都在模仿AlphaGo,但很多研究的細節是沒有公開的。現在用AlphaGo訓練出的程序,並不是沒有一個都能迅速的突飛猛進,接近AlphaGo的水平。

造成這種現象的原因,並不僅僅是資源投入不足,因為很多程序都在某些水平段陷入了瓶頸。“絕藝”在V18.0左右的水平徘徊了一年多,然後才忽然爆發逼近了Master。

事實上,AlphaGo Zero自訓練的時候,據說在三天超過V18.0後,也曾遇到瓶頸,解決了一個重要問題才繼續進步。

從成績上來說,“星陣”現在還達不到AlphaGo Master、AlphaGo Zero、“絕藝”、“鳳凰圍棋”的第一梯隊,大概是第二梯隊的樣子。雖說可以讓職業棋手兩子,但真下的話,估計是互有勝負,甚至我覺得職業棋手勝面更大,畢竟讓先都無法保持全勝不是嗎?

但是去追究現在的水平意義不大。“星陣”明顯已經突破了V18.0的水平,那麼不說追上Master,追上“絕藝”是可以期待的,估計時間也不會太遠。

當然,大家都在進步,以後誰執牛耳,就要來著看了。


神之一手

星陣圍棋Ai習慣上被認為前身是清華大學研發的神算子,所以很多人據此認為實力並不會太高。其實這裡面存在一個誤區,據我所知,星陣的算法完全不同於神算子,它是繼阿爾法零之後第二個拋棄學習人類棋譜的人工智能圍棋,4.12面世,至今不過短短半月,卻在奕城測試中取得了28勝2負的戰績。唯一的疑問是在4.12之前,星陣是否經歷過自我對局的進化過程,假如沒有,那麼星陣的實力將會非常恐怖。

按我的意見,星陣應該是目前在線ai中實力最高的,不過這次貝瑞基因杯星陣並不參與Ai之間的戰鬥,有些遺憾。期待以後會有星陣與最新版本絕藝的正面對決!


何似歡

“星陣”的水平遠超人類棋手,目前正在進行的星陣圍棋讓先(圍棋術語,黑棋先下而不用貼白棋7.5目)對陣人類的挑戰賽中,星陣已經連勝職業頂尖棋手32局,人類棋手下不過AI是正常的,應當承認這種差距 。


分享到:


相關文章: