「腦洞未來06」人工智能06:阿爾法狗不是真正的“智能”(下)

【觀點】在引爆世界第三次人工智能熱潮的時候,“AlphaGo”的主人DeepMind 和東家谷歌,看著世間瘋狂地傳頌著、領悟著“人工智能將戰勝、淘汰、替代人類”“將讓99%的人類變成無用階級”……可能高興得都合不攏嘴了!基於巨大的商業炒作與利益訴求,他們怎麼也不會出來澄清:AlphaGo所涉及“深度神經網絡”“卷積神經網絡”和“增強學習網絡”,對應的“深度學習”“增強學習”等技術(確實屬於技術突破),實際上就是一個個超級比喻,根本不是什麼“智能”,更不是像人一樣的“智力”

……《新未來簡史》如是說。

「腦洞未來06」人工智能06:阿爾法狗不是真正的“智能”(下)

(上接【腦洞未來5】人工智能篇5:阿爾法狗不是真正的“智能”(上) )

深藍這種辦法行不通,得另闢蹊徑。有人想到了結合“概率”的算法。於是“蒙特卡羅方法”(Monte Carlo method)出場了。

這一方法也稱統計模擬方法。是20世紀40年代美國在第二次世界大戰 “曼哈頓計劃”計劃的成員S.M.烏拉姆和J.馮·諾伊曼首先提出,並以馳名世界的賭城—摩納哥的Monte Carlo來命名這一方法的。該算法就是以某種事件出現的頻率估計這一隨機事件的概率,或者得到這個隨機變量的某些數字特徵,並將其作為問題的解。

蒙地卡羅方法首先被人在國際象棋上運算,似乎根本行不通,直到2006年,有人發展了蒙地卡羅方法,即在此方法上加了樹枝狀搜索,從此探索出電腦圍棋編程的另一條通途。這一改進的方法就是“蒙地卡羅樹搜索”。

該搜索法面世後,那時就有人驚奇地預言說,未來不久,電腦將在圍棋上擊敗人類頂級選手。而此之前,人們一直相信圍棋是不可戰勝。這一預言只經歷了十年,即2016年就變成了現實。所以,技術是改變一切的真正神器。

「腦洞未來06」人工智能06:阿爾法狗不是真正的“智能”(下)

根據谷歌曾在《自然》雜誌上公佈阿爾法狗的運作的基本原理,分別為:

走棋網絡(Policy Network),給定當前局面,預測和採樣下一步的走棋;快速走子(Fast rollout),在適當犧牲走棋質量的條件下提高速度;價值網絡(Value Network),給定當前局面,估計雙方勝率;蒙特卡羅樹搜索,就是把以上三個部分串聯成一個完整的系統。

該搜索法並沒有窮盡所有的走法,而是先完成大約數十步計算以後,剩下的便靠機率模擬算法(傳統的局部特徵匹配與線性迴歸兩種方法演算出可能勝負作為依據)來推算獲勝可能,並據以選擇棋步。

其中,阿爾法狗所計算的那數十步很重要,用到了三個重要的概念和算法,即“深度神經網絡”、“卷積神經網絡”和“增強學習網絡”。這三個概念非常重要,並由此很好地體現“深度學習”與“增強學習(也稱加強學習)”的概念。這數十步到底是如何計算的呢?

「腦洞未來06」人工智能06:阿爾法狗不是真正的“智能”(下)

阿爾法狗在比賽之前便通過“深度神經網絡”開始“學習”(形象的比喻,實際上就是計算機的反覆計算與修正)。深度神經網絡是一種模擬人類腦神經系統的運算流程,有資料輸入端與輸出端,中間則是運算神經元(由無數晶體管組成),透過一次次“學習”,比對輸出資料與正確資料的差異,反饋調整神經元的運算參數,便能“學習”某種運算技能。

這裡輸入的資料便是數以億計的歷史棋譜,包括所有頂尖高手曾經下過的棋譜,輸出資料便是這些高手在各種棋局下獲勝的走法,反覆調參,使得計算機輸出的資料與獲勝的資料儘可能的相同,這些信息便儲存在計算機裡,相當於人們記住了某些繁瑣的操作一樣。

「腦洞未來06」人工智能06:阿爾法狗不是真正的“智能”(下)

注意,深度神經網絡的“深度”,就是運算神經元有許多層,每一層處理原始資料的一種特徵,多層彙總,以達成強大的運算能力。

但是,像圍棋棋譜這樣的原始資料非常複雜,這麼多的資料(棋盤上所有方格)都傳輸到神經元上的話,那麼電腦就會破錶,所以,輸入資料需要有所選擇,於是“卷積神經網絡”出場了。

卷積神經網絡的運算神經元,接受的並不是棋盤上的全部資料,而只是來自棋盤上鄰近方格的資料,這樣就大大簡化了處理程序。比如阿爾法狗從棋盤上選取四十八種佈局方式的特徵,利用十三層神經網絡予以分層處理,反覆“學習”、反覆調參,這樣就實現對當前棋局的辨認,就像人們學會了某種複雜事項的處理一樣。

於是,在實戰中,只要一遇到某種棋局,阿爾法狗便能對照儲存庫中龐大現成棋譜及其最接近勝利(如選擇頂級高手的下法)的走法予以辨認,好像頂級棋手親自到場一樣,步步勝算。

「腦洞未來06」人工智能06:阿爾法狗不是真正的“智能”(下)

此外,為了增強對戰能力,還需要用到“增強學習網絡”,讓阿爾法狗跟先前下過的棋局對戰,或者乾脆讓其自己跟自己下棋,好像金庸筆下週伯通在桃花島開創的“左右互搏”術一樣,以累積更多實戰經驗。

增強學習網絡是一種半監督式學習(下一章將詳細解讀),沒有標準答案,通過程序設計,下贏了棋局,收穫正向回饋,下輸了便會被扣分。由此慢慢累積學習經驗,越學習越厲害。當然,這種學習是需要一些時間的。

不過,對於計算機來說,高速計算與不知疲倦就是它的長項和特色,比如全人類幾百年來下過的全部棋譜,對阿爾法狗來說,“學習”分析一遍只需要花費幾天時間而已。又比如阿爾法狗自己左右互博2000萬盤,一個人,按15分鐘練一盤來算,也需要600年。

「腦洞未來06」人工智能06:阿爾法狗不是真正的“智能”(下)

阿爾法狗的奇蹟就是,僅僅用上幾個月的時間,通過“學習”,就能模擬了人類圍棋招式的幾百年進化歷程,同時優勝劣汰,形成的自己的棋風。所以,當阿爾法狗在與李世石對弈時,還輸了一盤,但在一年後再與柯潔對戰時,卻把柯潔下到哭泣。也就是這半年時間後,阿爾法狗通過增強的“學習”使其的功力至少提升了數十倍了。

由上,阿爾法狗原理中所用到“蒙地卡羅樹搜索”根本就算不上傳統的人工智能。當然,上述被認為最可能像人一樣智能的“機器學習”、“深度學習”和“增強學習”,也是對計算機通過輸入資料到輸出資料反覆測試以達到最佳效果的這些編程,其自發運行過程的一個擬人化的比喻。

不僅如此,這些“學習”所涉及的“深度神經網絡”和“卷積神經網絡”更是個美麗的比喻,不過僅僅就是一大推模仿大腦用的晶體管、儲存器與無數傳導線等元件組成的系統而已。

雖然,我們每一個人心中都有個自己的“人工智能”,但是,更多的民眾或許真的就把這些比喻當成了現實,以為機器真的可以像人那樣有意識、自覺地去學習、思考了。實際上它們僅僅只是按照人類的編程運行,交互式自動控制的機器,跟本章開篇所說的複印機的故事有很多相似的地方,只不過絕大多數掛名為人工智能的器械、系統要比複印技術高級、複雜得多得多。

「腦洞未來06」人工智能06:阿爾法狗不是真正的“智能”(下)

或許,神秘得人氣爆棚的人工智能就是:

主流倡導者們相信機器未來會有意識(現實中連邊緣都未觸及),在推動各類計算機技術飛速發展的過程中,創造了“智能”、“神經”和“學習”這些比喻性的詞彙與概念,同時製造了可怕的預測。而局外的廣大民眾混淆了這些概念的“比喻性”,忽視了機器“智能”、“神經”和“學習”的真相以及和人類的真正差別,進而相信並傳播了這些可怕的預測,從而製造了恐怖。

當然,這些預測和恐怖與人工智能改變世界的巨大實用價值和前景是兩件不同的事情。

「腦洞未來06」人工智能06:阿爾法狗不是真正的“智能”(下)

《新未來簡史》與世界級暢銷書《未來簡史》有近100項向左或對立的觀點,豆瓣8.5高評分。該書旨在顛覆過往絕大多數有關人類未來的預測與推斷,最大限度地靠近事物的本原。以特有近乎刁鑽的視覺、博雜的知識、激情的文風和嚴密的邏輯,聯動前沿科技(如區塊鏈、人工智能、大數據等黑科技)與社會、自然、經濟、金融、人文、歷史以及人性驅動下的人類競爭、價值創造等進行了深入的思考與推演,展現出"氣勢恢宏、磅礴瑰麗”的未來價值場景,極具吸引力。

其中,本書率先提出"大數據悖論、算法“馬甲”、科技道德定律、資本科技悖論、大生態人力論、分工悖論,互聯網將被替代、人工智能讓人最終擺脫無用階級、追算你的9倍價值、未來人類演進9大範式”等獨到的觀念或理論,極具"顛覆”性,刷新人們的五官。有利於人生、事業的未來佈局。


分享到:


相關文章: