從計算機網絡看這個世界是怎麼鏈接的

科學研究萬物可以一級級向細拆分,比如分子、原子 、粒子、......,但是它們是怎麼組裝的?或者說是怎麼“進化”的?計算機科學家提供了一個網絡的視角。

從計算機網絡看這個世界是怎麼鏈接的


一、對網絡的認知發展:從隨機到無尺度

原來人們以為這世界的組成是隨機的,比如一個聚會(網絡),出門前我們都不知道今天會認識誰,“網絡”的形成是隨機的。隨機網絡有個著名的理論叫六度分隔。你和這世界上任何一個人之間,最多通過6個人就能搭上關係,即便你想認識美國總統也是如此。

後來人們仔細觀察發現,這個聚會中有的人善交際,認識了很多人;而不善交際的,只認識一二個。就是說“網絡”能量分佈是不均勻的,有的地方密集(就是“樞紐節點“--在一個網絡中有比其他節點擁有更多鏈接的節點),有的地方空曠。一個網絡的結構,主要是樞紐節點在支配和起作用;這也符合二八定律,總是20%的成員佔據了80%的資源。

這就是無尺度網絡,無尺度指的是我們沒法用同樣的尺度、同一個標準去衡量所有節點。無尺度網絡是無序與有序的並存;只要抓住樞紐節點,整個網絡就清晰可見。網絡的本質就是無尺度網絡。

二、無尺度網絡的特點:

從計算機網絡看這個世界是怎麼鏈接的


1、先發優勢

網絡中越早產生的節點越容易成為樞紐節點。因為一個網絡在一開始的時候,節點數量不多,後來產生的節點,總是傾向於鏈接網絡中已有的節點,這樣最早的一批節點自然就能獲得最多的鏈接。就象最早的微信公號,就象阿里、騰訊。

2、適者生存

後進入者,如果競爭力更強,適應度更高,能獲得的鏈接也會更多。比如咪蒙,2016年年初才開始更新公眾號,但短短一年時間,粉絲數就從0漲到了800萬。因為寫得多、寫得好,引起更多人的共鳴和分享欲。

3、健壯與脆弱並存

除了樞紐節點以外的其他節點對整個網絡來說都是次要的,砍掉這種節點,不會影響整個網絡的連通;就象壁虎尾巴,砍了還會他起來。但樞紐節點被破壞,網絡的結構就會發生重大變化。甚至會出現整體性的故障。

三、計算機網絡的根基就是無尺度網絡

俯瞰整個計算機網絡的發展過程,我們發現:如果把“蓬勃發展的人工智能比作繁茂的枝葉,那麼大數據的精準分析就是為枝葉輸送養料的樹幹,而對複雜網絡的深刻洞察就是最底層,也最基礎的樹根”(《鏈接》)。底層就是無尺度網絡。

現在支撐人工智能的是深度學習的神經網絡。這種神經網絡的特點就象寶塔,多層結構;每層神經網絡都有若干關鍵節點,它們接收上一層處理完的數據結果,共同解決一個問題,再把結果傳遞到下一層去做進一步的處理。流行的深度神經網絡有兩種:一種是處理空間分佈的(卷積神經網絡),另一種是處理時間分佈的(循環神經網絡)。它們的結構特點,都與無尺度網絡有著密不可分的關係。

空間神經網絡比如分析100萬張白色背景的貓狗圖片,從中找出5釐米尺寸的貓、狗圖片各一張。它把每張圖片都看成一個無尺度網絡,分成若干格子(像素),然後再用框(比如3*3)去一個個局部分析;框到白色直接去掉(無用),框到軀幹發現仍無法區分(無效)去掉;直到框到頭部,發現完全不同,這是一個重要樞紐節點。

接著再把頭部當成無尺度網絡,分出五官;之後再把單獨的五官再分析,比如眼睛,它的瞳孔粗細是區分貓狗的關鍵,成功率超80%,那麼它也是一個重要樞紐節點。同時在分析過程中,各個節點的重要性會發生動態變化,成功率高的節點會加權,成功率低的節點會減權(比如鬍鬚差不多),最後形成一個識別率最高的神經網絡。

時間循環神經網絡比如翻譯,“我吃飯了”這一句話,切分成“我”“吃飯”“了”,然後把這3個部分逐個翻譯,再按節點權重(語料庫的大數據中捕捉前後文裡面和這個字詞搭配關係最緊密的字詞,賦予它們更高的權重)重新排列,這樣翻譯就接近現實。

智能網絡系統也是一個“適者生存”、不斷調整的過程。

事實上,自然界、人類社會乃至整個世界的運行也大致如此,看似無序,實際或有一種無形的有規在引導。

--參見《時間的秩序》

20200220



分享到:


相關文章: