雅虎、谷歌成功背後的思考:學習的本質是降低"熵"


雅虎、谷歌成功背後的思考:學習的本質是降低

導語:熵是一個非常重要的概念,整個人類科技的進步就是一部與熵做對抗的歷史。雅虎、谷歌之所以能成為全球頂尖的互聯網公司,就是在於有效降低了熵。本文的目的是把熵講清楚,並通過熵讓你理解怎麼樣更有效的學習。

名字古怪性格囂張的"熵"

雅虎、谷歌成功背後的思考:學習的本質是降低

熵(英文entrophy,讀音"shāng"),符號S,是表示混亂程度的物理量。

圍繞著熵有一個著名的熱力學第二定律:系統中的熵總是不斷增大的。要想降低熵就要消耗能量。

這麼說可能有點抽象,形象的表述是:對於任何一件事情,如果你不再上面投入時間和精力,它一定會越來越混亂。

我們的日常生活中充滿了和熵對抗的例子:比如你要是不定期整理書桌,它一定會越來越亂(混亂程度增加,即熵增加),你要想讓它變整齊,就必須不斷花時間整理。

再比如做筆記,你要是做很亂很隨意的筆記就相對輕鬆一點,而要做得很整齊就要耗費更多的精力和時間,這是因為整齊的筆記熵比較低。

你可能覺得上面這個例子太顯而易見了,沒有任何新意。那我再舉一個略顯沉重的例子。

其實我們每個人從年輕到年老再到死亡也是熵增加的過程。剛出生時我們細胞裡面的DNA熵最低。每次DNA隨著細胞分裂複製的時候都有一定概率出錯,即發生基因突變。

隨著我們年齡增長,DNA複製次數越多,錯誤的比例會越來越大,也就是熵會越來越高。當錯誤多到一定程度時要麼細胞分裂能力下降,表現為衰老。要麼分裂會失控,表現為癌症(這就是為什麼老年人容易得癌症)。最終的結果就是死亡。

而健身的人衰老的慢,是因為健身這個過程通過消耗更多能量,來減慢熵增加的速度。

看,熵就是這麼一個名字古怪性格囂張的小惡魔,把一切搞亂,你必須無休止的與它鬥爭,而且還打不贏。

整個人類的歷史就是與熵鬥爭的歷史,那些偉大的技術和發明都是為了降低熵。下面我們聊一聊互聯網行業裡兩家偉大的公司雅虎和谷歌,看看它們是怎麼和熵做對抗的。

雅虎:靠人肉對抗熵的互聯網先驅

雅虎、谷歌成功背後的思考:學習的本質是降低

我們回到上世紀90年代,也就是大家剛開始上網的那幾年。當時已經有一些企業建立了網站並在網上發佈信息了。但這些信息是雜亂的,沒有分類和組織,熵很高。

這個時候你沒有地方去查到每個網站的網址,很多網站你很難訪問的到。因此互聯網是個很小眾的東西,大部分人覺得沒什麼價值。

直到1994年,斯坦福大學的兩個學生楊致遠和大衛·費羅創立了雅虎(Yahoo),顛覆了整個互聯網行業。

這兩個學生在網上查資料的時候一方面覺得網上資料很豐富,但是另一方面又覺得找每個網站網址好麻煩。因此靈光乍現,覺得如果有一個網站,把所有其它網站分門別類的列出來,那上網就方便多了。

說幹就幹,他們很快開發出了一個簡單的網頁,把自己之前整理過的網址分類之後填上去,並且不斷更新。早期的雅虎頁面是下圖這個樣子:


雅虎、谷歌成功背後的思考:學習的本質是降低

就是這麼一個簡陋的頁面卻大受歡迎。用戶量激增,雅虎順利拿到融資,越做越大,順利上市。

其實咱們國內早期上網的時候主頁也都是像hao123、網易、新浪、搜狐等幾大門戶網站,雅虎可以說是這些的祖師爺了。

其實雅虎乾的事情很簡單,通過編輯夜以繼日的整理網站,更新分類。靠人肉降低了熵。

而雅虎鏈接著互聯網的大部分頁面,是進入互聯網的入口,因此雅虎提高了用戶使用互聯網的效率,有效的降低了互聯網的熵。

此後互聯網行業的迅速發展都應該感謝雅虎與熵的對抗。

谷歌:找到對抗熵的核武器

雅虎、谷歌成功背後的思考:學習的本質是降低

雖然雅虎是互聯網對抗熵的先驅,但是現在已經變成了先烈,而從雅虎手裡接棒的是谷歌。原因很簡單,谷歌對抗熵的效率和效果遠高於雅虎。

時間來到了上世紀90年代末期。有了雅虎這樣的門戶網站之後雖然上網比之前體驗好了很多,但是還是有很多問題。

比如你想查一個名人的資料,你得先找到"名人"這個分類,然後按照這個名人的行業篩選,最後在茫茫多的人裡面找到它。

當時已經有很多人設想通過搜索來檢索信息。但是有一個核心問題沒法解決,就是怎麼確保搜出來的結果裡有價值的頁面能排在前面。畢竟如果有一萬條結果,但是有價值的只有50條,還分散在這一萬條裡,那這也是沒有意義的。

用熵的角度說,就是如何得到熵很低的搜索結果。


1998年,斯坦福的另外兩個大學生拉里·佩奇和謝爾蓋·布林在做博士論文時突發奇想,找到了一個簡單的解決方法,即利用網頁上的超鏈接來計算頁面價值,並將價值高的頁面排在前面,這樣搜索結果的熵就顯著下降了。

下面簡單介紹一下這個算法的原理:

雅虎、谷歌成功背後的思考:學習的本質是降低

假設有ABCDEF六個網頁,他們頁面上超鏈接的指向如上圖。D有個指向A的箭頭表示D網頁有一個超鏈接,點擊可以跳到A網頁。

我們要計算每個網頁的價值。D網頁有一個超鏈接能指向B網頁,那說明D覺得B是有價值的,而被指向次數越多的網頁越有價值。如果你覺得不好理解就想想抖音,抖音上的網紅都想盡一切辦法獲得更多人的關注,因為越多人關注他,他的價值就越大。上圖裡的B被指向的最多,所以最有價值。

不僅如此,不同頁面的指向價值不同,越有價值的網頁指向的網頁也越有價值,就好比名人說話比一般人有分量一樣。因此上圖裡的C網頁雖然只有B一個指向,但是因為B很有價值,所以C也很有價值。

這個就是互聯網史上最偉大的算法PageRank的核心思想。是不是非常簡單?

但是就是這麼一個簡單的算法使得用戶用谷歌搜索時能獲取到非常有價值的信息,從而造就了谷歌這個全球數一數二的互聯網巨頭。

谷歌比雅虎的厲害之處在於它是對整個互聯網上所有的頁面做了個排序,就好比把一副洗的很亂的撲克牌按照花色和大小重新排列,使得熵進一步大幅下降。而且谷歌是靠算法而不是人工來完成這一切。所消耗的能量就只有計算機的電能而已。

如果雅虎對抗熵的武器是步槍,那谷歌的PageRank無疑是核武器了。

學習的本質是和熵的對抗

雅虎、谷歌成功背後的思考:學習的本質是降低

其實學習的本質是建立一個結構化的知識框架來和熵對抗。以高中階段為例,我們的學習就是兩個階段不斷循環。

階段一:輸入。每天我們都要密集的上課,語文要背古文和詩詞、數學物理有各種定理、化學有各種方程式。這些都是信息的輸入。剛輸入的信息不僅是雜亂的,而且容易跟已有的知識混淆,因此這個階段是我們的熵會增加。

階段二:整理。在這個階段,我們要花很多時間把新輸入的知識按照某些邏輯組織起來,構建各個學科自頂向下的知識結構。比如高中物理,我們把高中物理所有知識點分成運動系統和非運動系統,把運動系統又分成外部能能量、加速度和能量轉化,然後再進一步細分,如下圖:


雅虎、谷歌成功背後的思考:學習的本質是降低


隨著不斷地細分和構建,熵就下降了。

而考試其實說白了就是考我們熵下降的程度。如果我們想把題做對,就要快速檢索出考點在系統中的位置,並找到與之關聯的知識,然後調動這些知識來解題。熵越低、構建越完善的系統檢索速度越快,能檢索到的關聯的知識越多越準確,自然解題能力更強。

以上,基於熵的原理,我們可以回答兩個被問的最多的學習方法的問題:

1.所謂定式、套路和大招對考試到底有沒有幫助?

你學習定式和套路時,相當於把知識孤立了,對每個套路都建立了一個小的子系統。由於彼此沒有鏈接,就好像雅虎出現之前的互聯網系統,熵是很高的。

所以我強烈不建議你花時間在這個上面。

2.為什麼學習投入的時間和成績不成正比?

只有當時間花在降低熵上時,才是真正有效率的學習。很多同學學習的時候喜歡啃好啃的骨頭,要麼是在反覆鞏固自己學的好的內容,要麼是被動的做老師留的作業,沒有針對性。

這兩個行為都不太可能降低熵,因此不會帶來有效的成績提高。


總結

1. 熵表示混亂程度,會一直增加,降低熵需要消耗能量

2. 谷歌和雅虎的價值在於降低了互聯網中信息的熵

3. 學習的本質是建立一套高度結構化的系統,降低熵

4.要想學習高效,唯有通過更加積極的調整,把時間用在最能降低熵的方向上


分享到:


相關文章: