《模型思考者》7:馬爾可夫宿命論


《模型思考者》7:馬爾可夫宿命論

我們繼續講斯科特·佩奇的《模型思考者》這本書。我先給你講兩個故事,你看看其中有沒有什麼規律。

第一個故事叫“捐款”。我們知道美國很多地區的公立學校系統有衰敗的趨勢,生源、政府投入和師資力量都不太行,學生的考試成績很差。有些熱衷於公益事業的富豪看到這個情況,就想採取行動。

2010年,Facebook的創始人扎克伯格,給新澤西州紐瓦克市的公立學校系統捐款一億美元。這是一筆鉅款,再加上別人匹配的捐款,相當於給這個地方每個學生六千美元。這筆錢可以用來改善教學條件、給教師提高待遇,還可以給學生髮獎學金!那這筆錢能起到怎樣的作用呢?

結果是過段時間再考察學生的成績,沒有任何提高。扎克伯格的錢,白花了。

第二個故事叫“情緒”。你有一個朋友因為失戀而情緒失控,說自己抑鬱了。這已經不是第一次,但是你非常關心他,就專程飛到他身邊,陪他度過了幾天愉快的時光。你明顯地感覺到這幾天他確實很開心,他還表態說以後要保持陽光的心態,積極生活。你放心地回去了。

可是過了沒多久,你朋友說因為感情受傷太深,實在不能安心上班,辭職了。

兩件事的共同點是,想要一次性地採取一個行動去改變某件事,結果徒勞無功。不管你付出了多少努力,事情總會回到老樣子,就好像冥冥之中有個無法擺脫的宿命一樣。


數學模型能告訴你其中的原理。

1.宿命

這個模型叫“馬爾可夫(Markov)過程”,以俄國數學家安德烈·馬爾可夫命名。

比如有一位老師,發現課堂上總有學生無法集中注意力,會溜號。所謂馬爾可夫過程,就是假設學生在“認真”和“溜號”這兩個狀態之間的切換概率,是*固定*的 ——

我們設定,今天認真聽講的學生,明天依舊認真的概率是90%,還有10%的可能性會溜號。而今天溜號的學生,明天繼續溜號的可能性是70%,剩下30%的可能性會變得認真。

咱們看看這個模型怎麼演化。假設總共有100 個學生,第一天認真和溜號的各佔一半。

根據概率設定,第二天,50個認真的學生中會有5人變成溜號;而溜號的學生中,會有15人變成認真 —— 所以第二天是有 50-5+15 = 60個人認真,剩下40個人溜號。

繼續演算,第三天應該有66個認真的,34個溜號的……以此類推,最後有一天,你會發現有75個認真,25個溜號的。


而到了這一步,模型就進入了一個穩定的狀態,數字就不變了。因為下一天會有7.5個學生從認真變成溜號,同時恰好有7.5個學生從溜號變成認真!

《模型思考者》7:馬爾可夫宿命論

而老師對這個穩定態很不滿意,為什麼只有75個認真的呢?他安排了一場無比精彩的公開課,還請了別的老師來幫他監督學生。這一天,100個學生都是認真的。

但這樣的干預對馬爾可夫過程是無效的。第二天認真的學生就變成了90個,第三天就變成了84個,……直到某一天,還是75個認真和25個溜號。

你看這個情形是不是很像咱們前面說的那位失戀的朋友。他的情緒有“愉快”和“失控”兩種狀態。他愉快的時候有 10% 的可能性變成失控,他失控的時候有 30% 的可能性變成愉快 —— 那麼不管你的干預能他連續愉快多少天,只要你不再幹預了,他終將回歸到75%的比例愉快、25%的比例失控的日常狀態。


馬爾可夫過程有一個固定的宿命。這不是巧合,這是數學定理 [1]。

2.定理

咱們先嚴格地說說什麼叫馬爾可夫過程。馬爾可夫過程要求滿足四個條件 ——

第一,系統中有有限多個狀態。比如“認真”和“溜號”,就是兩個狀態。

第二,狀態之間切換的概率是固定的。比如從認真到溜號的概率永遠都是 10%,保持不變。

第三,系統要具有遍歷性,也就是從任何一個狀態出發,都能找到一條路線,切換到任何一個其他的狀態。

第四,其中沒有循環的情況,不能說幾個狀態形成閉環,把其他狀態排斥在外。

而數學定理說,只要是馬爾可夫過程,不管你的初始值如何,也不管你在這個過程中有什麼一次性的干預,它終究會演化到一個統計的*平衡態*:其中每個狀態所佔的比例是不變的。

就好像終究會有 75% 的學生認真,25% 的學生溜號。

馬爾可夫過程,都有一個宿命般的結局。

那你說生活中有哪些事兒是馬爾可夫過程呢?很多。四個條件中只有第二個條件是關鍵,也就是狀態之間切換的概率是固定的。很多事情就是這樣的。

不發達地區的很多人會因為疾病而不得不去借債,還不上債務就變成了貧困戶。現在政府要扶貧,說我乾脆一次性地給窮人發一筆錢,讓他們把債都還了,以後好好過日子,這行不行呢?馬爾可夫模型說不行。你並沒有改變他下一次得病或者欠債的概率。你改變的現狀僅僅是一個初始條件,只要概率不變,他的宿命終究不變。

再比如說美國的窮人經常失業,而在很大程度上失業是自己的原因。他可能因為不按時上班被老闆開除了,也可能因為跟老闆有點小矛盾一怒之下辭職了。那如果你改變不了他對工作的態度,哪怕你一次性地給所有窮人都安排工作,你也改變不了窮人的命運。

馬爾可夫模型,真是“江山易改本性難移”、“授人以魚不如授人以漁”這些話的數學原理啊。

咱們再說一個真實的例子。世界上所有國家可以分成三類:自由國家、半自由國家、不自由國家。這三種國家狀態是可以互相轉換的,一個不自由的國家哪天想通了,就可能變成半自由或者自由的國家;一個自由國家萬一選一個獨裁者上臺,也可能變成不自由國家。


歷史數據表明,不自由國家在五年之內變成自由國家的可能性大約是5%,變成半自由國家的可能性是15%,繼續保持不自由狀態的概率是80%……下面這張表格列舉了三種狀態之間切換的概率 ——

《模型思考者》7:馬爾可夫宿命論

同時我們還知道,從1975年到2010年,這三種國家在全世界所佔的比例是下面這樣 ——

《模型思考者》7:馬爾可夫宿命論

圖中總體來看,自由國家是越來越多,不自由國家是越來越少。一個不懂數學的人看到這張圖可能會說,哈!自由是大勢所趨,將來所有國家都會變成自由國家!殊不知這就犯了簡單外推謬誤。

事實上,既然三種國家狀態切換的概率是幾乎固定的,這就是一個典型的馬爾可夫過程,那麼最終結果必定是一個三種國家按照一個固定比例分配的穩定狀態。數學計算表明到2080年,世界上將會有62.5%的國家是自由的,25%的國家是半自由的,12.5%的國家是不自由的……


只要切換概率不變,世界上始終都會有不自由的國家。

3.用途

馬爾可夫模型有很多應用。比如 Google 做搜索引擎,希望按照人們訪問的熱度給網頁排序,但是Google並沒有每個用戶實際點擊哪個網頁的數據,它怎麼辦呢?它使用一個叫做 PageRank 的算法,其中就用到馬爾可夫模型。

Google 能知道的是各個網頁之間互相鏈接的情況。我們把網頁想象成狀態,那這些鏈接就相當於描寫了馬爾可夫過程中狀態之間切換的概率。那麼根據前面說的定理,網頁被點擊的比例終究是一個平衡態。Google 就可以計算出來,在統計平衡態之下,每個網頁獲得點擊率的比例是多少,按照這個比例排序。

連有些意想不到的事兒,都是馬爾可夫過程。

我們知道有一本著名的政治文獻叫《聯邦黨人文集》,是由三位美國政治家,亞歷山大·漢密爾頓、約翰·傑伊和詹姆斯·麥迪遜在1787到1788年間共同寫作的。文集中有85 篇文章,可是因為三人使用了同一個筆名,人們並不知道到底哪篇文章是誰寫的。


後世的歷史學家經過多方考證確定了其中大部分文章的作者,但是還有那麼幾篇,歷史學家表示無能為力。於是統計學家就出手了。

統計學家說,一個作者寫文章的用詞習慣,其實是個馬爾可夫過程。

比如英文中有個短語是“for example”,而人們也會經常說“for the……”,對某一個作者來說,for 後面接 the 的概率,是接 example 的4倍。這就是一個用詞習慣問題。比如我經常說“但是請注意”,而有的作者可能更喜歡在“但是”後面接一個逗號。

我們可以把每個常用詞都想象成馬爾可夫過程中的一個狀態。因為每個作者的用詞組合習慣非常固定化,統計學家就可以給每個人都做一張馬爾可夫狀態切換概率表。那麼把一篇文章中相應詞彙的馬爾可夫概率表跟這個作者概率表進行對比,就可以知道這篇文章是不是他寫的。


使用這個方法,統計學家判斷,懸而未決的那幾篇文章,最符合詹姆斯·麥迪遜的寫作風格。

馬爾可夫模型這麼有用,說明“本性難移”是個常見現象。

但是請注意,生活中有些事情是“路徑依賴”的,意味著後面發生的概率會根據之前發生的事情做出改變。比如原本有兩種高清電視標準勢均力敵,而你如果能一次性地說服幾個重要廠商採納其中一個標準,那其他的廠商為了兼容性,就會跟著選擇這個標準。

而馬爾可夫模型說的則是那些概率不隨以前的歷史發生改變的情況。那你說到底什麼情況下用路徑依賴,什麼情況下用馬爾可夫呢?你得靈活判斷。

一個酗酒的人,你看著他一週時間不讓喝酒,並不足以改變他酗酒的概率;但是如果你有辦法讓他連續一年不喝酒,也許他就真戒酒了。逢年過節找一幫志願者去養老院給老人送溫暖,不足以影響老人長期的精神狀態;可是如果養老院弄個生活方式改革,也許就會有實際效果。


馬爾可夫模型解釋了歷史的怪圈,它給我們的教訓是歷史很難改變。臨時性的措施往往沒長久的作用,本性的力量很強大。有些公司換個開明的領導人,可能幹幾年都挺好,之後又會走到老路上去。想要改變歷史,你得改變機制。

註釋

[1] 這個定理叫做 Perron-Frobenius 定理。

《模型思考者》7:馬爾可夫宿命論


分享到:


相關文章: