讓我們從一個故事開始。
1 看著後視鏡往前開車
想象這麼一個場景,我開著車,經過筆直的大道,快速地往下一個路口駛去。我知道,到了下一個路口就要右轉了。
這件事情很簡單,我坐在駕駛室內,看到下一個路口,往右邊打方向盤就好了:
突然,不管什麼原因(這故事是我寫的,可以安排一百種原因,乾脆就不解釋),反正前擋風玻璃碎了:
不要糾結我這幅圖,反正你已經無法看清前面的路了,那怎麼知道什麼時候該右轉?
還好,開車的是一位數學家,智商及時上線。
數學家根據自己的經驗,估計這條筆直的道路上:
這也就意味著如果隨意的右轉,有95%的概率是錯誤的。
數學家從後視鏡看出去,發現後面有一輛車在打右轉彎燈,他意識到:
新的信息出現了,此時如果右轉,錯誤的概率就比之前小很多。
這種思考方法,就是貝葉斯定理所闡述的思考方法。
2 結合開車來理解貝葉斯公式
我們來看看貝葉斯公式是怎麼寫的:
先把剛才的開車給符號化:
我們再來理解下貝葉斯公式:
因此貝葉斯公式實際上闡述了這麼一個事情:
我們再通過韋恩圖來理解一下這個事情(為了觀看方便,下面的A,B的圓形面積是示意):
新的信息的出現,比如之前看到了亮著右轉彎燈的車,就好比知道點已經落入了 B 。至於為什麼B事件發生後導致的調整為:
這就需要代數了,推導也不復雜,這裡就不演算了。
2.1 小結
我們可以看到有形的十字路口,卻看不到明天是否下雨,我們可以看到前方是否有路障,卻不清楚下一次飛機是否會出事。甚至有時候,眼睛還會欺騙我們。
很多時候,我們不得不看著後視鏡開車,這個時候概率論、貝葉斯定理就是我們的指路明燈。
看著後視鏡開車,肯定常常會撞車,沒關係,我們可以不斷的去修正我們的假設。
比如,撞了幾次車之後,就發現可能之前估計的在十字路口打右轉彎燈的數據明顯偏大了,我們修正之後再繼續開車。我們人類的學習,本身也是一個試錯的過程。
3 貝葉斯定理與人腦
貝葉斯定理現在很多人在研究,就是因為不少人相信貝葉斯定理和人腦的工作機制很像(此處頗多爭論,望自行判斷),因此成為機器學習的基礎。
比如,你和對方聊天的時候,如果對方說出“雖然”兩個字,你大概就會猜測,對方後繼九成的可能性會說出“但是”。我們的大腦看起來就好像是天生在用貝葉斯定理。
吳軍博士在他的著作《數學之美》裡面就提到了,最早的自然語言處理,比如翻譯、語音識別,都是通過語法分析來進行的,就是把“主謂賓”分析清楚,然後處理,正確率慘不忍睹。
後來,google由自然語言處理專家賈里尼克領導的部門,通過統計、概率方法進行上述研究,正確率提高了很多。在書中也列舉了貝葉斯定理是如何參與自然語言處理的。
書中還有一句業界廣為流傳的名言:
語法是人類後來總結出來的,我們天生是不需要語法就可以開口說話的,或許,人腦真的是貝葉斯大腦。
最後,有一個小小的問題,根據我們的經驗,硬幣正反兩面出現的概率都是50%。如果我扔了一千次都是正面,那說明了什麼?
閱讀更多 媒體精選 的文章