如何理解貝葉斯公式?

讓我們從一個故事開始。

1 看著後視鏡往前開車

想象這麼一個場景,我開著車,經過筆直的大道,快速地往下一個路口駛去。我知道,到了下一個路口就要右轉了。

這件事情很簡單,我坐在駕駛室內,看到下一個路口,往右邊打方向盤就好了:

如何理解貝葉斯公式?

突然,不管什麼原因(這故事是我寫的,可以安排一百種原因,乾脆就不解釋),反正前擋風玻璃碎了:

如何理解貝葉斯公式?

不要糾結我這幅圖,反正你已經無法看清前面的路了,那怎麼知道什麼時候該右轉?

還好,開車的是一位數學家,智商及時上線。

數學家根據自己的經驗,估計這條筆直的道路上:

如何理解貝葉斯公式?

這也就意味著如果隨意的右轉,有95%的概率是錯誤的。

數學家從後視鏡看出去,發現後面有一輛車在打右轉彎燈,他意識到:

如何理解貝葉斯公式?

新的信息出現了,此時如果右轉,錯誤的概率就比之前小很多。

這種思考方法,就是貝葉斯定理所闡述的思考方法。

2 結合開車來理解貝葉斯公式

我們來看看貝葉斯公式是怎麼寫的:

如何理解貝葉斯公式?


先把剛才的開車給符號化:

如何理解貝葉斯公式?

我們再來理解下貝葉斯公式:

如何理解貝葉斯公式?

因此貝葉斯公式實際上闡述了這麼一個事情:

如何理解貝葉斯公式?

我們再通過韋恩圖來理解一下這個事情(為了觀看方便,下面的A,B的圓形面積是示意):

如何理解貝葉斯公式?

如何理解貝葉斯公式?


新的信息的出現,比如之前看到了亮著右轉彎燈的車,就好比知道點已經落入了 B 。至於為什麼B事件發生後導致的調整為:


如何理解貝葉斯公式?


這就需要代數了,推導也不復雜,這裡就不演算了。

2.1 小結

我們可以看到有形的十字路口,卻看不到明天是否下雨,我們可以看到前方是否有路障,卻不清楚下一次飛機是否會出事。甚至有時候,眼睛還會欺騙我們。

很多時候,我們不得不看著後視鏡開車,這個時候概率論、貝葉斯定理就是我們的指路明燈。

看著後視鏡開車,肯定常常會撞車,沒關係,我們可以不斷的去修正我們的假設。

比如,撞了幾次車之後,就發現可能之前估計的在十字路口打右轉彎燈的數據明顯偏大了,我們修正之後再繼續開車。我們人類的學習,本身也是一個試錯的過程。

3 貝葉斯定理與人腦

貝葉斯定理現在很多人在研究,就是因為不少人相信貝葉斯定理和人腦的工作機制很像(此處頗多爭論,望自行判斷),因此成為機器學習的基礎。

比如,你和對方聊天的時候,如果對方說出“雖然”兩個字,你大概就會猜測,對方後繼九成的可能性會說出“但是”。我們的大腦看起來就好像是天生在用貝葉斯定理。

吳軍博士在他的著作《數學之美》裡面就提到了,最早的自然語言處理,比如翻譯、語音識別,都是通過語法分析來進行的,就是把“主謂賓”分析清楚,然後處理,正確率慘不忍睹。

後來,google由自然語言處理專家賈里尼克領導的部門,通過統計、概率方法進行上述研究,正確率提高了很多。在書中也列舉了貝葉斯定理是如何參與自然語言處理的。

書中還有一句業界廣為流傳的名言:

如何理解貝葉斯公式?

語法是人類後來總結出來的,我們天生是不需要語法就可以開口說話的,或許,人腦真的是貝葉斯大腦。

最後,有一個小小的問題,根據我們的經驗,硬幣正反兩面出現的概率都是50%。如果我扔了一千次都是正面,那說明了什麼?


分享到:


相關文章: