用貝葉斯定理來推斷他是不是你心中滿意的男孩

貝葉斯公式是概率論基本概念,其核心意義是通過承認我們自身的無知,給不同的假設以調整空間。


一 什麼是貝葉斯公式

18世紀英國業餘數學家托馬斯·貝葉斯(Thomas Bayes,1702~1761)提出過一種看上去似乎顯而易見的觀點:“用客觀的新信息更新我們最初關於某個事物的信念後,我們就會得到一個新的、改進了的信念。” 這個研究成果,因為簡單而顯得平淡無奇,直到他死後的兩年才於1763年由他的朋友理查德·普萊斯幫助發表。它的數學原理很容易理解,簡單說就是,如果你看到一個人總是做一些好事,則會推斷那個人多半會是一個好人。這就是說,當你不能準確知悉一個事物的本質時,你可以依靠與事物特定本質相關的事件出現的多少去判斷其本質屬性的概率。用數學語言表達就是:支持某項屬性的事件發生得愈多,則該屬性成立的可能性就愈大。與其他統計學方法不同,貝葉斯方法建立在主觀判斷的基礎上,你可以先估計一個值,然後根據客觀事實不斷修正。

1774年,法國數學家皮埃爾-西蒙·拉普拉斯(Pierre-Simon Laplace,1749-1827)獨立地再次發現了貝葉斯公式。拉普拉斯關心的問題是:當存在著大量數據,但數據又可能有各種各樣的錯誤和遺漏的時候,我們如何才能從中找到真實的規律。拉普拉斯研究了男孩和女孩的生育比例。有人觀察到,似乎男孩的出生數量比女孩更高。這一假說到底成立不成立呢?拉普拉斯不斷地蒐集新增的出生記錄,並用之推斷原有的概率是否準確。每一個新的記錄都減少了不確定性的範圍。拉普拉斯給出了我們現在所用的貝葉斯公式的表達:

P(A/B)=P(B/A)*P(A)/P(B),

該公式表示在B事件發生的條件下A事件發生的條件概率,等於A事件發生條件下B事件發生的條件概率乘以A事件的概率,再除以B事件發生的概率。公式中,P(A)也叫做先驗概率,P(A/B)叫做後驗概率。嚴格地講,貝葉斯公式至少應被稱為“貝葉斯-拉普拉斯公式”。

用貝葉斯定理來推斷他是不是你心中滿意的男孩

二 默默無聞200年

貝葉斯公式現在已經非常流行,甚至在熱門美劇《生活大爆炸》中謝耳朵也秀了一下。但它真正得到重視和廣泛應用卻是最近二三十年的事,其間被埋沒了200多年。這是為什麼呢?原因在於我們有另外一種數學工具——經典統計學,或者叫頻率主義統計學(我們在學校學的主要是這種統計學),它在200多年的時間裡一直表現不錯。從理論上講,它可以揭示一切現象產生的原因,既不需要構建模型,也不需要默認條件,只要進行足夠多次的測量,隱藏在數據背後的原因就會自動揭開面紗。

用貝葉斯定理來推斷他是不是你心中滿意的男孩

在經典統計學看來,科學是關於客觀事實的研究,我們只要反覆觀察一個可重複的現象,直到積累了足夠多的數據,就能從中推斷出有意義的規律。而貝葉斯方法卻要求科學家像算命先生一樣,從主觀猜測出發,這顯然不符合科學精神。就連拉普拉斯後來也放棄了貝葉斯方法這一思路,轉向經典統計學。因為他發現,如果數據量足夠大,人們完全可以通過直接研究這些樣本來推斷總體的規律。

三 初顯威力

長期以來,貝葉斯方法雖然沒有得到主流學界的認可,但其實我們經常會不自覺地應用它來進行決策,而且還非常有效。比如在一個陌生的地方找餐館吃飯,因為之前不瞭解哪家餐館好,似乎只能隨機選擇,但實際上並非如此,我們會根據貝葉斯方法,利用以往積累的經驗來提供判斷的線索。經驗告訴我們,通常那些坐滿了客人的餐館的食物要更美味些,而那些客人寥寥的餐館,食物可能不怎麼樣而且可能會被宰。這樣,我們就往往通過觀察餐廳的上座率來選擇餐館就餐。這就是我們根據先驗知識進行的主觀判斷。在吃過以後我們對這個餐館有了更多實際的瞭解,以後再選擇時就更加容易了。所以說,在我們認識事物不全面的情況下,貝葉斯方法是一種很好的利用經驗幫助作出更合理判斷的方法。

總的說來,貝葉斯公式是求一個條件概率,也就是計算簡單條件下發生的複雜事件的概率。

用貝葉斯定理來推斷他是不是你心中滿意的男孩

假定小編以某種方式建立了一個數據集,對10000個男生從性格、顏值、才華三個方面進行打分(1~5分),然後讓女孩評價對其是否滿意。

接下來,我們一起來看一些有趣的事情:

  • 第一天

用貝葉斯定理來推斷他是不是你心中滿意的男孩

小A是一名單身女孩,突然有一天,小A的閨蜜小B神秘兮兮要給她介紹男朋友,但是具體內容一字未提。晚上,小A妹子輾轉反側,不斷琢磨著:她會介紹誰呀?條件怎麼樣嘞?不知道能不能談得來......這時,根據樣本中的“經驗”(6428個滿意,3572個不滿意),小A大概估計了下對未謀面男孩的滿意概率:

用貝葉斯定理來推斷他是不是你心中滿意的男孩

分析:即使沒有任何信息,僅靠平白無故的直覺,小A遇到如意郎君的概率畢竟有一多半呢!所以,世上還是好人多呀。

  • 第二天

小B中午吃飯的時候,神秘得透露給小A,這個男孩的才華有4分呢。哎呦?不錯哦,小A一邊有點開心,一邊對自己的滿意概率進行了調整,根據大名鼎鼎的貝葉斯公式:

用貝葉斯定理來推斷他是不是你心中滿意的男孩

在僅知道男孩的才華為4分的時候,滿意概率為:

用貝葉斯定理來推斷他是不是你心中滿意的男孩

分析:當得到男孩的更多信息時,小A便可以運用貝葉斯公式做出更好的判斷,明顯可以看出後驗概率70.11%已經比先驗概率64.28%提升了不少。同時,如果男孩是頂級學神,才華=5分,那麼這個概率會提升到74.41%!!!

用貝葉斯定理來推斷他是不是你心中滿意的男孩
  • 第三天

小A不知道從哪裡搞到了男孩的照片,認真打量一下,挺好的,不至於是超級大帥哥但是看著比較踏實穩重,顏值至少3分吧。就當顏值3分的吧,這個時候,小A再次偷偷調整自己的滿意概率。

在知道男孩的才華為4分,顏值為3分的時候,滿意概率為:

用貝葉斯定理來推斷他是不是你心中滿意的男孩

分析:顯而易見,更多的信息有助於做出更準確判定。顏值=3分幫小A獲得了一個信息,男孩子有才華,顏值不差,所以滿意概率會有些許上升。另外,聰明的小A在計算概率時,為了簡化計算,假設才華與顏值沒有任何關係、彼此獨立,這便是所謂的“樸素貝葉斯(樣本的特徵之間彼此無關)”。

用貝葉斯定理來推斷他是不是你心中滿意的男孩
  • 第四天

今天,小B決定讓這兩位互相見見面,認識一下。小A在小B的陪伴下,把自己打扮得美美噠,跟這位男孩一起吃晚飯。談吐之間,男孩子熱情大方開朗,小A對此印象甚是不錯。於是乎,小A對最終其打分為性格4分,顏值3分,才華4分。小A當場迅速得計算了下:我跟這位男孩談戀愛,將來能有多大的概率最終感到滿意呢?

用貝葉斯定理來推斷他是不是你心中滿意的男孩

用貝葉斯定理來推斷他是不是你心中滿意的男孩

分析:換一個角度來思考小A的歷程,小A在未了解男孩的任何信息的時候,她有35.72%的概率對男孩子不滿意,可能是擔心男孩的樣子她不喜歡,擔心他性格暴躁等等;當知道男孩才華為4分時,她的疑慮有所打消,故不滿意的概率下降為29.89%;然後每一次得到更多有益的信息,小A的疑慮都會有一定程度的下降。但注意,即使如此,這個性格4分,顏值3分,才華4分的男孩仍然有23.79%的概率使小A不滿意,這或許可以用“有緣無分”來解釋吧,貝葉斯大爺也無能為力。

  • 第五天

小A開始最後的糾結,她要做出決定:是不是要開始進行這段戀愛關係?

小B:你不是對人家挺滿意的嘛?那就去試一試唄。

小A:你說的不錯呀,但是我只有76.21%的把握對其滿意呀。

小C(小A的舍友):我比較謹慎小心,如果他是一個不滿意的男孩,而我把他誤認為滿意的男孩,那得多痛心疾首啊。如果是我,我更可能拒絕他。四分之一的出錯概率呢,還是不低呀。

小A(沉思片刻):我們可以利用“貝葉斯決策理論”來解決。嗯······對於我而言,把一個不滿意的男孩誤認為是滿意的男孩會對我影響不算大,就當有100點影響吧;但是把一個本應感到滿意的男孩認定成不滿意的男孩,我覺得會受到999點影響,然後

用貝葉斯定理來推斷他是不是你心中滿意的男孩

我應該認定這是一個滿意的男孩。

用貝葉斯定理來推斷他是不是你心中滿意的男孩

小B:......

小C:......

分析:小A在最終做決策時,不僅利用了後驗概率,還充分考慮了做出錯誤決策的代價損失。經過計算,這個男孩對小A而言,最終決策是判定為滿意男孩;而同樣的問題,小C的計算結果則會將其判定為不滿意男孩,因為小C十分擔心不滿意男孩誤判成為滿意男孩的問題。

這就是貝葉斯公式!幾千年的數學發展歷史長河中,有很多看上去很簡單的數學公式定理,但是它背後的威力是無窮的,讓這個世界發生了翻天覆地的改變,貝葉斯公式如此,洛必達公式,歐拉公式也是如此。


分享到:


相關文章: