頂著人類的直覺破浪前行,是一件困難的事。
--蒙洛迪諾
首先,你要搞暈的這個聰明人,必須是真聰明;
其次,你用來搞暈他的,必須是一個看起來不那麼複雜的問題。
為了減少寫作的道德壓力,我直接選了一個已經搞暈了不少聰明人的題目。
事實上,在互聯網時代,已經很難有什麼有爭議的嚴謹題目。
然而我要說的這道題,不僅在網上吵翻天,連在頂尖的學術專家之間,也會產生分歧。
讓我們立即開始吧。
一
蒙洛迪諾曾經與霍金合著過《時間簡史》,他的《醉漢的腳步》是一本非常棒的講概率和隨機性的書。
在講到“樣本空間”這個概念時,蒙洛迪諾出了一道題:
題目A:生男生女
一家兩個小孩,已知生男生女概率相同,已知一個是女孩。
請問另外一個也是女孩的概率是多少?
這道題看起來似乎很簡單:
已知一個是女孩,另外一個要麼是男孩,要麼是女孩,答案應該是1/2呀?
解答:根據樣本空間的概念,也就是我在為什麼真正聰明的人都是概率高手?(零公式入門篇)裡說的“平行宇宙”,用窮舉法,兩個小孩有如下四種可能--
第一胎 第二胎
男 男
男 女
女 男
女 女
所以,已知有一個是女孩,所以排除第一種可能,剩下三種可能性,答案是1/3。示意圖如下:
對於本題的讓人迷惑之處,蒙洛迪諾解釋道:如果我們指定了哪一個是女孩,例如老大是女孩,那麼另外一個也是女孩的概率就變成了50%。
如上圖:因為一旦指定了老大是女孩,上面的四種可能性中,要把“男-男”和“男-女”兩個可能從樣本空間中去掉,這樣只剩下“女-男”和“女-女”,所以“女-女”的概率是50%。
二
然而,另外一個聰明人“不贊成”這個答案。
他就是加里·史密斯,耶魯大學博士,曾在耶魯大學任教7年,其間兩度獲得教學獎。
他在《簡單統計學》一書中,指名道姓地批評了蒙洛迪諾的“謬誤”。
加里·史密斯用另外一種方式陳述了題目:
題目B:另一個孩子
一個名叫史密斯的男人正在和他的女兒散步。
史密斯說,他們家還有一個孩子。
請問:這個不在身邊的孩子是女孩兒的概率是多少?
看起來這道題的表述似乎和蒙洛迪諾的題“類似”,然而加里·史密斯有完全不同的解答。
首先他毫不留情地批評“專家”們“三分之一”的答案錯了。
加里·史密斯給出了一個表格:
B是指男孩,BB就是指老大男孩老二也是男孩。
G是指女孩,BG就是指老大男孩老二是女孩。
上圖顯示了在 BB、BG、GB 和 GG 之間均勻分配的 400 個家庭。
讓我們不厭其煩地跟著作者分析一遍。
已知:
- 在史密斯有兩個男孩兒的 100 種情況中(BB),他總是和一個男孩兒散步。
- 在史密斯有兩個女孩兒的 100 種情況中(GG),他總是和一個女孩兒散步。
- 在他擁有一兒一女的情況中(BG 或 GB),一個合理的假設是,他與男孩兒或女孩兒散步的概率相等。
分析:
- 觀察第一行,即史密斯和女孩兒散步的 200 種情況。在 100 種情況中(GG),不在場的孩子是女孩兒,在另外 100 種情況中(BG 或 GB),不在場的孩子是男孩兒。
- 在第二行裡(史密斯和男孩兒散步的 200 種情況),在 100 種情況中(BB),不在場的孩子是男孩兒,在另外 100 種情況中(BG 或 GB),不在場的孩子是女孩兒。
結論:
不管和史密斯散步的孩子是女孩兒還是男孩兒,他的另一個孩子是男孩兒或者女孩兒的概率都是相等的。
(以上圖表和分析來自《簡單統計學》,後面我會給個更簡單更形象的計算。)
所以,答案應該是1/2,而不是1/3。
當然,這個問題也能夠用常識直接回答掉:
看到一個是女兒,和另外一個還是是男是女沒關係。
所以另外一個是女孩的概率是1/2.為什麼要計算那麼複雜呢?
原因在下面。
假如你沒有感到一點點暈,那麼你並不是真的懂。最多隻是在較淺的層次懂了。
三
那麼霍金的合著者,與耶魯大學的博士,到底誰對誰錯呢?
真相是:
1、兩個人的答案都是對的。
2、但“耶魯博士”對“霍金合著者”的批評是錯的。
那問題出在哪兒呢?
原因是:
這兩位牛人討論的題目,壓根兒不是同一個。
我們再來看一下。
(霍金的合著者)題目A:
兩個孩子,已知至少有一個是女孩,另外一個是女孩的概率是多大?
(耶魯大學博士)題目B:
兩個孩子,親眼看見一個是女孩,另外一個是女孩的概率是多大?
難道這說的不是一回事兒嗎?
“親眼看見一個是女孩”,不就證明了“至少有一個是女孩”嗎?
你覺得呢?
搞暈聰明人的時刻到了。
你看,即使是耶魯的博士,也混淆了二者之間的區別。
(《簡單統計學》是很好的書,而且也有較小概率是我說錯了。)
四
最簡單的方法是採用貝葉斯公式來計算,但是我繼續採用
零公式的方式,來做一些可感知的推理。“至少有一個是女孩”,與“親眼看見一個是女孩”,並非一回事情。
這個是關鍵。
這二者直接的差別,可以從空間、時間兩個維度的“整體與局部關係”來揭示。
1、先看空間維度的“整體與局部關係”。
“至少有一個是女孩”,不能確保你親眼看見的那個就是女孩。
儘管你可以由“親眼看見一個是女孩”推理出“至少有一個是女孩”,但是,你不能由“至少有一個是女孩”推理出“親眼看見一個是女孩”。
我用畫圖來形象描述一下:
如上圖所示,“親眼看見一個是女孩”被包含於“至少有一個是女孩”。也可以說,“親眼看見一個是女孩”是比“至少有一個是女孩 ”信息更多的概率描述。
2、再看時間維度的“整體與局部關係”。
“至少有一個是女孩”,是上帝視角的統計結果;
“親眼看見一個是女孩”,是人肉視角的觀察結果。
我用時間維度來說,未必精確,但大致是一個形象化的描述。
如上圖所描述--
(藍色字體)統計:上帝視角的統計結果,是對符合“至少有一個是女孩”的所有樣本空間的整體描述;
(紅色字體)觀察:人肉視角的觀察結果,是對其中一個平行宇宙的實際結果“親眼看見一個女孩”的真實描述。
五
理解了本質差別之後,我們再來看看上面兩道題。
(霍金的合著者)題目A:
兩個孩子,已知至少有一個是女孩,另外一個是女孩的概率是多大?
這道題目,其實是關於“樣本空間”的概率問題。
所以基於上圖之“統計”那一列,可以得出結果是1/3。
(耶魯大學博士)題目B:
兩個孩子,親眼看見一個是女孩,另外一個是女孩的概率是多大?
這道題目,其實是關於從“結果”推理“原因”的計算。
沒錯,這就是一個貝葉斯計算。
我們不用公式,就可以清晰地推理計算。
看見一個女孩,只會發生在“男女、女男、女女”三個樣本空間裡。
所以,當“親眼看見一個女孩”,問另外一個是女孩的概率是多大,其實是在問:
兩個孩子,親眼看見一個是女孩,那麼她來自“女-女”家庭的概率是多大?
(我有點兒產生自己是個不錯的中學老師的幻覺了,因為知乎上那麼多聰明人就這個問題吵得不可開交,卻沒人像我這樣轉化問題。當然有可能我沒看到哈,或者我乾脆也說錯了。)
我把“男女、女男、女女”三個樣本空間重新擺成下面這個樣子,因為面積代表可能性的數值(平行宇宙的胖瘦,我在《如何用小概率賺大錢?》承諾過要講,所以這裡簡單帶一下),這樣就可以“可視化+可計算”了。
(上圖三個長方形的面積應該一樣,畫得不好。)
因為“親眼看見一個是女孩”,這個觀察結果,發生在上圖黃色區域裡。
根據面積比例可以發現,“女-女”佔了觀察結果是一個女孩的可能性的50%。
我們很容易得出結論:
根據“看見一個女孩”這個觀察結果,她來自“女-女”家庭的可能性是50%。
所以,當你親眼看見一個女孩,另外一個也是女孩的概率是50%。
這裡有點兒“詭異”的地方是,“親眼看見一個女孩”這個“果”,更新了我們對於這個女孩來自於什麼家庭(因)的“信念”。
六
為什麼古希臘人沒能發展出概率理論呢?
蒙洛迪諾認為,一個答案在於許多古希臘人相信,未來是按照神的意志而發展的。
蘇格拉底曾經說,任何“在幾何中使用概率和似然性進行論證”的數學家“都不配成為第一流”。
為什麼中國古代沒有發展出概率理論呢?
儘管中國古代哲學裡有很了不起的“灰度理念”,但卻缺乏用數學進行計算的思維。
一直到16世紀,一個叫卡爾達諾的人,才用自己瘋狂的大腦和混亂的人生,叩開了概率的大門。
再到17世紀,帕斯卡和費馬在一系列偉大的通信中討論了賭博和概率。
貝葉斯的登場是悄無聲息的。
1748年,蘇格蘭哲學家大衛·休謨寫了一篇題為“論神蹟”的文章,其中他指出,目擊者的證詞永遠無法證明神蹟的發生。
很難說貝葉斯的研究是為了反駁休謨,並證明上帝的存在。因為他並未在生前發表自己的“貝葉斯公式”。
休謨主張我們對於因果的概念只不過是我們期待一件事物伴隨另一件事物而來的想法罷了。
“我們無從得知因果之間的關係,只能得知某些事物總是會連結在一起,而這些事物在過去的經驗裡又是從不曾分開過的。我們並不能看透連結這些事物背後的理性為何,我們只能觀察到這些事物的本身,並且發現這些事物總是透過一種經常的連結而被我們在想像中歸類。”朱迪亞·珀爾在《為什麼》裡寫道:
休謨的觀點很自然地引發了一個問題,有人可能會稱其為福爾摩斯式的問題:需要多少證據才能讓我們相信,我們原本認為不可能發生的事情真的發生了?在何種情況下,某個假設才會越過絕不可能的界限抵達不大可能,甚至變為可能或確鑿無疑呢?貝葉斯公式“簡單”得讓人意外,但他確實提出了一種了不起的思路:
我們可以從一個“果”推斷某個“因”的概率。
這就是貝葉斯時代的“逆概率”推理。
不同於通過“因”找到“果”,貝葉斯公式是通過“果”找到“因”。
通常意義上這是非常困難的事情。而貝葉斯致力於打破這種認知不對稱,並提出了一種即使並非數學天才也能使用的估算逆概率的方法。
從貝葉斯法則到貝葉斯網絡,人工智能找到了處理不確定性的秘方。
休謨和貝葉斯最後相逢於科學方法。
朱迪亞·珀爾對此總結道:
“從許多層面來說,貝葉斯法則都是對科學方法的提煉。教科書對科學方法的描述是這樣的:(1)提出一個假設;(2)推斷假設的可檢驗結果;(3)進行實驗並收集證據;(4)更新對假設的信念。通常,教科書涉及的只是簡單的正確和錯誤兩種結果的檢測和更新,證據要麼證實了假設,要麼駁斥了假設。但是生活和科學從來不會那麼簡單!所有的證據都包含一定程度的不確定性。貝葉斯法則告訴我們的正是如何在現實世界中執行步驟(4)。”讓我暫停對貝葉斯的追溯,再次回到那兩道搞暈聰明人的題目。
我想表達的是,儘管人的大腦對概率的直覺很一般,但是,如果我們可以用可感知的方式,去分析概率計算的因果關係,會更加有助於理解這個世界的不確定性。
最後
主觀猜測與客觀結果,是如何通過概率聯繫在一起的?
為什麼決定一個事情發生與否的概率,可以因為一些看不見摸不著的東西變大或者變小?
未來可能發生的事件,和過去可能發生的事情,會有什麼本質上的不同?
個體的觀察會如何決定”平行宇宙”的存在與消失?
以及,到底是誰在主宰我們的命運呢?
最後,關於概率的書,《醉漢的腳步》、《簡單統計學》、《為什麼》這三本算是不錯的。
其中,《為什麼》尤其有助於你再多搞暈幾個人。
所以,誰是你最想搞暈的聰明傢伙?
閱讀更多 孤獨大腦 的文章