辛普森悖論解密:詭異的男女比例

大學的男女比例問題一直是廣大宅男同胞所關心的重大問題,也是高中同學聚會時必然談起的話題,對於選擇大學來說,這也是一項重要指標。

一天,我拿出兩個大學(P 大和 T 大)的統計數據開始研究。“物理學院,P 大男女比例大於 T 大;數學科學學院,P 大男女比例又是大於 T 大⋯⋯哇,怎麼所有專業 P 大的男女比例都高於 T 大啊⋯⋯那還猶豫什麼呢,我肯定報 T 大了!”正當我剛剛心意已定的時候,突然看到了統計數據的最後一行:P 大的總體男女比例低於 T 大!“什麼?!有沒有搞錯?怎麼可能 P 大的所有專業男女比例都高於 T 大,但是整體男女比例卻低於 T 大了呢?!肯定是哪裡算錯了吧⋯⋯”於是我拿出計算器狂敲,卻發現沒有任何一個計算錯了的數據。這種情況真的可能發生嗎?

統計數據不說謊

多說無益,請看下面編造出來的一份男女比例數據(其中假設兩所大學都只有物院和外院兩個專業):

辛普森悖論解密:詭異的男女比例

數據可不會是騙人的,不信可以自己動手驗算一下,真的出現了這種違背常理的情況!這種現象被稱為“辛普森悖論”。雖然這麼叫,但其實這不是個真正的悖論,它內部沒有包含邏輯上的矛盾,只是有些違揹人們的常理罷了。

辛普森悖論的直觀認識

可能有些人還是一頭霧水,雖然數據是如此沒錯,可還是不能理解到底發生了什麼使得結論如此古怪。讓你構造一個類似的數據,恐怕你也很難直接想得出來吧!人們對幾何圖形的想象能力總是高於對數字和字母的想象,因此為了更直觀地表現出辛普森悖論,我們看下面一幅向量圖:

辛普森悖論解密:詭異的男女比例

圖中,黑色的線代表 P 大數據,紅色的線代表 T 大的數據。A p 點的橫座標為 P 大外院女生人數,縱座標為 P 大外院男生人數;B p 點的橫縱座標則分別為 P 大總女生人數和總男生人數。A t 和 B t 點的意義與之相對應。

設座標原點為 O,則 OA p 的斜率表示的就是 P 大外院的男女比例,A p B p 表示的是 P 大物院的男女比例,OB p 表示的則是 P 大總男女比例;T 大的各線段斜率意義與之對應。

如此一來,一切都變得清晰起來了。辛普森悖論反映在這張圖上,就成了一個顯然的事實:在 P 大的外院、物院兩個向量的斜率分別大於 T 大的兩個向量的斜率的條件下,總人數向量的斜率當然不一定哪個大呀!根據這個直觀的理解,你也可以隨意編造能產生辛普森悖論的數據了吧!

辛普森悖論解密:詭異的男女比例

知道了辛普森悖論這一事實之後,我們以後對待統計數據就要更加小心了。在數學中,經常會出現這種出乎人們意料的驚人事實,所以還是一定要學好數學啊!


分享到:


相關文章: