因為這個數學悖論,美國曾不允許宣傳吸菸導致肺癌

把科學帶回家” 提供


因為這個數學悖論,美國曾不允許宣傳吸菸導致肺癌


參考資料 The Book of Why: The New Science of Cause and Effect等

編譯 七君


第一次聽說辛普森悖論(點我查看)的人,會對人生產生懷疑。但是有一個經典的統計學悖論,第一次聽說的人也會感到異常迷惑。而且這個悖論,和我們的日常生活息息相關。


現在大部分人都知道吸菸會導致肺癌,對孕婦和胎兒也有害。但是在50年前,一些著名科學家曾經認為,吸菸對某些胎兒有好處,而美國政府甚至在1984年之前不允許宣傳“吸菸導致肺癌”。這到底是怎麼回事呢?


因為這個數學悖論,美國曾不允許宣傳吸菸導致肺癌


50年的悖論:吸菸對胎兒有利?


事情要從50年前說起。


在20世紀50年代的時候,有不少證據指出,吸菸會導致肺癌。可是在60年代的時候,一些研究發現,如果孩子生下來的時候體重過輕,那麼母親吸菸對孩子反而是件好事,這就是經典的出生體重悖論(birth-weight paradox)。


因為這個數學悖論,美國曾不允許宣傳吸菸導致肺癌


對我們來說這個現象顯然違背基本常識,但要注意,我們的“常識”建立在科學界的共識上。在當時,科學界針對這個詭異的現象,站成了兩派。


加州大學伯克利分校的生物統計學家 Jacob Yerushalmy 就是贊同吸菸對體重過輕的嬰兒有好處的那一派。


1959年,Jacob Yerushalmy 主持了一項大型的長期研究,他收集了超過1.5萬名舊金山灣區兒童的數據,包括他們出生體重、他們的母親是否吸菸等。


當時科學家們已經知道,吸菸的母親生下的孩子的體重比不吸菸的母親要低。而美國的一項全國性研究也發現,低出生體重(LBW)的嬰兒在人生頭年的死亡率是正常體重嬰兒的20倍。所以,我們很容易得出這樣的因果邏輯鏈:


母親吸菸——>嬰兒出生體重偏低——>嬰兒死亡。


因為這個數學悖論,美國曾不允許宣傳吸菸導致肺癌


本身是菸民的 Yerushalmy 就想看看,這個因果關係到底成不成立。但是,數據給出的結果卻出乎許多人的意料:吸菸母親生下的LBW嬰兒的死亡率要比不吸菸的母親生下的LBW嬰兒低。


換句話說,如果只看LBW嬰兒,我們就會得出這樣一個結論:母親吸菸反而有好處。


在報告這個悖論時,Yerushalmy 寫道:“這個悖論的發現駁斥了吸菸有害胎兒健康的觀點。”如果吸菸真的對胎兒有害,那要怎麼解釋這個令人困惑現象呢?


出生體重悖論在近50年的時間裡難倒了許多生物學家和統計學家,許多人甚至把它看成出生體重特有的矛盾。


因為這個數學悖論,美國曾不允許宣傳吸菸導致肺癌


在2001年發表在 International Journal of Epidemiology 上的一項研究中,美國國立環境衛生研究所生殖流行病學小組組長、流行病學家 Allen J Wilcox 指出,後來越來越多的證據駁斥了 Yerushalmy 的觀點,證明吸菸對母嬰是有害的,比如吸菸會影響氧氣通過胎盤的傳輸,出生時體重較輕的人日後患有哮喘、高血壓,或者智商更低的可能性也更高。


因為出生體重能預測嬰兒未來身心健康的許多方面,因此在美國,增加出生體重就成為減少嬰兒死亡率的一大舉措。但是,出生體重悖論卻一直沒有被解決。


因為這個數學悖論,美國曾不允許宣傳吸菸導致肺癌


直到2006年,波士頓大學和美國國家兒童健康和人類發育研究所的研究者發表在《美國流行病學雜誌》(American Journal of Epidemiology)上的一項研究才提出了令人信服的解釋。原來,吸菸的確會導致LBW,但是LBW的成因並不只有母親吸菸一個。


許多更嚴重的疾病也會造成LBW,比如基因缺陷或者營養不良。這樣一對比,在所有LBW的原因中,吸菸算是傷害點比較小的那個了。


反過來說,如果LBW的孩子母親不吸菸,那麼造成LBW的原因往往比吸菸更嚴重,因此孩子的死亡可能性也更高。


因為這個數學悖論,美國曾不允許宣傳吸菸導致肺癌


話說回來,類似的悖論在生活中層出不窮。


再舉個例子,醫學研究發現,酒精成癮和肝癌都會造成血液中的轉氨酶升高。轉氨酶是肝臟的一種重要蛋白質,如果肝臟受損,那麼血液中轉氨酶的濃度就會上升。


但奇怪的是,在轉氨酶比較高的患者中,酒精成癮的人的短期死亡率反而比不喝酒的人要要低。


因為這個數學悖論,美國曾不允許宣傳吸菸導致肺癌


這個悖論的解法也是一樣的:如果你不喝酒,那麼如果你轉氨酶升高,更可能的原因就是肝癌。


這些悖論告訴我們,分辨因果關係是多麼困難的一件事,哪怕是常年和數據打交道的科學家們也無法輕易下結論。


倖存者偏差


出生體重悖論和酒精成癮悖論讓許多人感到不寒而慄:用日常生活中的現象得出的經驗啊、因果關係啊會不會都是假象呢,我們有什麼辦法能夠辨明真相呢?


想要獲得真相,也就是真正的因果關係,就必須要先來了解一下對撞因子偏誤(collider bias)。實際上,出生體重悖論是對撞因子偏誤的完美案例。


對撞因子是啥玩意兒?


簡單來說,假設我們觀察到了現象X和Y,我們想要確認它們之間有沒有因果鏈,那麼對撞因子就是能被X和Y影響的另一個因素。


對撞因子畫成圖就是這樣的——


因為這個數學悖論,美國曾不允許宣傳吸菸導致肺癌


很多時候,我們覺得X好像是Y的原因,但實際上兩者可能沒有關係,真正的幕後推手是隱藏的對撞因子。


舉個最著名的例子——倖存者偏差。


因為這個數學悖論,美國曾不允許宣傳吸菸導致肺癌


二戰期間,盟軍從戰區飛回來的飛機中,機翼上的彈痕最多,機尾和引擎最少。許多人據此得出結論:應該加強機翼,因為你看機翼的彈孔最多嘛。


但是匈牙利數學家、美國哥倫比亞大學教授沃德·亞伯拉罕(Wald Ábrahám)卻認為,要加強機尾和引擎,因為這些部位被打中的飛機根本飛不回來。事實證明果然如他所料。


因為這個數學悖論,美國曾不允許宣傳吸菸導致肺癌


在這個例子裡,X就是“中彈部位”,Y是“中彈數量”,“倖存”就是對撞因子。在飛回來的飛機裡,中彈部位和中彈數量的確有相關性,因為你看機翼中彈多,機尾和引擎少嘛。


因為這個數學悖論,美國曾不允許宣傳吸菸導致肺癌


但實際上中彈部位和中彈數量沒有因果關聯,你看電影裡打飛機的時候大家都是一頓亂射嘛,只不過它們都可以決定飛機是否能倖存,因而出現了虛假的相關性。


亞伯拉罕明白,所有上過戰場的飛機各處彈孔數量是隨機的,為什麼單單飛回來的飛機都是打在機翼上呢?顯然沒能飛回來的都打在其他部位了嘛。


在科學研究和日常生活中,倖存者偏差層出不窮,所以如果只看那些沒死的病人、有錢人、成績好的人有什麼什麼特點,很容易就得出錯誤的結論。


當然,破壞X和Y之間因果鏈的不止對撞因子,還有干擾因子等,它們都屬於可愛又迷人的反派、貫徹愛與真實的邪惡的潛變量,我們在介紹辛普森悖論的時候就簡單提到過,有興趣的可以再回顧一下(點我)。


如何證明吸菸導致肺癌?


有趣的是,正是潛變量的可能存在,美國政府到了1984年才出臺了Comprehensive Smoking Education Act(全面菸草教育法案),開始允許宣傳“吸菸導致肺癌”。


因為這個數學悖論,美國曾不允許宣傳吸菸導致肺癌

1984年的全面菸草教育法案出臺後,美國售賣的香菸上出現了美國衛生部醫務總監的警告:吸菸導致肺癌、心臟病、慢性阻塞性肺疾病、妊娠併發症。

@wikipedia


這背後的邏輯其實和出生體重悖論,以及倖存者悖論是一樣一樣的。既然有一個潛變量致使不能簡單地推導出“吸菸導致嬰兒死亡”這個說法,那麼,是否也存在一個潛變量能夠完美拆解“吸菸導致肺癌”這個因果鏈呢?


你想啊,要是存在某個基因,它讓你容易菸草上癮,也讓你容易患肺癌,那麼吸菸導致肺癌這個說法就站不住腳了啊,是你爸媽沒有把你生好才是本質。


菸草公司當然希望把鍋丟給你的基因,或者其他什麼潛變量。而著名的統計學家、現代統計學的奠基者之一羅納德·艾爾默·費希爾(Ronald A. Fisher)也是這種看法的堅定支持者。


因為這個數學悖論,美國曾不允許宣傳吸菸導致肺癌

羅納德·艾爾默·費希爾(Ronald A. Fisher),他並不是因為吸菸而毛髮茂密。


科研繞不開的統計工具、理科生普遍要學的方差分析就是大神費希爾的發明,對了費希爾本人是老煙槍,所以利益相關。為此,費希爾還在1957年寫信給宣傳吸菸導致肺癌的《英國醫學雜誌》(the BMJ),聲稱這是統計文盲在製造恐慌。


因為統計學大佬親自為菸草站臺,所以當時科學界也在這個問題上抓耳撓腮,爭論了數十年。


有人可能會說,要是科學研究都可以被潛變量解釋,那豈不是所有研究結果都要存疑了?


是這樣子,但是我們也有建立因果邏輯鏈的簡單粗暴的方法,那就是隨機雙盲實驗。


因為這個數學悖論,美國曾不允許宣傳吸菸導致肺癌


比如,用丟硬幣的方式,讓某人吸菸或者不吸菸,然後過一段時間觀察他們的死亡率,“吸菸導致肺癌”這個問題就可以被輕鬆證明或證偽。你細品一下,二戰時的倖存者飛機、吸菸的人、醫院裡的肺癌病人,實際上都不是隨機雙盲的結果,所以用他們來推導原因是很困難的。


但問題在於,讓人類去當小白鼠是不道德的,所以研究者不能做這樣的實驗,拿不到直接的證據,只能根據自然的吸菸者和不吸菸者的差別進行研究。這也是為什麼,美國要花這麼長時間才允許宣傳吸菸有害。


因為這個數學悖論,美國曾不允許宣傳吸菸導致肺癌


你可能會問,既然不能拿人類做實驗,那麼最後是怎麼確認這個因果鏈的呢?


實際上,吸菸和肺癌之間的因果鏈的確認,靠的是大量研究證據,以及敏感度分析(sensitivity analysis)等新一代的統計模型。大量的實驗研究逐一推翻了不可能的潛變量,最終說服和絕大部分科學家和政策制定者,確立了吸菸和肺癌之間的因果鏈。


“吸菸導致肺癌”只有6個字,但是這6個字的證明過程卻這麼複雜,沒想到吧!


因為這個數學悖論,美國曾不允許宣傳吸菸導致肺癌


根據亞伯拉罕的思路我們明白,看到學習後脫髮了就給頭部大量使用防脫洗髮水是不對的,應該用防脫洗髮水加強鼻毛和腋下才對。


關注微信公眾號:把科學帶回家,有你想看的科普。


分享到:


相關文章: