我們可以相信經驗嗎?——論醫學的相關性和因果性

前幾天知乎上有一個問題,“為什麼西醫一定要與以無數代人健康為代價篩選出來的中藥對立,眾多先民當小白鼠驗證過的東西就沒任何價值?”

這個問題有很多爭議,下面僅以個人觀點談一談,現代醫學是如何建立

說來也挺有意思的,為什麼現代醫學一定要“揪著”隨機試驗不放,為什麼要拋棄這些看似很寶貴,且犧牲了很多人的經驗。其實,理由只有一個:這些經驗很有可能是錯的。當然,這些經驗裡面也必然有正確的地方,但是,我們很可能不知道哪些是正確的,哪些是錯誤的

現代醫學建立的時間並不長,上世紀40年代末,才有的第一個臨床隨機試驗,可以視作現代醫學的開端。1959年,牛津醫學教授George Pickering爵士曾說過:“醫生個人的臨床經驗是無計劃、雜亂的,而且非常不靠譜。”後來臨床流行病學開始發展,逐漸認識到隨機對照試驗的重要性,並將隨機對照的地位逐漸提高。最終1992年,循證醫學正式建立,並在證據金字塔中將隨機對照試驗置於頂端,成為醫學中的“金標準”。

那麼為什麼非要執著於隨機試驗不可?!簡單的說:

我們需要因果效應

經驗與因果

試想,我們所有觀測到的結果,例如:今天我吃了A藥然後病好了,都只能說明某一個行為A“吃藥”對某一個結果Y“病好了”有相關性。因為有可能你吃藥的過程中(或過程前後)也同樣發生這一些別的事件B影響著“病好了”這個結果Y,那麼如何知道是因為行為A“吃藥”還是事件B導致了結果Y的發生,如果每次行為A的發生同時伴隨著事件B,那麼我們將每次在行為A過後都會觀測到發生了結果Y,而事實上很有可能是事件B導致了結果Y的發生。

上述同樣的情形,在所有經驗總結中都存在,既然稱之為“經驗”,尤其是古代經驗,必然是人們觀測到的結果,大體上代表了一定的相關性。例如可能有很多事件C、D、E同時影響著行為A和結果Y,還有一些事件F、G同時被行為A和結果Y影響著,均可能造成額外的相關效應來源。

這是什麼意思呢?假如行為A原本對結果Y並沒有任何影響(即:無因果效應),但是,由於事件C的存在,同時影響著行為A的發生和結果Y的發生,那麼此時我們觀測行為A和結果Y之間會存在相關性,所以這個相關性是除了因果效應以外,“多”出來的那一部分效應值,稱為

額外的效應。醫學上稱這個事件C為混雜因素。

一個簡單的例子則是吸菸、肺癌、打火機之間的故事。很明顯是否攜帶打火機本身和患肺癌風險是否增加無關,然而,吸菸者會更多的攜帶打火機,而吸菸同時也會引起肺癌風險增加。也就是說,是否攜帶打火機這件事本身因為伴隨著吸菸概率的增加,出現了與肺癌風險之間的相關性,所以吸菸被稱為攜帶打火機和肺癌之間的混雜因素。

這個例子很簡單,所以一目瞭然,然而,試想如果我們的知識中不存在“吸菸”這個概念,那麼對“吸菸”引起了混雜偏倚自然也不可能知道,我們則會總結出觀測經驗:攜帶打火機可以導致肺癌風險增加。這便是大多數經驗所犯的錯誤,誤把相關性當成因果性

所以,這些經驗均代表了一定的相關性,而相關性在醫學中是不可取的。那麼有人會說:明明很多相關性都確實起了作用,類似於中藥中有部分藥也是有作用的,這是因為:如果一個相關性確實起了作用,當且僅當,這個相關性中包含有因果效應。但不是每一個相關性都那麼幸運包含有因果效應,所以我們才需要識別這些相關效應中的因果效應。

兩種因果效應

那麼,因果效應是什麼。

如果觀測到的均是相關性,因果效應應該怎麼定義。試想如果我們同一時刻,同時接受兩種不同的干預水平,即:干預和不干預。那麼我們只需要將干預後的結果和未乾預後的結果比較一下,便知道了兩者的差異,即因果效應。但是,現實生活中並不可能做出這樣的事情,(在平行宇宙中或許可能),因此,這又被稱為“因果推斷基本難題”。

那麼,是不是不可能得到因果效應了,事實上也不一定,我們可以依賴一些假設來達到目的。上述問題中,所涉及的是某一個人在同一時刻接受兩種干預水平,所以這被稱為:個體因果效應。個體因果效應即每個人自己的因果效應,不同的人當然不同,但是能得出這個效應對這個個體也很有幫助。

有人會說:為什麼不能同一個人在不同的時間點,接受兩種水平的干預。也就是今天我先不接受干預,明天我再接受干預,比一下不就行了。事實上,這個行為被稱為“個人觀察經驗”,也就是我們常說的“我覺得我用某個藥有效果”。正式的,我們稱這個行為為:

個體交叉實驗(Crossover experiments)。

個體交叉實驗是唯一可以得出個體因果效應的方法,然而需要3個不可驗證假設:(1)干預無滯後效應(no carryover effect),(2)個體接受干預時的因果效應不取決於時間(即無論今天或明天接受干預測量結果相同),(3)個體未接受干預時的因果效應不取決於時間(無論今天或明天不接受干預測量結果相同)。所以,當下次我們要說出“我用某個藥一下就病好了”前,想想這三個假設是否滿足,或者至少經驗上滿足。然而,因為生物異質性存在,個體因果效應仍然無法輕易外推到其他人身上。(所以就算在你身上有用,別人身上也不一定有用)

那麼,即使個體因果效應假設滿足(一般很難滿足),依然對醫學整體決策意義不大,因為效應沒有外推性。怎麼辦?要想因果效應有外推性,我們首先想到的是讓一群人來試驗不就行了,人越多外推性就越強。事實上,這個思路是對的,正式的,我們稱其為:平均因果效應

所以,平均因果效應的定義

是什麼?為了簡便,我們暫時忽略隨機變異的影響,假定研究在一個無限超總體中(即每個人代表1億個人或更多)。假設一項研究有10個人,其中6個人接受了干預(A=1),4個人未接受干預(A=0),最終的結果記為Y。那麼平均因果效應的定義是:假如這10個人全部接受干預(A=1)的最終結果E[Ya=1],和假如這10個人全部未接受干預(A=0)的最終結果E[Ya=0]之間的差值(或比值),即E[Ya=1]-E[Ya=0]。

相關性的定義是:這6個接受干預(A=1)的人的最終結果E[Y|A=1],和4個未接受干預(A=0)的人的最終結果E[Y|A=0]之間的差值(或比值),即E[Y|A=1]-E[Y|A=0]。

上述的兩個定義(平均因果效應和相關性),告訴我們以下幾件事:首先,平均因果效應也面臨因果推斷基本難題,一群人也無法同時接受兩種干預水平。其次,我們平時觀察並總結的是相關性,並非因果效應,很明顯,兩者的區別是:平均因果效應是10個人比10個人,而相關性是6個人比4個人。

這就印證了一句古話“相關性不等於因果性”,事實上Fisher先生上世紀50年代用這句話強烈反駁當時吸菸導致肺癌的研究,同時與Cornfield教授展開激烈的爭論,而Cornfield教授反駁Fisher先生的方法,正是現在我們使用的敏感性分析的雛形。回到我們的例子中,除了上述這些比較顯然的事以外,最重要的是:是否存在某些情形,使得相關性等於因果效應,那麼我們就可以通過相關性來進行因果效應的計算。

事實上,在哪些條件下(或哪些假設下)相關性等於因果效應,這是因果推斷的核心內容,也被稱為:識別問題(Identification problems)。回到文章開頭,為什麼我們必須要進行隨機試驗,因為在理想的隨機試驗中,相關性等於因果效應。而在非隨機試驗中,當滿足3個條件時:可交換性(Exchangeability)、正性(Positivity)、一致性(Consistency),相關性也可以等於因果效應,這裡就不展開說了。

相關性與因果性

所以,為什麼有些時候我們傾向於認為中醫理論是不太可取的,簡單的說,這個理論是建立在觀測結果上的,也就是無論它再怎麼精妙,終究無法識別因果效應,更何況它並不是特別精妙,存在一些矛盾。那麼中藥的經驗是否可取,如前所述,所有的經驗均是相關性,它們是否包含因果效應,不知道,可能有可能沒有,所以就算將來的隨機試驗驗證了某個中藥確實有效果,也不代表這些經驗全部是正確的,因為有些相關性確實包含因果性,但仍有部分相關性不包含因果性,有點賭博的成分(當然不完全是隨機發生的),但我們不能完全寄託於這種相關性身上,醫學是一門嚴肅的學科,應該儘可能減少錯誤。

我猜有些機器學習專業的同學肯定不服了,比如我們通過某些事件每次都能準確預測結果,那麼這樣的事件還沒有用嗎?如果把古代中醫經驗當成一個大型神經網絡,那不是也不斷擬合不斷修正嗎?先不談這個大型神經網絡是否精妙,假設它是精妙的,那麼這個經驗可以使用嗎?答案是:依然不可以。

無論多麼精妙的神經網絡,依然代表了某種比較強的相關效應,可能其中包含一些因果效應,但終究它本身不是因果效應。還是那個古老的例子:如果是神經網絡,必然會把是否攜帶打火機作為肺癌的一個預測變量,事實上,通過判斷是否攜帶打火機肯定能一定程度上預測肺癌,現在是,以後可能也是,這樣不夠嗎?既然以後也可以通過攜帶打火機的比例預測肺癌,那麼這個關係(攜帶打火機—吸菸—肺癌)一定程度上是穩定的,不就能說明問題了嗎?

問題在於,所有的相關性均僅對預測負責,也就是如果我們發現一個人攜帶打火機的概率比較大,我們就可以說這個人未來患肺癌的概率也相對比較大,但是,一旦我們人為介入這個過程,必然會出現問題

,比如我們想通過強行干預來降低肺癌的風險,這個時候僅減少攜帶打火機而沒有減少吸菸頻率,必然會失敗。所以,因果效應為一切事件或行為負責,改變了某個行為必然引起對某個結局的因果效應改變,這個效應可能大可能小,但肯定存在。

這並不是說預測就沒有用了,相反,預測出的相關效應是因果效應的前提,而預測的實踐成本更低(相比於開展隨機對照試驗),並且也為將來的觀測負責,所以同樣很有意義。關鍵在於,我們必須對兩者的區分有一個明確的概念,才能更好的認識世界

所以,我們並不是“故意”拋棄部分的中醫經驗,而是,所有的經驗均可能出錯,我們拋棄了所有學科的所有錯誤經驗,並沒有單獨針對中醫,這是人類文明發展共同的客觀規律

醫學正是一門需要因果性的學科,醫學所做的所有努力,都是希望能通過人為干預來降低疾病的發生或提高治療的效果,而不是僅僅預測到某些疾病會或不會發生。我們的任務則是從無數的相關性中尋找因果效應。

Judea Pearl教授寫了一本科普讀物《The Book of Why》(中譯版:《為什麼》),裡面非常好的介紹了相關性和因果效應的區別。我認為所有醫學生都可以看一下,有助於對醫學這門學科有更深刻的認識。

我们可以相信经验吗?——论医学的相关性和因果性

(書中內容)

關注醫咖會,及時獲取最新統計教程!


分享到:


相關文章: