上學和近視到底什麼關係?「基因黑客」拯救絕望的流行病學家

本文由《Nature 自然科研》授權轉載,歡迎訪問關注。

孟德爾隨機化分析法提供了一種從相關性中分辨因果關係的簡單方法。但科學家是否在過度使用它?

1812年,英國眼科醫生James Ware向倫敦的英國皇家學會會員講述了一個奇特的發現。在被招募到英軍團的成千上萬的年輕人中,20年來只有6人因視力不佳被拒之門外。但卻有多達四分之一的同齡學生在前往英國牛津大學求學時,都依賴手持放大鏡或眼鏡1

上学和近视到底什么关系?「基因黑客」拯救绝望的流行病学家

插圖:Acapulco工作室

Ware沒有得出任何關於因果關係的結論:比如長時間看書可能會導致視力下降,或者帶眼鏡的人天然地會被學術追求所吸引。這也無妨。長期以來,環境暴露與健康相關的觀測結果一直讓流行病學家感到挫敗。近視就是一個典型的例子。數十年的研究表明,在學校待的時間最長的孩子,視力最差。但這些數據並未揭示是否是學校教育使孩子近視,還是近視的孩子在學校待了更長時間。亦或是其他因素,例如社會經濟地位,推動了兩者的發展。

流行病學家飽受這個邏輯上的死衚衕的困擾,本世紀初,其中一些人開始提出,他們的工作可以到此為止了。他們認為,遺傳學的進步可以更有效地解答上述問題。

他們對了一半。二十年來,遺傳學已經改變了人們從相關性中理清因果關係的方式,這促進了流行病學的發展,而不是埋葬它。事實證明,可以通過加入遺傳差異作為環境暴露的代用項,幫助消除分析中的混雜變量。這項技術被稱為孟德爾隨機化分析法。

科學家們用它來重新評估觀測得到的數據,並就長期存在的因果關係問題得出全新的、更可靠的結論。例如,分析證明,低膽固醇水平不會引起癌症2,少量飲酒不能保護心臟3,上學確實可以讓孩子們近視——你沒看錯4

阿姆斯特丹自由大學的社會科學遺傳學家Philipp Koellinger說:“從原理上來說,孟德爾隨機化分析法是一個非常非常酷的想法。它嘗試去解決流行病學中最艱鉅的挑戰之一。”

蓄勢待發

英國布里斯托大學的臨床流行病學家George Davey Smith曾幫助開創了這項技術。他說:“這項技術之所以出現,是因為我們絕望了,轉而去尋找流行病學中獲得更好的因果推斷的方法。”但是,他說,也有一個缺點。“問題在於,使用這種方法變得非常簡單。”

他一直在敦促同事們不要被孟德爾隨機化分析法衝昏頭腦。這是一種強大的工具,但必須適當使用。隨著基因數據的積累,沒有達到科學標準的孟德爾隨機化研究一窩蜂地出現了。一些依賴於誤導性的數據,另一些則未能充分檢驗孟德爾隨機化所依賴的假設。本領域的很多人說,是時候該收緊了。

Davey Smith是曾提出流行病學可能已經走到了盡頭的科學家之一。他和一位合著者在《國際流行病學雜誌》的一篇社論中指出,在隨機對照試驗中對干預項進行檢驗時,關於環境暴露可能有害或有益的觀測數據會反覆失效5

這篇文章發表幾年之後,萬眾矚目的SELECT試驗——耗資1億美元——失敗了,這一點因此而變得清晰醒目。試驗發現,服用硒補充劑不能預防前列腺癌——儘管有大量的流行病學證據暗示可以6

Davey Smith說:“這一切都相當令人沮喪,流行病學的聲譽遭到質疑。”研究人員早在1986年就指出7,遺傳學可以改進相關解讀。但隨著全基因組關聯研究(GWAS,將遺傳變異與特定性狀聯繫起來)的發展,該方法才獲得了動力。2018年,Davey Smith藉助孟德爾隨機化法,去重新研究硒與前列腺癌的關係。

研究人員使用成千上萬的男性的基因型數據,發現了差不多十二種與血液中天然較高的硒水平相關的基因變體8。從出生開始,這些人就好像在服用補硒劑一樣。之後,科學家們可以比較具有這些變異的人與沒有這些變異的對照組的前列腺癌的發生率。因此,研究人員可以更直接地聚焦於硒水平,並避免可能會同時影響硒水平和癌症風險的一些生活方式因素的影響,例如健康的飲食。而且,由於具有較高或較低硒水平的傾向在DNA中是固定的,這個分析受到逆因果(早期前列腺癌可能影響硒水平)的可能性的影響減小了。

與SELECT試驗的結果一樣6,分析發現,硒沒有產生什麼好處8

充足的數據

Davey Smith認為,這樣的結果可以為是否啟動全面臨床試驗的決定提供依據。孟德爾隨機化分析法可以檢驗那些進行試驗可能不合倫理或者不現實的假設。

原則上,只要可以找到遺傳變異,就可以進行孟德爾隨機化分析,從而去自然地模仿環境暴露的影響。每年都會發現更多——尤其是當世界各地數百萬人報名參加他們的基因組分析和健康追蹤時。這給予了遺傳學家統計學上的證據,去識別從酒精攝入到膽固醇水平等一切事物的遺傳學上的關聯。

現在,流行病學家和其他研究者正在為這些發現,進行更多的孟德爾隨機檢驗。來自Scopus和Web of Science的數據顯示,到2010年,每年針對該主題發表的論文不到100篇,2015年增長到約200篇。2019年,到目前已有500多篇論文使用或討論了該方法。科研人員已經藉助它,解決了大量通常與生活中的許多變量混淆的問題。研究已經幫助更明確地表明瞭,飲酒會增加患癌的風險

9,但是低膽固醇並不會2,儘管有一些相反的看法(參閱“基因作為替代變量”)。

上学和近视到底什么关系?「基因黑客」拯救绝望的流行病学家

為了舉例說明孟德爾隨機化分析如何發揮作用,許多科研人員指向了近視,一個迅速發展的公共衛生問題。一直以來,要通過隨機對照試驗來檢驗上學與近視的關聯都是不可能的,因為故意讓一些孩子失學是不合倫理的。

2016年遺傳學家發佈了來自兩個獨立的GWAS的數據之後,一個使用孟德爾隨機化分析的機會出現了:一個尋找與教育程度相關的遺傳特徵10;另一個尋找與近視相關的基因11。這項工作研究了成千上萬人,並發現了幾十個與近視和上學年限強相關的基因變體。

第二年,流行病學家利用這些變異,研究了最大的人口數據集之一——488,000名參加UK Biobank項目的中老年人。志願者讓研究人員分析了他們的基因組,並回答幾十個個人細節問題,包括他們的受教育程度和視力。當英國卡迪夫大學和布里斯托大學的研究人員使用孟德爾隨機化方法分析數據時,他們發現,基因上有近視傾向對人們在學校待多少年沒有影響。然而,那些攜帶與受教育程度相關的基因的人,近視的可能性要大得多

4

領導該項目的布里斯托的眼科醫生Denize Atan說,無論是通過閱讀時間、較暗的自然光還是其他因素,在學校花費的時間都會明顯影響視力。她說,這種關聯非常密切,政策制定者和學校應該做更多的工作來解決這個問題。

公開的秘密

批評者認為,問題在於,並非所有孟德爾隨機化研究都是可靠合理的。Atan說:“在研究開始之前,你需要有一個有力的假設和一些支持性的證據。而越來越多的研究並沒有這些。”“你會想,‘他們的那些想法從哪兒而來?’看起來好像就是憑空出現的。”她補充道,這是一個大問題,因為孟德爾隨機化分析法允許科研人員在不具備任何相關領域專業知識的前提下,去尋找、發現和公佈不熟悉的數據集之間的關聯。

正如荷蘭鹿特丹伊拉斯姆斯大學醫學中心的流行病學家Sonja Swanson所說的:“只需按一下按鈕,說‘這個數字可以回答我的問題’,不用費很多功夫。”

幾位流行病學家表示,很多公開發表的孟德爾隨機化研究是有問題的,這在領域內是公開的秘密。“發表論文非常容易,”Davey Smith說,“一些非常差的論文是由一些不瞭解流行病學原理的人發表的。”2016年,一項孟德爾隨機化研究聲稱發現血液中高水平的C反應蛋白(一種與炎症相關的肝酶)導致了精神分裂症。研究提出,能夠降低血液中酶水平的藥物可能有助於治療精神分裂症患者

12。Davey Smith課題組和另一個課題組進行了類似的分析,發現實際上C反應蛋白對精神分裂症具有保護作用13。Davey Smith和他的合著者認為,原來的課題組在如何組合基因數據集方面存在問題。最終,這篇2016年的論文被撤回。

流行病學家還批評了另一項孟德爾隨機化分析14,該分析聲稱,懷孕期間吸菸會導致嬰兒的出生體重明顯下降15,並大大增加後代發生唇顎裂的風險16

他們說,問題在於,作為吸菸行為替代變量的基因變體,是通過候選基因研究確定的。在候選基因研究中,科研人員評估了他們推測與吸菸等行為有關的一些基因。這樣的研究結果可能不可靠,因為他們傾向於在被檢查的基因中有意尋找某些作用。作者在他們的孟德爾隨機化分析中使用的那些變異,在規模更大、更全面的GWAS中並沒有出現。

愛荷華大學的健康政策研究員George Wehby領導了上述吸菸項目,他說該項工作是在獲得了更好的數據之前完成的,“考慮到來自大規模GWAS的吸菸遺傳學的最新成果,我同意這些基因變體不是首選。”

上学和近视到底什么关系?「基因黑客」拯救绝望的流行病学家

(安徽合肥)年輕的學生們正在做眼保健操,希望能預防近視。圖片來源:SIPA Asia / ZUMA Wire / Alamy

違反常識

對於經濟學家來說,孟德爾隨機化分析法看起來很像工具變量分析:使用一種被稱為工具的變量,來幫助消除兩個其他觀察值之間隱藏的關係。Koellinger說:“當我們看到流行病學家使用基因作為工具變量時,我們都很好奇,並說‘等一下!’”。此類分析建立在有待仔細檢查的假設之上。

孟德爾隨機化分析的一箇中心假設是,遺傳變異不能以任何其他方式影響結果。例如,有一種基因變體編碼乙醛脫氫酶2(ALDH2),擾亂酒精的代謝。攜帶這種基因變體的人飲酒時往往會感到噁心,因此這種變體與低飲酒量相關。這可能看起來是一種可行的方法去檢驗,比如說,飲酒是否會提高血壓,因為攜帶該基因變體的人通常比不攜帶該變體的人飲酒少。

問題在於,ALDH2也影響一個人吸菸的可能性17,而吸菸也獨立地影響血壓。這種現象被稱為基因多效性,會使孟德爾隨機化分析的結果無效。這就會帶來問題,因為許多基因的多效性程度並未被完全認識到。

另一個假設是,一個指定的基因變體具有很強的作用。隨著規模更大更強的GWAS挖掘出不同性狀之間較弱的遺傳聯繫,這一假設變得更加難以檢驗。

荷蘭的流行病學家在2015年發表了一篇綜述,對178篇已發表的孟德爾隨機化分析進行了研究,發現只有不到一半的文章充分討論了這些假設18。研究人員認為:“由於這些假設對於孟德爾隨機化研究的有效性至關重要,應始終在研究的特定背景下進行討論。”

18

孟德爾隨機化分析也受到一個顯著的偏差的影響——一個關乎生死的問題。人只能死一次。這個問題會使諸如中風所致死亡的分析複雜化。這種死亡往往發生在老年人中,因此,對中風的研究通常會招募那些已經從影響較年輕的人的疾病(例如心臟病)中倖存下來的人。由於中風和心臟病具有共同的病因,例如高膽固醇(因此也有共同的療法,包括他汀類藥物),這種倖存者偏差可能會產生一些誤導性的結果。

為了證明這種偏差造成的影響,紐約城市大學的公共衛生流行病學家Mary Schooling進行了孟德爾隨機化分析試驗。在這些試驗中,與降低膽固醇有關的基因變體用於替代他汀類藥物的使用。具有這種有益遺傳特徵的人,在其生命早期很少心臟病發作,並能夠活到中風風險增加的年紀。因此,研究得出結論,降低膽固醇的他汀類藥物實際上會引起中風19

Schooling說:“那沒有任何意義。”正確的隨機對照試驗不會以這種方式產生混淆:它們顯示他汀類藥物可以預防中風。但是孟德爾隨機化分析顯示出一種倖存者偏差,這是必須被識別出來並予以糾正的。

戰勝偏差

“每一種方法都可能有偏差。”Davey Smith說。孟德爾隨機化分析並不是為了取代隨機對照試驗,而是為了與其他資料(包括觀察性研究)一起,增加可用的證據,從而幫助做出合理的決定。現在,科研人員正在尋找改善的方法。

一種方法是識別和糾正一些偏差,並應用統計工具來檢驗假設的強度。Davey Smith指出了一些可以幫助科研人員評估孟德爾隨機化分析研究質量的論文20

改進數據組織也會有所幫助。無偏分析假設基因是隨機分佈的,但已知某些基因呈區域性聚集21。基因型數據集已經可以通過大家族進行分組,並且這些數據的孟德爾隨機化分析發現,例如,身高和體重指數可能不會像以前研究認為的那樣影響教育程度22

通過比較家族內和群體內的研究結果,遺傳學家可以幫助區分對於一個給定的性狀,遺傳和環境所起的作用。“特定的基因與當地環境特定的特徵相關。如果你想用基因來進行因果推斷,需要打破這種聯繫。”Koellinger說。

如果科研人員想要利用不斷增長的遺傳信息,提出公共衛生建議和政策建議,這種準確性非常重要。但是,即使是這些工具,也需要改進和補充。

200年前 Ware對學生和士兵視力的觀察,如今從當時沒有人能想到的遺傳視角得到了解釋。諷刺的是,英國軍隊又花了一個世紀才接受了需要戴眼鏡的新兵,並改變了他們認為合格的視力標準。即使是在第一次世界大戰期間,一些權威人士也認為,只要英國士兵能夠“朝正確的方向開火”,即使他看不清楚自己在向什麼射擊也沒關係23

用於流行病學的統計工具正在不斷完善。儘管孟德爾隨機化分析法並不總能提供完美清晰的結果,但它至少有望為科研人員指明正確的方向。

參考文獻:

1.Ware, J. Phil. Trans. R. Soc. London103, 31–50 (1813).

2.Benn, M., Tybjærg-Hansen, A., Stender, S., Frikke-Schmidt, R. & Nordestgaard, B. G. J. Natl Cancer Inst.103, 508–519 (2011).

3.Millwood, I. Y. et al.Lancet393, 1831–1842 (2019).

4.Mountjoy, E. et al.Br. Med. J.361, k2022 (2018).

5.Davey Smith, G. & Ebrahim, S. Int. J. Epidemiol.30, 1–11 (2001).

6.Lippman, S. M. et al.J. Am. Med. Assoc.301, 39–51 (2009).

7.Katan, M. B. Lancet327, 507–508 (1986).

8.Yarmolinsky, J. et al.J. Natl Cancer Inst.110, 1035–1038 (2018).

9.Pierce, B. L., Kraft, P. & Zhang, C. Curr. Epidemiol. Rep.5, 184–196 (2018).

10.Okbay, A. et al.Nature533, 539–542 (2016).

11.Pickrell, J. K. et al.Nature Genet.48, 709–717 (2016).

12.Inoshita, M. et al.Sci. Rep.6, 26105 (2016).

13.Hartwig, F. P., Davies, N. M., Hemani, G. & Davey Smith, G. Int. J. Epidemiol.45, 1717–1726 (2017).

14.Taylor, A. E. et al.Econ. Hum. Biol.13, 99–106 (2014).

15.Wehby, G. L. et al.Biodemography Soc. Biol.57, 3–32 (2011).

16.Wehby, G. L. et al.Health Serv. Outcomes Res. Methodol.

11, 54–78 (2011).

17.Masaoka, H. et al.Drug Alcohol Depend.173, 85–91 (2017).

18.Boef, A. C. G., Dekkers, O. M. & le Cessie, S. Int. J. Epidemiol.44, 496–511 (2015).

19.Schooling C. M. et al.Preprint at bioRxiv https://doi.org/10.1101/716621 (2019).

20.Davies, N. M., Holmes, M. V. & Davey Smith, G. Br. Med. J.362, K601 (2018).

21.Abdellaoui, A. et al.Nature Hum. Behav. https://doi.org/10.1038/s41562-019-0757-5 (2019).

22.Brumpton, B. et al.Preprint at BioRxiv https://doi.org/10.1101/602516 (2019).

23.Cubitt, B. B. Br. J. Ophthalmol.2, 35–40 (1918).

原文以The gene-based hack that is revolutionizing epidemiology為標題發表在2019年12月10日的《自然》新聞特寫上

© nature

Nature|doi:10.1038/d41586-019-03754-3

本文由施普林格·自然上海辦公室負責翻譯。中文內容僅供參考,一切內容以英文原版為準。歡迎轉發至朋友圈,如需轉載,請郵件 [email protected]。未經授權的翻譯是侵權行為,版權方將保留追究法律責任的權利。

© 2020 Macmillan Publishers Limited, part of Springer Nature. All Rights Reserved

上学和近视到底什么关系?「基因黑客」拯救绝望的流行病学家


分享到:


相關文章: