ChinaMAP發佈最大規模中國人群高深度全基因組測序和表型研究成果

大規模人群隊列的基因組學和多組學大數據正在重大慢病、腫瘤和遺傳病的預防、診斷和新藥研發中發揮引領作用,推動個體化精準健康管理和疾病診療的變革

1。在這個賽道上,美國和歐洲已實施多項以大規模隊列的基因分型、基因組測序數據為基礎的醫學研究計劃,包括著名的英國生物樣本庫(UK Biobank),美國腫瘤基因組圖譜(TCGA)計劃和多組學精準醫學研究計劃(TOPMed)等,產生了一系列具有深遠影響的里程碑式成果。對於我國的未來醫學發展,能否直接應用美國、歐洲人群研究主導形成的數據和結論?由於不同地域人群和種族之間的歷史淵源和遺傳背景存在著巨大差異2,如果把具有其他人群偏向性的知識和結論直接拿來做為中國人的疾病風險評估、遺傳諮詢或診斷治療依據,是並不完善和可靠的。


因此,基於大規模具有代表性和全面性的中國人群隊列研究,形成獨立自主和高質量的中國人群特異性數據和研究體系,將是我國精準醫學發展的重要基礎。因此,國家代謝性疾病臨床醫學研究中心(上海)基於上海交通大學醫學院附屬瑞金醫院牽頭開展的多項覆蓋全國的隊列研究,依託轉化醫學國家重大科技基礎設施(上海)和醫學基因組學國家重點實驗室,實施了中國代謝解析計劃ChinaMAP (China Metabolic Analytics Project)


2020年4月30日,ChinaMAP聯盟攜全國29家研究機構和醫院,在中科院上海生命科學研究院主辦的Cell Research 雜誌發表了長文章“The ChinaMAP analytics of deep whole genome sequences in 10,588individuals”,首次報道了ChinaMAP一期研究對覆蓋全國27個省份和直轄市,8個民族,超過1萬人的高深度(40´)全基因組測序數據和表型的系統性分析3。上海交通大學醫學院附屬瑞金醫院,國家代謝性疾病臨床醫學研究中心的寧光院士,王衛慶教授和畢宇芳教授是論文的共同通訊作者,曹亞南研究員,李林研究員和徐敏研究員等為共同第一作者。


ChinaMAP發佈最大規模中國人群高深度全基因組測序和表型研究成果


在該項研究中,研究團隊對隊列中代表中國不同地區和民族的10588人DNA樣本,使用華大基因-華大智造的國產自主高通量測序平臺進行了40´深度全基因組測序,完成了高質量的中國人群遺傳變異數據構建、中國人群體結構分析、基因組特徵比較以及變異頻譜和致病性變異解析。在ChinaMAP一期數據庫中,包含1.36億個基因多態性位點(SNP)和1千萬個插入或缺失位點(INDEL),其中一半是在國際通用的dbSNP、千人基因組、gnomAD和TOPMed數據庫中均沒有的新位點。ChinaMAP數據庫中所有變異的位置、註釋、頻率和數據質量等信息,可在國家代謝性疾病臨床醫學研究中心的www.mBiobank.com網站搜索,為我國的醫學和生命科學研究提供服務。在科技部人類遺傳資源管理條例的管理和批准下,研究者可以與ChinaMAP研究團隊進一步開展合作。


ChinaMAP發佈最大規模中國人群高深度全基因組測序和表型研究成果

圖1. ChinaMAP檢索(www.mBiobank.com)


ChinaMAP一期研究覆蓋中國七大地理區域,包括了人口排名前十的漢族、壯族、回族、滿族、苗族、彝族、藏族和蒙古族,顯示了中華民族跨地理區域人群遺傳背景的多樣性和複雜性。研究團隊首次揭示了漢族人群可顯著分成七個亞群:北方漢族(北京、天津、河南、河北、山東、遼寧、吉林、黑龍江、山西),西北漢族(甘肅、陝西),東部漢族(江蘇、浙江、上海、安徽),中部漢族(湖北),南方漢族(貴州、四川、重慶、湖南、雲南、江西),東南漢族(福建)和嶺南漢族(廣東、廣西)。少數民族中,藏族、彝族、蒙古族、苗族和壯族都有著獨特的人群聚類,而滿族和北方漢族相近,回族和西北、北方漢族相近。不同地域人群的變異特徵也與中國歷史上的人口遷徙和變遷相關,例如河西走廊是絲綢之路中不同民族遷徙的交通要道,歷史上包括粟特人等許多民族曾在此經商生活。ChinaMAP研究揭示,現代河西走廊地區的人們具有的基因多態性位點數量更多更復雜。與全世界其他人群相比,中國人的遺傳特徵與歐洲、非洲、南亞和拉丁美洲人群之間存在著巨大差異,與非洲人群差距最大,而與東亞人群非常相似。

研究者在成分分析中發現,日本人群與中國北方漢族人群聚類完全重疊。


ChinaMAP發佈最大規模中國人群高深度全基因組測序和表型研究成果


圖2. 中國不同地域和民族人群的成分聚類分析


ChinaMAP對中國人群的遺傳性疾病相關變異位點進行了全面分析。研究團隊發現,中國人群中先天性甲狀腺功能減低症、慢性胰腺炎、遺傳性掌蹠角化症等疾病的致病基因變異攜帶者較歐美人群顯著更多,且具有地域分佈特徵,這些結果對我國重點遺傳性疾病的篩查和防控具有參考價值。例如,中國人和日本人高發的長島型掌蹠角化症相關SERPINB7基因致病位點rs142859678在中國人群中的等位基因頻率超過百分之一,是歐美人群的約20倍。與甲狀腺功能減退發生相關的一些致病變異頻率在中國人群中比歐美人群高10倍以上。疾病相關變異位點在中國人群與歐美人群中的頻率差異,說明我國的遺傳諮詢和解讀,對重要性不確定的基因變異(VUS)的研究,以及相關臨床指南和路徑制定,需要依據中國人自己的大樣本和高質量數據。


ChinaMAP對中國人的營養代謝和藥物代謝相關遺傳特徵也進行了分析比較。對受到廣泛關注的酒精代謝能力,從總體上看,北方人比南方人酒量相對更好,藏族、蒙古族、彝族人民和河南人酒量居於全國前列,山東人酒量並不突出,福建人和廣東人排在最後。ChinaMAP證實,導致喝酒臉紅和酒精代謝能力差的乙醛脫氫酶2 基因rs671變異是東亞人特異性的,在中國人群中的攜帶者(純合子比例4.50%,雜合子比例34.27%)遠高於全球其他人群。rs671變異也是誘發食管癌發生的重要風險因素,所以喝酒臉紅還應少喝酒。另外,研究團隊也對抗凝藥華法林的減量使用,抗血小板藥物氯吡格雷的適用人群分類,他汀類降脂藥副作用風險人群進行了分析。例如,對於高脂血症常用的降脂藥辛伐他汀,中國人中有超過20%的個體存在橫紋肌溶解這一不良反應的風險,提示了針對我國人群特徵的藥物基因組研究和藥物基因檢測的重要性。


代謝性疾病,特別是2型糖尿病和肥胖,已成為中國和世界範圍內發病率最高的重大慢病。在複雜疾病的遺傳因素中,很多效應較強的基因變異大多存在於在特定的地理區域和種族群體中,只有基於特定人群完善的數據分析才有可能對這個人群的疾病的遺傳風險進行精準評估。例如,歐洲人群中最顯著的2型糖尿病遺傳風險TCF7L2基因變異(如rs7903146)在中國人中的頻率很低,並不重要。在代謝特徵和疾病研究中僅參考和驗證歐美人群的結果是不行的。


另外,一個人攜帶的某個基因變異產生的疾病風險可能並不大,但綜合多個基因變異的作用後對個體特徵有重大影響。因此,基於特定人群的大規模基因型和表型數據庫,通過多基因風險評分(PRS)評估個體的疾病風險是一種比較準確的方法。在ChinaMAP研究中,研究者對2型糖尿病遺傳風險進行了多基因風險評分,以量化評分、年齡和血糖值的排序三維顯示了每個人在整個群體中的精確位置。多基因風險評分排名顯示了2型糖尿病高風險和低風險的個體之間存在非常顯著的血糖差異,高風險個體隨著年齡的增加,空腹和餐後2小時血糖都顯著高於中風險和低風險者。另外對比證實,基於東亞人群的基礎數據比基因歐洲人群的數據的結果更加準確。

這些結果提示基於中國人群基礎數據對2型糖尿病及其他代謝性疾病進行精確風險評估的重要性,對重大慢病的預防、個體化健康管理和公共衛生決策具有價值。


ChinaMAP發佈最大規模中國人群高深度全基因組測序和表型研究成果

圖3. ChinaMAP 10588人的餐後血糖遺傳風險的多基因評分(PRS)


ChinaMAP研究也通過全基因組關聯分析探索了中國人群中2型糖尿病和肥胖遺傳相關因素。在血糖相關分析中,結果驗證了部分已知的2型糖尿病風險高頻基因位點,包括CDKAL1,SLC30A8,SND1-PAX4,IDE-KIF11-HHEX,CDKN2A-CDKN2B,KCNQ1等,也鑑定和發現了DENND5B,ORM1,MAFA,PAX6,SOX4等新位點,其中MafA、Pax6和Sox4都是控制胰島β細胞中胰島素合成和分泌的關鍵轉錄因子,ORM1(血清類粘蛋白1)在以往研究中被證實可調控食慾和能量代謝穩態。在體重指數BMI相關分析中,研究團隊發現了新的東亞人群特異性CADM2基因位點,CADM2在動物研究中已證實參與調節體重和能量穩態。FTO等在歐美人群中發現的重要肥胖相關基因位點,在ChinaMAP研究結果中並不顯著。這些發現提示,對大規模中國人群特異性的基因組學的研究,對分子機制和個體化診治的精準醫學體系建立很重要。


綜上所述,ChinaMAP以覆蓋中國各地區的研究隊列為基礎建立了高質量中國人群數據庫,通過高深度全基因組數據和精細表型分析,可為疾病機制研究、預防、遺傳諮詢和公共衛生管理提供依據。例如ChinaMAP在2月下旬報道的新冠病毒受體ACE2相關變異在全球不同人群中的比較分析成果在Cell Discovery發表4,已被訪問下載超過20萬次。

ChinaMAP對漢族和少數民族群體的精確遺傳結構分析也為中國人群的精準基因組學研究提供了參考數據。


參考文獻

  1. Prohaska A et al. HumanDisease Variation in the Light of Population Genomics. Cell 2019; 177:115–131.
  2. Sirugo G et al. The Missing Diversity inHuman Genetic Studies. Cell 2019; 177:26–31.
  3. Cao Y et al. The ChinaMAP analytics of deepwhole genome sequences in 10,588 individuals. Cell Res.2020; https://doi.org/10.1038/s41422-020-0322-9.
  4. Cao Y et al. Comparative genetic analysis ofthe novel coronavirus (2019-nCoV/SARS-CoV-2) receptor ACE2 in differentpopulations. Cell Discov. 2020; 6:11.



分享到:


相關文章: