重磅|迄今最大規模的中國人基因大數據研究成果在Cell上預印

近年來基因測序技術發展迅速,全球多個發達國家和地區從國家層面設計並開展了大規模的人群基因組項目,並取得了一定的成果。2018年4月27日,華大在頂級科學期刊Cell旗下的Sneak Peek服務器上公開預印了十四萬中國人基因大數據研究成果,是迄今為止最大規模的中國人基因大數據研究,其方法及成果對我國群體遺傳學、基因組學、精準醫學等領域的科學研究和產業發展有重要意義。

重磅|迄今最大規模的中國人基因大數據研究成果在Cell上預印

華大研究團隊對總計十四餘萬中國人低深度全基因組數據展開了群體水平的研究,開發了一系列適用於此類數據的分析方法,揭示了包括31個省,36個少數民族在內的中國人群精細遺傳結構,實現了多種表型的全基因組關聯分析,構建了包含約900萬個多態性位點的中國人群基因頻率數據庫 (CMDB),其中包括約20萬個新發現的多態性位點,揭示了中國漢族與少數民族群體的遺傳特點,並發現當今中國人群的遺傳特徵分佈同時受到絲綢之路等歷史因素與近代人口大規模遷徙的影響。研究還發現了多個隨著緯度的變化而在頻率上呈現明顯差異的基因,展現了飲食、 氣候等因素對中國人群的演化所起到的作用。

十四萬基因大數據揭示中國各省人群與歐洲人、南亞人遺傳距離的變化和基因流方向。

左起: 各省總人群與歐洲人親緣關係呈現西北最強向東南方向減弱趨勢; 各省漢族人群與歐洲人比較暗示古代河西走廊地域兩個種族人群的近交; 各省總人群與南亞人比較呈現西南最強向東北方向減弱趨勢; 各省漢族人群與南亞人的比較與總人群趨勢類似。

隨著緯度變化受到環境選擇的多個基因位點。

比如,在FADS2上掌控著脂肪代謝效率的rs72643559的C等位基因在蔬菜供應缺乏的省份中會明顯富集,而免疫應答相關的CR1基因中受到選擇的變異位點則是呈現南部富集的現象。

此外,課題組首次利用該類數據開展了一系列的全基因組關聯分析 (GWAS)。在對身高、體重等表型的研究中,揭示了數十個在中國人群中與之相關的新基因。課題組還進一步研究了數據中的病毒序列分佈,揭示了我國人群血漿病毒組與歐洲人的差別。

重磅|迄今最大規模的中國人基因大數據研究成果在Cell上預印

黃樹嘉 博士

論文並列第一作者

“經過一年多的攻關,我們研發了一系列的新方法和新工具,突破了原有的侷限和挑戰,實現了對低深度全基因組數據的全面研究。”

重磅|迄今最大規模的中國人基因大數據研究成果在Cell上預印

金鑫 博士

論文共同通訊作者,項目負責人

“該成果表明,此類數據可以用於群體遺傳學、複雜疾病與表型等領域的高水平研究。本課題所產生的中國人群基因頻率庫,也將在遺傳病診斷等領域得到廣泛的應用。”

重磅|迄今最大規模的中國人基因大數據研究成果在Cell上預印

徐訊 博士

論文通訊作者,華大基因集團CEO,

華大生命科學研究院院長

重磅|迄今最大規模的中國人基因大數據研究成果在Cell上預印

課題組生物信息分析團隊合影

從左到右依次為:劉榮,林瓏,劉斯洋 (第一作者),

李子龍,黃樹嘉 (並列第一作者)

中國人基因頻率數據庫 (CMDB) 網站鏈接:

https://db.cngb.org/cmdb/

論文鏈接:

https://www.mendeley.com/sneak-peek/cellpress/


分享到:


相關文章: