汪建:從“1%”再出發,迎接數字化生命與健康大時代

2019年,在河北省委省政府和主管單位的主導下,華大無創產前基因檢測率先在佔全球總人口1%的河北實現全省覆蓋。出生缺陷防控不僅是造福百姓的大民生工程,也是母嬰健康的大科學工程,其造福子孫後代的社會和經濟效益不可估量。


12月20日,我受邀出席“創新引領未來”的2019崇禮論壇,介紹基因科技造福民生的社會和經濟效益及生命大數據帶來的科學革命。


汪建:從“1%”再出發,迎接數字化生命與健康大時代


河北正在成為基因相關疾病防控的全球先行者


一個受精卵的形成就是基因傳遞的過程,很多疾病都是從基因開始的,所以我們提出未來的發展方向和目標非常清楚——“先天無殘”,這是人類發展史上夢寐以求的事情,接下來希望做到“後天少病”或者“後天無病”的終極目標。我們正努力地一個一個實現:從率先在河北省實現唐氏綜合徵等30多種先天性基因相關出生缺陷的全面控制來看,是完全能夠做得到的。


天下三無(無殘、無病、無農)其實也不是什麼新鮮事,如果你要移民到月亮去、到火星去,一定不能有醫藥,一定不能有殘疾,也一定不可能帶農業上去,所以我說換一種外星的思維方式,也許我們就能無限地逼近它。我看了三遍《天下無賊》,天下無賊不是說人民的思想水平提高了,而是由於監控系統和生活水平提高了,大家都不用現金了,所以不能偷、不想偷、沒得偷了。


二十多年前,按照當時的情況,有人估計需要300年才可能完成人類基因組計劃。二十多年過去了,我們今年已經提出在河北省和其他國家完成百萬人基因組測序的目標。從1%(參與人類基因組計劃的1%)走到百萬,跨越了8個零。現在至少有三個省會城市和五個國家正在跟進河北省這種做法。可以大膽地預測,未來2-3年內,我們會實現千萬人級基因組測序的迅速突破。


在醫學發展史上,全世界唯一提出對檢測結果進行保險賠償的就是華大。這個底氣從哪裡來呢?我們已經做了500多萬例,做錯了70例,到了去年和今年,錯誤率已經降到二十萬分之一了。我們可以期望在未來3-5年,耳聾等幾個疾病檢測的錯誤率可以降到百萬分之一,而且百萬分之一的錯誤是什麼呢?是科學上還不認知的。所以我們需要重新認知、定義和命名疾病,重新診斷、治療和康復。我們現在可以檢測到的分辨率已經到了埃米(10-10m),這個事情是從來沒有過的。這是一個完全不一樣的,徹底的革命性的變化。


基因檢測的科學性、經濟性讓大家信心滿滿。我們把技術推到極限就不可能再有人能跟隨了,加上百萬人、千萬人的數據庫作為支撐,一定是能夠做到的。但是大家沒太關注這個領域的進展——應該把生命、健康放在第一位,可是我們老把賺錢放第一,所以我說句難聽的話,究竟以“人民”為中心還是以“人民幣”為中心,這是根本不同的思維方式。


我們正處在工業時代向生命時代的轉折點


過去人類的最大一件事情是工業革命,工業革命是人類歷史上最輝煌的時代。在物質相對富足的情況下,人的生命、健康、幸福、長壽將會放在第一位,我們正在歷史的轉折點上。我們希望在未來的社會發展中,中國能夠全面地引領世界,而不要跟在人家後面走,我們在基因科技這個領域中已經顯示出引領世界的架勢來了。


汪建:從“1%”再出發,迎接數字化生命與健康大時代


“30億對鹼基”實際上是一個“錯誤”的概念,父親和母親分別給了我們30億對鹼基(基因組單倍體),所以嚴格意義上來講,每個人應該是60億對鹼基(基因組雙倍體)。過去錯誤地認為父親和母親基因組的差別只是千分之一,所以可以忽略不計,這是過去二十年一個巨大的認知錯誤。


一個受精卵,怎麼變成1012個細胞的胎兒,再變成(3-5)×1013的成年人?現在華大正在推動全球來啟動這個計劃。我們算了一下,按照今年測序的成本價,需要三萬億人民幣。但是按照過去這二十年的超摩爾發展速度來看,今後10年成本持續加速下降,可能三百億人民幣就能完成這個計劃。光我個人就已經貢獻了自己的100萬個細胞,每一個細胞都實現107級的數據量,合計達1013,這個數據量可以說是“獨步天下”了,我們準備發佈這個結果。未來生命的“讀”,不僅要包括基礎的基因測序,還要“讀”清楚每一個基因、蛋白質、小分子等在每一個細胞中的定位,這實際上需要打造全新的生命成像系統。


華大剛剛落戶深圳時,我們的測序儀通量是每臺儀器每天G(109)水平的數據產出;現在所有儀器通量都上升到了T(1012)的水平。我們認真負責地說,每臺儀器實現日產P(1015)級別的數據指日可待,換句話說,我們一套設備一天就可以完成1萬人的全基因組。我們的挑戰是什麼呢?是存儲和計算。


從1876年貝爾申請電話專利到今天的5G通訊,通信技術發展了快150年;從1869年遺傳物質核酸的發現到今天正好150年,我們能不能在基因與生命科技領域形成全面突破,在通量、成本、質量上形成全新的標準?


“BI+IT”的數字化生命與健康


一個月前,我在北京參加國家科技部發起的“香山會議”(“數據科學與計算智能”學術討論會議),與會專家們提出一個很嚴肅的問題:


數據庫是什麼?數據庫到底算不算科學?最後大家一致覺得數據庫是智能化的基礎,也是最大的科學。國家基因庫的樣本庫和數據庫是最大的資源。


有報導稱華大在人工智能領域企業中排全國第六,這個數據背後反映的是智能化的核心問題。我們現在已經有將近2000萬人的超過100P(1017)的數據,已經要依靠“天河3”來計算了,很快就會超過Eb(1018),計算和數據存儲能力已經成為我們最大的問題。未來,唯有將BT(生命科技)與IT(信息技術)有機融合才能全面迎接“生命時代”的到來。


現在我們在河北落地的大民生項目和產生的大數據,是巨大無比的資源,要轉化成“大科學”(華大自己創辦的英文雜誌Giga Science就叫“大科學”),做成一個全球生命科技創新中心和巨大的超算中心。今天有這麼多河北省的高校來了,我們應該先把河北省高校(河北大學、河北科技大學、河北醫科大學等)的力量組織起來。


許勤省長寄語:不斷探索,服務全人類!


“你們正處於為全人類服務的不斷探索過程中。當然現在華大基因已經做到全球最頂尖,因為我們現在的測序能力全球最強,深圳國家基因庫是全球最大的國家級綜合性基因庫。”




分享到:


相關文章: