如果說精準診療是攻克疾病的一座大廈,那麼,基因數據就是大廈的“地基”,基因數據的解讀和應用則是決定大廈高度與厚度的“磚瓦”。
隨著基因檢測成本的不斷降低,基因數據呈爆發式增長。
在全球範圍內,發達國家、科技巨頭、生物公司紛紛看中了基因數據的“原油”價值,相繼入場。
人類和疾病之間的戰役,歸根到底將是一場信息戰,決定"個體化醫療"的基因組學正加速拉開大幕。
測序成本降低,基因大數據時代爆發
眾所周知,基因與人類的健康緊密相關,決定了人類生、老、病、死等一切生命現象。
那麼如何提取基因數據,解鎖生命密碼呢?這源於基因測序技術。
基因測序技術是瞭解基因的唯一有效手段,也是基因科學研究的基礎。從
隨著科技的進步,測序技術快速發展,測序成本以超“摩爾定律”的速度下降:
2003年,全基因組測序成本是30億美元;2006年,第二代測序技術後降到1萬美元;2014年,illumina把這個成本降到1000美元;2017年,illumina稱有望將成本降至100美元。▲基因檢測成本下降曲線與摩爾曲線對比
技術成本不斷降低,使基因數據一時間成爆發式增長態勢。據保守估計,2015年生物醫學行業內所產生的數據量己經超過了500PB,這其中絕大多數來自於基因數據。
* 1PB=1000000GB
在信息時代,最鋒利的武器莫過於數據。通常來說,越多的數據意味著可以著手解決更復雜的問題,或者把同一個問題研究得更清楚。
直觀地說,比如有一幅圖片,當眼睛貼到圖片上看的時候,只能看到幾個像素,看不出來圖片具體是什麼。稍遠一些,就能看出一些模糊的景象。但如果站到很遠的地方再看,反而能看得清全貌。
基因大數據就是這樣存在,它能夠幫助我們以“上帝視角”跳脫於當下,由點及面的認知疾病和死亡的演變與進化,找出DNA鏈上的關鍵靶點,進而打開精準診療的大門。
巨頭紛紛入場,全球“基因原油”爭奪戰拉響
基因數據價值研究第一次引起全球範圍內的關注,是在2005年,由美國國家生物技術信息中心(NCBI)發起了當時全球最大的基因工程項目——癌症和腫瘤基因組圖譜計劃(TCGA)。
TCGA研究癌症中基因組的遺傳變化與出生後細胞中後天的基因變化;項目2005年啟動,涉及50種以上的包括某些特定亞型在內的腫瘤,收集了數萬種人的腫瘤及其對照樣本;截止2014年,已在國際高水平研究雜誌上發表了超過1000篇論文。研究價值具象化後,全球主要發達國家不約而同地鎖定生物技術作為國家增長戰略的關鍵產業,一場全球“原油”的爭奪戰正在打響。
跨界聯合成為趨勢
在商業化方面,基因測序行業正面臨的挑戰在於,如何處理巨大的數據量,以及如何從巨大數據中獲取臨床價值。
在這方面,科技巨頭的雲存儲、雲計算等技術似乎具有天然的優勢。他們正攜資本和技術紛紛入局,不約而同的聚焦於精準診療這塊巨大的市場“蛋糕”。
2015年8月,貝瑞和康和阿里雲的合作項目“神州基因組數據雲”正式啟動,旨在打造以海量中國人群基因組數據為核心的數據雲,實現對個人基因組數據的精準解讀;2016年6月,據中商產業研究院數據顯示,2018年全國精準醫療市場規模已經超過500億元,預計2019年末我國精準醫療市場規模將超650億元,到2022年市場規模有望突破千億元。
▲2013-2019年中國精準診療市場規模統計及預測(億元)
基因大數據面臨的“拐點”突破
在全球基因測序行業浩浩湯湯發展之際,在中國,基因大數據行業仍需面臨測序技術、基因數據庫、商業化三座大山。
測序技術突破的壁壘
2018年,一篇華大基因“洩漏14萬中國人基因大數據”的媒體報道,引起了大眾對基因數據的關注,使國內基因檢測公司一度陷入基因數據外流等輿論漩渦。
也一步步揭露出中國在基因行業上游的尷尬處境。
基因組學應用行業可分為上游、中游、下游三個主要環節。上游為基因測序儀與耗材試劑生產製造,中游為
中游服務提供商是指通過基因檢測等手段,提供基因組學類的診斷和研究服務類的公司,目前主要提供四項服務:
生育健康基礎研究和臨床應用業務基礎科學研究服務基礎科學研究服務藥物基礎研究和臨床應用服務以上四種業務都必須得到上游
據統計,截至2016 年,上游市場主流設備來自於Illumina、Thermo Fisher和Roche,三者在全球基因測序儀的市場份額中,合計共佔據99%份額。
▲2016年數據,來自:上海大數據聯盟
試劑和耗材,也主要來自 Illumina,Inc.、Life Technologies(現為 Thermo Fisher Scientific 之子公司)、CG(Complete Genomics )公司。
上游核心技術的掣肘,使行業整體處於被動,有公司率先在併購上尋求突破。
2013年3月,華大基因
此外,在測序設備國產化的路上,除了併購,國內自主創新研發的項目也正在發力:瀚海基因、華因康基因、中科紫鑫、齊碳科技等企業,都在積極的進行國產測序儀的開發。
“定製化”數據庫尚待完善
由於國際上已經完善的基因庫大部分由歐美發起設立,其中來自於亞洲或非洲等人群的數據比例很低。而東亞人群,包括中國人,其遺傳背景和歐美人群差異很大,在標誌物、藥物基因組等方面的差異也很大,只借用歐美人群產生的知識和成果顯然並不合適。
因此,目前,中國政府、基因檢測公司、醫療機構、科技公司等多方力量,都在通過不同程度的合作,來完善針對中國人的“定製化”基因數據庫和研究體系。
2016年7月,由商業化仍需“開山破路”
作為人類的生命密碼,基因領域的每一個相關性、因果性突破都將帶來較大的商業價值。
為什麼這麼講?舉個例子來說,14號染色體裡的TEP1基因,它製造的一種蛋白質,是端粒酶的一個組成部分。缺少端粒酶會導致衰老,如果通過大數據分析和比對,找到所有端粒酶的組成基因,就會使對應細胞長生不老,進而實現所有機能的長生不老。
這個價值如何變現?以美國23andme的投資案例分析一下,這是美國一家專業的基因測序機構,2015年,他們用3000名帕金森患者單病例基因數據,就獲得6000萬美元投資,簡單換算一下,也就是說一個人基因數據單次應用價值就是2萬美元。
貝瑞基因董事長高揚在基因數據的商業價值上早有思考“從邏輯上,我們認為,未來基因數據可能會是公司最核心的資產,如何保護好數據、挖掘好這些數據,產生新的商業模式,一直以來都是公司內部反覆探討的話題。”
然而,認識到價值只是第一步。
面對海量的測序結果,數據深度挖掘和解讀方面存在的嚴峻挑戰日益明顯,中國亟待開發出一套基於數據特性的研究體系和行業標準,來為商業化“開山坡路”。
當然,基因數據商業化的路上也面臨若干問題的挑戰,例如:數據主權的確認、存儲安全、個人隱私、利益分配、法律合規等等問題,這些問題不能得到妥善解決,就很難驅動個體用戶、基因測序公司、數據分析機構主動參與到基因數據這項事業中來。
但不得不承認的是,面對步步逼近的數據洪流,一場關於基因數據的大戰即將打響。
· END ·