2011年01月,國家發展改革委員會批覆,依託深圳華大基因研究院組建深圳國家基因庫。同年10月,深圳國家基因庫建設方案獲得國家四部委批覆。
深圳國家基因庫是服務於國家戰略的國家級公益性創新科研及產業基礎設施建設項目,是我國唯一一個獲批籌建的國家基因庫,“十二五”重點基礎能力建設項目。
1月9日,讀創/深圳商報記者來到大鵬新區觀音山腳下,走進國家基因庫。在這裡,機器人和研究人員一起工作,立體蔬菜庫有兩層樓高,工作區的牆上寫滿了華大集團董事長汪健的“奇思妙想”……
這只是表象。這艘“諾亞方舟”,承載著人類及其他生物的遺傳樣本和密碼——基因、蛋白、分子等生物信息數據,被儲存在超級計算機房裡;人體腸道微生物、植物種子等生物資源樣本,藏在醫療級“冰箱”裡;黑天鵝、梅花鹿、火烈鳥等生物活體,則在園區安家。
儲存基因保持物種“永存”
走進國家基因庫一層,“猛獁象”的塑像映入眼簾:它的身上印著“永存、永生”的字樣。據資料記載,最後一批猛獁象已於公元前1650年左右滅絕。
工作人員介紹,全球範圍內,許多生物物種正在以前所未有的速度消失,基因技術也許是拯救瀕危生物的最後一絲希望,儲存基因是保持物種“永存、永生”的關鍵。
國家基因庫的三層到五層,分別是高通量基因測序房、數據機房以及冷凍資源房。這三個工作區域是國家基因庫核心功能運作的核心。
從三層到五層,有一座立體蔬菜庫。
據工作人員描述,國家基因庫的核心功能可概括為“三庫兩平臺”。“三庫”分別是生物樣本資源庫、生物信息數據庫和生物活體庫。“兩平臺”則為數字化平臺(讀平臺)、合成與編輯平臺(寫平臺),具備對海量生物資源“存、讀、寫”的能力。
“存”指的是對基因、細胞乃至生命個體的實物存儲、生物信息的存儲、活體物種的保護與繁衍。
據瞭解,樣本主要通過自主採集,與醫療機構和科研院合作收集、合作共享等方式獲取。2500萬份,這是工作人員給出的數字,也是最新的生物樣本資源庫實現的可溯源生物樣本儲存能力。
2018年10月,華大主導的最大規模的中國人基因組學大數據研究成果在《細胞》雜誌上發表。華大生命科學研究院(原“華大基因研究院”)院長徐訊介紹,實驗過程中的計算和數據的存儲,主要依託國家基因庫的“三庫兩平臺”完成。
讀創/深圳商報記者瞭解到,這是國際高水平學術期刊首次認可在其上發表基因組學文章所使用的數據僅保存於國內的國家基因庫,無需備份至境外數據庫。國家基因庫對我國生命科學研究和生物產業發展的重要性不言而喻。
這裡藏著“基因界的谷歌”
“三庫兩平臺”離不開高通量基因測序儀、數據機房和冷凍資源房。在三層、四層、五層,讀創/深圳商報記者隔著玻璃看到了它們的工作過程。
在深圳國家基因庫的三樓基因測序區域,機械臂正代替人工裝載測序樣本。
三層是基因測序的區域,目前已經裝備了150臺華大自主研發的桌面式測序儀BGISEQ-500、1臺華大去年10月發佈超高通量測序儀MGISEQ-T7、9套集約式高通量測序儀和1臺超級測序儀Revolocity。
讀創/深圳商報記者看到,基因測序區內只有幾位工作人員,相比之下更忙的是機械臂。工作人員介紹,人工提取DNA樣本後,經過處理裝載到芯片上,就可以放入測序儀進行測序了,機械臂可以代替人工裝載測序樣本。
目前,依託國產基因測序儀,數字化平臺的數據產出能力達10PB/年,相當於一年10萬人全基因組測序的產出規模。國家基因庫方面表示,數字化平臺的國產化對我國生物遺傳資源的安全性具有重要意義。
測序儀產生的數據,被存儲在四層的數據機房裡,也就是前文所提到的生物信息數據庫。
深圳國家基因庫四樓的數據機房。
工作人員介紹,為了給科研工作者提供更好的生物大數據共享和應用服務,國家基因庫去年10月正式發佈了生命大數據平臺CNGBdb。CNGBdb被描述為“基因界的谷歌”。
在五樓一側辦公區的牆上,貼滿了PPT,寫滿了關於基因和健康的筆記。
CNGBdb整合了全球四大國際基因庫的數據,覆蓋母嬰健康、腫瘤、動植物多樣性、病原微生物等十幾個研究領域的科研數據。科研人員可以從這個平臺免費獲取知識搜索、數據歸檔、計算分析、數據可視化、資源共享、管理授權等服務。
10萬人刷臉可查DNA檔案
市民有機會把自己的基因信息儲存在國家基因庫嗎?從基因庫工作人員處,讀創/深圳商報記者得到了肯定答覆。
去年6月,華大集團旗下的深圳華大法醫科技有限公司對外宣佈,已為全國各地10萬餘人建立DNA檔案,相關數據就存儲在國家基因庫的“DNA檔案數據庫”。
五樓的冷凍房裝備了低溫冰箱,新鮮樣本、血液尿液、組織、活細胞等分別“居住”在4度到-196度的不同溫度區間裡。
DNA檔案可以與新生兒出生證明綁定,成為一份終身不變的個人檔案,為預防兒童走失、棄嬰、尋找失蹤人口、災難身源鑑定等各項相關應用提供科學依據。
已經建立了DNA檔案的市民登錄微信小程序“DNA檔案”,即可通過“人臉識別”查詢自己的DNA檔案。
據瞭解,目前除了深圳等城市外,DNA檔案已經普惠國內9個地級市縣,包括河南長垣、西藏拉薩、陝西商洛、河北張北等,覆蓋人群超過百萬。
讀創/深圳商報記者在採訪中瞭解到,目前國家基因庫二期建設已經啟動。國家基因庫方面表示,隨著基因科學技術的快速發展,精準醫療、全民大健康、新型農業等領域發展對生物大資源,大數據的迫切需求,二期基因庫需要對現有能力進行擴容,並加大技術研發,提升樣本及數據的存儲能力,提高存儲效力,節省空間降低耗能。
來源 讀創App
讀創/深圳商報記者 李旖露 文╱圖
閱讀更多 讀創新聞 的文章