在 DNA 上存儲信息現在已經足夠便宜可行了

在 DNA 上存儲信息現在已經足夠便宜可行了

我們需要承認這樣一個事實,我們已經變成了數字囤積者,我們的數據已經沒有存儲的空間了。

2016年,人類總共產生了16.1萬億千兆字節的數字信息; 到2025年,這個數字預計將增加十倍以上。我們的個人照片、文字和電子郵件只是滄海一粟; 真正的洪水來自科學家們,他們在進行實驗和臨床試驗時創造了大量的信息,深入研究生物學最微小的組成部分,觀察其他行星,儘可能深入地探索浩瀚的宇宙。我們目前存放這些數據的地方ーー大部分是外部硬盤驅動器和雲服務器機房ーー並不是一個完美的解決方案。它們佔用了大量空間,每隔十年左右就需要升級。

生物技術創業公司正在尋找解決問題的方法,特別是在我們的細胞內。

大存儲的最新趨勢是在 DNA 中編碼數據。畢竟,遺傳物質已經是一種編碼技術。它為生命編碼: 每個人體細胞含有30億個鹼基對,這些配對的核苷酸要麼是腺嘌呤(a)與胸腺嘧啶(t)配對,要麼是鳥嘌呤(g)與胞嘧啶(c)配對。它們的順序是所有蛋白質的配方,這些蛋白質執行我們(和所有生物)生存所需的功能。


包括美國軍方研究機構國防高級研究計劃局(Defense Advanced Research Projects Agency)在內的幾家機構已經開發出了基於 DNA 的存儲系統,可以將各種信息編碼到微小而穩定的分子鏈中,這種分子鏈可以存儲數千年。一些估計表明,通過 DNA 編碼,世界上所有的數據都可以運行。

只有一個問題: 製造獨一無二的編碼信息的 DNA 是昂貴的。據《連線》雜誌報道,打印目前錄製一分鐘立體聲所需的1,500,000個鹼基對大約需要100,000美元。

由前麻省理工學院研究人員創辦的位於波士頓的 Catalog 公司正在努力降低這些成本。“目錄”不是用信息填充一條長長的 DNA 鏈,而是用20到30個鹼基對的 DNA 片段片段,可以用酶把它們縫合在一起。這些片段的排列決定了它們的含義。本質上,它就像一種語言: 在英語中,只有26個字母,但是通過不同的排列,理論上,我們可以創造出無限多的不同單詞。估計存儲一兆的數據只需花費不到三千美分。在 Spotify 上,一分鐘的最高質量的立體聲大約是2.4 MB。

6月26日,Catalog 宣佈它已經使用這個系統存儲了道格拉斯 · 亞當斯(Douglas Adams)的小說《銀河系漫遊指南》(a Hitchhiker’s Guide to The Galaxy)和羅伯特 · 弗羅斯特(Robert Frost)的詩《未選擇的路》(The Road Not Taken)。該公司還表示,它已經收到了來自各種風險投資公司的900萬美元的資金支持。該公司計劃明年將其技術商業化。

任何感興趣的公司只需要提交它想要的數據到 Catalog,然後 Catalog 就會把這些信息轉換成0和1的長鏈中的二進制代碼。接下來,該公司的流程為每個核苷酸分配一對這些0和1; 例如,“ a”可能是00,“ c”可能是01,“ t”可能是11,“ g”可能是10。然後,這些數據通過這種 DNA 編碼被轉換成一小瓶遺傳物質,可以安全地儲存在任何達到4c (39.2 f)的冰箱裡,就像餐館裡使用的那樣。

當信息以這種方式存儲時,你需要有這把鑰匙,以便將 DNA 解碼回二進制代碼,然後再回到可讀的格式。創始人之一 Hyunjun Park 說,一旦公司開始對信息進行編碼,他們就會公開他們的密鑰,這樣客戶就可以讓任何人對他們的信息進行重新編碼。然而,公司可以請求一個新的私有密鑰,這樣他們的信息就有了一個額外的加密層。

如果 Catalog 的處理過程如它所說的那樣順利,這家公司可能會為幾個世紀以來每個人都可以訪問基因數據存儲鋪平道路。帕克表示,該公司正在與檔案管理員合作,尋找在 DNA 密碼本身中包含一個易讀、永恆的密鑰的最佳方式,以便我們的曾曾孫(或外星入侵者) ,在未來能夠自己解碼 DNA 目錄。


【翻譯自https://www.hindustantimes.com/】


分享到:


相關文章: