哼唱一段旋律,AI就能創造一種“全新”蛋白質

哼唱一段旋律,AI就能創造一種“全新”蛋白質

本文來自微信公眾號:學術頭條(ID:SciTouTiao),作者:學術君,題圖來自:The Tonight Show

蛋白質在生命中的重要作用不言而喻,它是生命的基石。而我們機體內合成蛋白質的過程也是相當複雜,不僅涉及到氨基酸活化等一系列過程,還受體內各種生化物質的調控。此外,蛋白質複雜的三維摺疊結構,讓想要人工合成蛋白質的科學家們望而卻步。

當地時間 3 月 17 日,麻省理工學院科學家們帶來了一個新成果,他們將蛋白質的複雜結構轉化成樂譜,隨後給予電腦一個種子序列,人工智能系統就能設計出一種自然界中從未見過的 “全新” 蛋白質。

他們發現這個 “全新” 蛋白質不僅具有摺疊結構,而且比較穩定。此外,這種 “全新” 蛋白在自然界中從未發現。可以說,該研究為製造蛋白質提供了一種獨特的方法。該研究成果發表在 APL Bioengineering中。

該研究作者,麻省理工學院的 Markus J. Buehler 表示,這樣一種方法為製造全新的生物材料鋪平了道路。比如人們在自然界中發現了一種蛋白酶,就可以通過這種方法改進催化效率或產生新的蛋白變異。

哼唱一段旋律,AI就能创造一种“全新”蛋白质

眾所周知,氨基酸是構成蛋白質的基本單位,要想人工製造出蛋白質,要麼模仿現有的蛋白質,要麼手工編輯組成蛋白質的氨基酸序列,但是這兩個過程都十分耗時,而且改變氨基酸序列後對整個蛋白質結構和功能會產生什麼影響,也很難預測。

“蛋白質一定有它自己的語言。” Buehler 說。鑑於此,該團隊嘗試將蛋白質語言翻譯成人們更容易理解的另一種形式——音樂,與音樂一樣,蛋白質的結構也是分層的,在不同的長度或時間尺度上有不同的結構層次。

鑑於構成蛋白質的 20 種氨基酸,都有一個獨特的振動頻率(量子化學理論計算),因此整個蛋白質的化學結構能夠通過音樂理論中的音符、音量、旋律和節奏來描述。

該團隊已於去年 6 月份成功開發出一套可以將蛋白質分子結構轉化為聲音的系統,該研究當時發表在 ACS Nano 雜誌。

該系統能夠將自然界 20 種氨基酸轉換成 20 個音調的音節,也就是說,構成任何一種蛋白質的氨基酸序列都能轉換成一串音符。而蛋白質複雜的結構和功能信息也就編碼在一段旋律的音調、音量和持續時間等維度中。

哼唱一段旋律,AI就能创造一种“全新”蛋白质

通過音樂來設計由氨基酸組成的蛋白質

然後,研究人員使用人工智能系統來研究多種不同蛋白質產生的旋律,他們讓人工智能系統在音樂序列中引入微小的變化,隨後將聲音翻譯回相對應的氨基酸序列。在生成蛋白的過程中,不同音樂的變化可通過控制溫度參數來實現。

通過這個過程,研究人員能夠創造現有蛋白質的變體,例如基於在自然界最強材料之一的蜘蛛絲中發現的一種蛋白質,來製造出不同於任何生物進化產生的更強大的蛋白質。

而在今天發表的這項研究中,研究人員使用蛋白質摺疊方式產生的特定聲音來訓練人工智能系統,當系統學會理解摺疊蛋白的複雜語言後,他們給予系統一個種子序列,隨後人工智能系統根據這個初始序列推斷並設計出一種 “全新” 蛋白。

那麼這個 “全新” 的蛋白是否存在與自然界中,是我們認識的已知蛋白質呢?

該研究團隊通過將這個 “全新” 蛋白與所有目前已知蛋白信息的大型數據庫進行比較,並使用普通模式分析其分子動力學和特徵,最終證實通過人工智能設計的 “全新” 蛋白在自然界中尚未發現,而且這種 “全新” 蛋白質具有穩定的摺疊結構。

此外,研究人員發現,通過闡明蛋白質的節奏和音調,也有助於在古典音樂中創造新的作曲技巧,這個方法被 Buehler 稱為 materiomusic。他表示,“在蛋白質數成千上萬的進化過程中,自然界也給我們提供了聲音如何組合的新思路”。

哼唱一段旋律,AI就能创造一种“全新”蛋白质

大家也可以一起聽一下研究人員合成的一些蛋白質音樂:https://soundcloud.com/user-275864738

https://www.eurekalert.org/emb_releases/2020-03/aiop-cnp031220.php

https://aip.scitation.org/doi/10.1063/1.5133026


分享到:


相關文章: