DeepMind新成果!力壓傳統模型,還有“成噸”的想法待實施

乾明 編譯整理量子位 出品 | 公眾號 QbitAI

DeepMind新成果!力壓傳統模型,還有“成噸”的想法待實施

AlphaGo和AlphaZero又有新兄弟,這次輪到科學家驚呆了。

DeepMind近日宣佈,過去兩年一直在研發AlphaFold:一個用人工智能加速科學發現的系統。

它僅僅基於蛋白質的基因序列,就能預測蛋白質的3D結構,而且結果比以前的任何模型都要精確。

在“蛋白質結構預測奧運會”CASP比賽中,力壓其他97個參賽者。《衛報》報道稱,AlphaFold預測出了43種蛋白質中25種蛋白質的最精確結構。在同一類別中排名第二的隊伍,只預測出了3種。


DeepMind新成果!力壓傳統模型,還有“成噸”的想法待實施

△競賽結果,谷歌為G043


相關的研究者紛紛表示,DeepMind厲害!很想知道他們方法的細節。

對於這項研究,DeepMind稱其為“DeepMind在科學發現領域的第一個重要里程碑”,在生物學的核心挑戰之一上取得了重大進展。

《衛報》評論稱,這將“開啟醫學進步的新時代”。

到底是個多大的進展?

任何給定的蛋白質能做什麼,取決於它獨特的3D結構。 所以,能精確預測蛋白質的3D結構意義非凡。

首先,它能夠幫助科學家更好地理解蛋白質在人體內的作用。對於診斷和治療由蛋白質錯誤摺疊引起的疾病,比如阿爾茨海默氏症、帕金森氏症、亨廷頓氏症等,至關重要。

其次,它會提高我們對身體及其工作原理的認識,使科學家能夠更有效地設計新的、有效的疾病治療方法。

隨著我們通過模擬和模型獲得更多關於蛋白質形狀和它們如何運作的知識,會使藥物開發方面更容易,同時也會降低相關的實驗成本。

第三,它也有助於更好地設計蛋白質,一個例子是,可以推動可生物降解酶的進步,幫助我們控制像塑料和石油這樣的汙染物。

事實上,研究人員已經開始對細菌進行工程改造,使其分泌蛋白質,讓廢物可生物降解,進而變得更容易處理。


DeepMind新成果!力壓傳統模型,還有“成噸”的想法待實施

不過,僅僅根據基因序列來確定蛋白質的3D形狀是一項複雜的任務。

挑戰在於,基因序列中只包含蛋白質組成部分氨基酸殘基的序列信息,這些氨基酸殘基會形成長鏈。 預測這些長鏈如何摺疊成複雜的3D結構,被稱為“蛋白質摺疊問題”(protein folding problem)。

蛋白質越大,氨基酸之間的相互作用越多,建模也就更復雜,困難度也會成倍上升。正如利文索爾佯謬(Levinthal’s paradox)中指出的那樣,在找到一個蛋白質正確的3D結構之前,要列舉一個典型的蛋白質所有可能的構型,需要的時間比宇宙存在的時間還要長。

那麼,DeepMind解決這個問題的思路是怎樣的呢?

DeepMind方案:基於深度神經網絡

DeepMind表示,他們專注於從零開始模擬目標形狀,而不是使用以前解決的蛋白質作為模板。

因此,在預測蛋白質結構的物理性質方面,DeepMind達到了非常高的準確性,然後使用兩種不同的方法,來構建完整的蛋白質結構預測。

這兩種方法都依賴深度神經網絡,需要訓練深度神經網絡從基因序列中預測蛋白質的兩種特性:

1) 成對的氨基酸之間的距離;

2) 連接這些氨基酸的化學鍵之間的角度。

具體的操作步驟為:

訓練一個神經網絡來預測蛋白質中每對殘基之間的距離分佈。然後,將這些概率組合成一個分數,用來估計一個蛋白質結構的準確度。

此外,DeepMind還訓練了一個單獨的神經網絡,基於所有距離的總和來評估初步給出的蛋白質結構與正確答案的接近程度。

DeepMind新成果!力壓傳統模型,還有“成噸”的想法待實施


DeepMind新成果!力壓傳統模型,還有“成噸”的想法待實施


然後,基於這些評分函數,去找到符合預測的結構。

DeepMind使用的第一種方法,基於結構生物學中常用的技術,用新的蛋白質片段反覆替換蛋白質結構的片段,他們訓練了一個生成神經網絡來發明新的片段,用來不斷提高蛋白質結構的評分。


DeepMind新成果!力壓傳統模型,還有“成噸”的想法待實施


第二種方法是通過梯度下降法優化得分,這是機器學習中常用的一種數學技術,可以進行小的、增量的改進,從而得到高精度的結構。

他們將這項技術應用於整個蛋白質鏈,而不是那些在組裝前必須單獨摺疊的片段,從而減少了預測過程的複雜性。

還有“一噸”多的想法

DeepMind的目標,是將AlphaFold打造成基礎科學領域的AlphaGo和AlphaZero。他們表示,

我們首次涉足蛋白質摺疊領域的成功表明,機器學習系統可以整合各種信息來源,幫助科學家快速找到複雜問題的創造性解決方案。正如我們已經看到人工智能如何通過AlphaGo和AlphaZero等系統幫助人們掌握複雜的遊戲一樣,我們同樣希望有一天,人工智能的突破也將幫助我們掌握基礎的科學問題。

DeepMind的首席執行官Demis Hassabis對此信心滿滿。


DeepMind新成果!力壓傳統模型,還有“成噸”的想法待實施


“我們還沒有完全解決蛋白質摺疊問題,這只是第一步,”他說。“這是一個極具挑戰性的問題,但是我們有一個良好的體系,我們還有’一噸’多的想法還沒有實施。”

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回覆“招聘”兩個字。

量子位 QbitAI · 頭條號簽約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態


分享到:


相關文章: