機器學習技術或揭示蛋白質動力學數據中因果關係

機器學習技術或揭示蛋白質動力學數據中因果關係

機器學習算法擅長髮現大數據內的複雜模式,因此研究人員通常利用它們作出預測。如今,科學家正在推動這種新興技術超越發現相關性,幫助揭開隱藏的因果關係並且驅動科學發現。

在美國南佛羅里達大學(USF),研究人員將機器學習技術融合進其研究蛋白質的工作。正如他們在美國物理聯合會(AIP)出版集團所屬《化學物理學報》上所報告的,其面臨的主要挑戰之一是缺少在從分子動力學模擬獲得的數據中辨別因果關係的方法。

“蛋白質可被看作執行一系列任務的納米尺度機器。不過,蛋白質何時以及在哪裡執行特定任務是由細胞通過各種刺激控制的”USF生物物理學系副教授Sameer Varma介紹說,這些刺激同蛋白質相互作用,不斷地將其“打開”或者“關閉”,甚至能改變其速度和力量。

在大多數蛋白質中,生物刺激同距離開展相應任務的區域相對較遠的蛋白質位點發生相同作用,而這需要信號通路。“這種通過遠程控制開啟蛋白質的方式被稱為變構通路。但具體細節仍不明確。”Varma表示。

他和同事認為,機器學習方法能發揮重要作用。“開發並利用機器學習技術將使我們得以發現蛋白質動力學數據中的因果關係,並且最終解決蛋白質變構效應中一些非常基礎的問題。”Varma介紹說,他們的一個關鍵發現是在蛋白質受刺激部位被啟動的信號似乎在向遠離該位點的地方移動時逐漸變弱。這令人震驚,因為科學家此前並未在蛋白質位點之間的熱運動耦合中觀察到這種距離上的依賴性。

該團隊的工作展示了一種機器學習方法被用於辨別數據內因果關係的方式。此外,Varma表示,“這些數據還讓我們得以填補蛋白質變構效應中的關鍵空白。最終,當我們的方法被應用於很多具有藥物意義的蛋白質時,我們期望能發現更多機械學細節,以揭示恢復疾病狀態下蛋白質活動的新幹預策略”。


分享到:


相關文章: