Nature Reviews

引言

人工智能(AI)正越來越多地被應用於藥物研發過程中。一些觀點認為人工智能可以極大地促進藥物研發,而另外一些則仍然持保守態度,在觀望AI技術的影響。現實中大多數人的態度可能處於此兩者之間,但是很明確的一點是AI技術給科學家以及生物製藥行業都帶來了極大地影響。本文就小分子藥物研發中AI技術的應用,對眾多國際專家的觀點進行了歸納和總結。


Nature Reviews | 人工智能時代藥物設計的思考

獲取適當的數據集

一套標準的數據集對建立AI預測模型至關重要。如果憑藉有限的數據以及侷限的理解來進行預測,那麼即使是很複雜的模型也無法產生有用的結果。其中的一個重要的影響因素是數據集的適用範圍,比如說,很多課題組都在建立毒性模型來預測分子毒性,但是使用的是體外毒性數據集建立的模型,與體內毒性預測有差距;另外一個建立適當數據集的困難是偶然性錯誤數據,錯誤數據可以是簡單的錯字形式,包括科學文獻中報告並存儲在數據庫中的報告值,基因標識符或其他參數,甚至一個或兩個錯誤的數據點都有可能使預測模型的結果產生偏差;另一個挑戰則是,在很多情況下,實驗數據無法輕易的轉化為單個數字,例如:生化解離常數(Kd)或半數有效濃度(EC50),而目前AI常常被用於建立分類預測模型。


產生新的假設

儘管HTS(高通量篩選技術)有了很大的進步,但實際上我們在尋找新的治療方法以及藥物時,僅僅探索了很小的一部分化學空間。最近進行的超大規模的虛擬篩選也只是進行了1.7億個化合物的對接,但是對於整個類藥化學空間10^18–10^200來說,仍然是很小的一部分。巨大的數目使得窮舉整個化學空間變的十分困難,因此藥物設計本質上可以歸納與下一步要做什麼,藥物化學家從以往的經驗中歸納出靈感並進行基團的替換以提高藥物活性。


可以將化學設計視為模式匹配,顯式化學轉化(例如,基於反應SMILES的虛擬反應方案)和裝配規則(例如,片段生長),這些生成模型隱含地表示了化學知識,即基於數據分佈的統計概率。換句話說,這兩個概念不再是傳統教科書化學,而是一種新的化學語言。利用提供的新假設的模型和數據以測試這些假設並改進對應的機器學習模型,形成了一個虛擬循環,該循環就可以創建一套完整的化學空間自我學習系統。

Nature Reviews | 人工智能時代藥物設計的思考

圖1. 新的假想與機器學習

圖片來源Nature

多目標優化

藥物研發過程中需要對多個目標進行平衡,包括活性,選擇性,清除率和滲透性。但是,針對這些屬性之一進行優化可能會對其餘屬性造成不好的影響,這樣的問題稱之為MOO(也稱為多目標優化,多參數優化,多屬性優化或Pareto優化)。多目標優化旨在發掘所有滿足臨床前候選藥物理想特徵的化合物。理想情況下,AI通常會採取以下形式來優化分子的各種性能指標。例如通常表示藥物的吸收性能ADMET可以用下列特徵來表示:水溶性,代謝穩定性,細胞通透性,與細胞轉運蛋白(例如P-糖蛋白)的作用,藥物–藥物相互作用。


從歷史上看,MOO的算法主要由“遺傳算法”決定,該算法使用變異和交叉操作以及適應性的概念來進行優化步驟。這些方法已被那些更多樣化的操作所取代。現在經常與機器學習方法協同作用。因此,

這些算法優化和機器學習領域之間的交叉可能會導致藥物研發領域更快的發展。

Nature Reviews | 人工智能時代藥物設計的思考

圖2. 多角度優化分子

圖片來源Nature


減少週期時間

潛在先導化合物的識別以及NCEs的優化需要鉅額的投資以及大量的時間,並且在藥物研發過程中所有階段失敗的風險都很高。為了解決這個問題,製藥行業一直在投資於其化合物分析功能。在藥物發現中,將先導分子的特徵提高到候選藥物級別的過程稱為

設計-製造-測試-分析(DMTA)週期。這種基於假設的經典方法首先使用可用數據來進行假設並設計分子(或從庫中選擇現有分子),隨後合成設計化合物,並用適當活性測試法進行測試,以研究假設是否正確並加強理解。然後,對這些知識進行分析並將其轉化為下一個週期的設計假設的基礎。AI的某些方面可能為HTS提供替代方案。無需依賴大型篩選化合物庫,而是可以在每次操作中合成少量化合物,並且僅以測試所需的量進行合成。AI為提高DMTA效率提供了一系列選擇,包括整合和分析所有可用的實驗數據和預測數據,以支持化學家和設計團隊的分析以及分子從頭設計。通過提供改進合成路線和優化反應條件,AI模型可以使化學家遵循最有效的路線,從而最終縮短“製造”階段。

Nature Reviews | 人工智能時代藥物設計的思考

圖3. 通過自動化減少週期時間

圖片來源Nature


改變AI研究文化和思維方式

除了技術問題外,人工智能在藥物研發中的成功應用的最大挑戰還在於培養相關人員的適當思維方式以及相對應的文化氛圍,以使他們願意應用這些計算模型並使用其結果。在藥物設計領域中,利益相關者包括來自各個學科的研究人員以及商人,各方對機器學習的認知程度並不相同。要做到這一點,首先要認識到各個利益相關者的不同經歷,然後發展通用的術語和規範。在大學層面上要促進這種趨勢則需要教育和指導學生進行批判性思維,使其變得自我反省,包容其他的思維方式,學生就可以向同事(包括其他研究領域的人員)或者更為廣闊的受眾來解釋AI可以在哪些領域進行擴大以及支持相關的發展(而不是進行替代)。


展望

製藥公司已經開始應用AI相關技術以及各種機器學習方法,但是並沒有將全部的賭注都壓在AI上面,這是可以理解的。考慮到藥物研發的複雜性和受監管的特性,建議採取一種好奇而謹慎的態度進行嘗試。在藥物設計中開發AI應用程序時需要長期的時間,但AI可以提高所涉及的各個研究過程的效率,並減少研究文化之間的壁壘。


參考文獻

Schneider, P., Walters, W.P., Plowright, A.T. et al. Rethinking drug design in the artificial intelligence era. Nat Rev Drug Discov (2019). DOI: 10.1038/s41573-019-0050-3


分享到:


相關文章: