深度學習:一種觀察細胞的超級方式

深度學習:一種觀察細胞的超級方式

史蒂夫·芬克貝納和他的團隊與谷歌人工智能公司合作,揭開了改變生物醫學科學的冰山一角。在這幅圖像中,人類誘導的多能幹細胞神經元以相位對比度(灰色像素)成像,並與預測的熒光標籤(彩色像素)疊加。

觀察未處理細胞的顯微鏡圖像並識別其特徵比你想象的要困難。為了使細胞特徵能被人眼看到,科學家通常必須使用能夠殺死他們想看的細胞的化學物質。

一項突破性的研究表明,計算機可以在不使用這些侵入性技術的情況下看到圖像中的細節。他們可以檢測未經處理的細胞,發現大量科學家自己無法檢測到的數據。事實上,圖像包含的信息比我們想象的要多得多。

史蒂夫·芬克貝納,醫學博士,格萊斯頓研究所主任和高級研究員,與谷歌的計算機科學家合作。通過使用人工智能的方法,他們發現通過訓練計算機,他們可以給科學家提供一種超越人類正常表現的方法。

他們使用的方法被稱為深度學習,這是一種機器學習,涉及到可以分析數據、識別模式和做出預測的算法。他們的研究成果發表在著名的科學雜誌《細胞》上,是深度學習在生物學中的首批應用之一。

這只是冰山一角。

“這將是一場變革,”舊金山格拉德斯通(Gladstone)系統與治療中心(Center for Systems and Therapeutics)主任芬克貝納(Finkbeiner)說。“深度學習將從根本上改變我們未來開展生物醫學科學的方式,不僅是通過加速發現,而且通過幫助尋找治療方法來解決未被滿足的主要醫學需求。”

生物滿足人工智能

芬克貝納和他在格拉德斯通的團隊在近10年前發明了一種全自動的機器人顯微鏡,可以跟蹤單個細胞數小時、數天甚至數月。由於它每天產生3 - 5tb的數據,他們還開發了強大的統計和計算方法來分析海量的信息。

鑑於所收集數據的規模和複雜性,Finkbeiner開始探索深度學習,通過提供人類無法發現的洞見來加強他的研究。然後,谷歌找到了他。該公司一直是人工智能這一分支的領導者,該分支依賴於人工神經網絡,這種網絡鬆散地模仿人類大腦通過多層相互連接的神經元處理信息的能力。

“我們想用我們對機器學習的熱情來解決大問題,”谷歌加速科學的工程總監菲利普·納爾遜(Philip Nelson)說。“與格拉德斯通的合作為我們提供了一個絕佳的機會,可以將我們不斷擴大的人工智能知識應用到其他領域,以一種可以切實造福社會的方式幫助科學家。”

這是一個完美的配合。芬克貝納需要高級計算機科學知識。谷歌需要一個生物醫學研究項目,生成足夠的數據以適應深度學習。

Finkbeiner最初嘗試使用現成的軟件解決方案,但收效甚微。這一次,谷歌幫助他的團隊用TensorFlow定製了一個模型,TensorFlow是一個流行的開源深度學習庫,最初由谷歌AI工程師開發。

一種訓練有素以達到超人績效的網絡

儘管他們的大部分工作依賴於顯微鏡圖像,但科學家們長期以來一直難以探測到細胞內的元素,因為生物樣本主要是由水構成的。隨著時間的推移,他們開發出一種方法,在細胞中添加熒光標籤,以觀察人眼通常看不到的特徵。但是這些技術有明顯的缺陷,從耗時到殺死他們試圖研究的細胞。

Finkbeiner和Eric Christiansen,這項研究的第一作者,發現這些額外的步驟是不必要的。事實證明,圖片包含的信息比我們看到的要多得多。

他們發明了一種新的深度學習方法,叫做“硅標記”,在這種方法中,計算機可以發現和預測未標記細胞的圖像特徵。這種新方法揭示了一些重要的信息,而這些信息在其他情況下是有問題的或科學家不可能獲得的。

“我們訓練神經網絡,向它展示兩組相同細胞的匹配圖像;一個沒有標籤,一個有熒光標籤,”谷歌加速科學的軟件工程師Christiansen解釋說。我們把這個過程重複了幾百萬次。然後,當我們向網絡展示一張從未見過的未標記圖像時,它就能準確預測熒光標記的位置。

深層網絡可以識別一個細胞是活的還是死的,並在98%的情況下得到正確的答案。它甚至能從大量活細胞中挑出一個死細胞。

相比之下,人們通常只能以80%的準確率識別死亡細胞。事實上,當經驗豐富的生物學家——他們每天觀察細胞——看到同一個細胞的圖像兩次時,他們有時會給出不同的答案。

Finkbeiner和Nelson意識到,一旦經過訓練,網絡可以繼續提高其性能,提高學習執行新任務的能力和速度。因此,他們訓練它準確預測細胞核或指揮中心的位置。

該模型還可以區分不同的細胞類型。例如,該網絡可以識別培養皿中混合細胞中的神經元。它可以更進一步,預測神經元的延伸是軸突還是樹突,這是細胞中兩個不同但外觀相似的元素。

Nelson說:“模型學得越多,它需要學習一項新的類似任務的數據就越少。”“這種轉移學習——網絡將它在某些類型圖像上學到的知識應用到全新類型的圖像上——一直是人工智能領域的一個長期挑戰,我們很高興它在這裡工作得如此出色。”通過將以前的經驗應用到新任務中,我們的網絡可以繼續改進,並對比我們在這項研究中測量到的更多的數據做出準確的預測。

“這種方法有可能徹底改變生物醫學研究,”瑪格麗特·薩瑟蘭(Margaret Sutherland)博士說。研究人員現在正在生成大量的數據。對於神經科學家來說,這意味著訓練機器來幫助分析這些信息可以幫助我們加速理解大腦細胞是如何組合在一起的,以及在與藥物開發相關的應用中。

深度學習可以改變生物醫學科學

從智能手機到自動駕駛汽車,深度學習的某些應用已經變得非常普遍。但對於不熟悉這些技術的生物學家來說,在實驗室中使用人工智能作為一種工具可能很難理解。

芬克貝納說:“把這項技術帶給生物學家是如此重要的一個目標。”芬克貝納還是格萊斯頓大學Taube/Koret神經退行性疾病研究中心(Taube/Koret Center for neurode退行性疾病研究)的主任,也是加州大學舊金山分校(UC San Francisco)的神經病學和生理學教授。“在演講時,我注意到,一旦我的同事從概念層面上理解了我們試圖做什麼,他們幾乎就不再聽了!”一旦他們開始想象深度學習可以幫助他們解決無法解決的問題,那就真的很令人興奮了。

深度學習在生物學上的潛在應用是無止境的。在他的實驗室裡,芬克貝納正試圖找到診斷和治療神經退行性疾病的新方法,如阿爾茨海默病、帕金森病和肌萎縮性脊髓側索硬化症(ALS)。

芬克貝納說:“我們仍然不清楚這些患者中90%的確切病因。”“更重要的是,我們甚至不知道是否所有的病人都有相同的病因,或者我們是否可以將這些疾病分為不同的類型。”深度學習工具可以幫助我們找到這些問題的答案,這些問題對從我們如何研究這種疾病到我們進行臨床試驗的方式等方方面面都有巨大的影響。

如果不知道一種疾病的分類,一種藥物可能會在錯誤的患者群體中進行測試,看起來效果不佳,而實際上它可能對不同的患者有效。通過誘導多能幹細胞技術,科學家們可以將患者自身的細胞與他們的臨床信息進行匹配,而深層網絡可以發現這兩個數據集之間的關係,從而預測它們之間的聯繫。這可以幫助識別具有相似細胞特徵的一組患者,並將他們與適當的治療進行匹配。

芬克貝納說:“隨著科技的發展,我們低估了圖像的力量,我們的研究再次肯定了顯微鏡的重要性。”“有趣的是,我們用來訓練深層網絡的一些圖像,依賴的方法可以追溯到我讀研究生的時候。”我以為我們已經從這些圖像中挖掘出了每一個有用的數據,並在幾年前停止使用它們。我發現圖像中包含的信息比人類所能掌握的要多得多。

在人工智能的幫助下,可以從圖像中獲得的特徵數量幾乎是無限的。人類想象力的侷限可能是唯一剩下的因素。


分享到:


相關文章: