高調亮相 MICCAI,英偉達背後的醫療夢想

高調亮相 MICCAI,英偉達背後的醫療夢想

高調亮相 MICCAI,英偉達背後的醫療夢想

在消費級AI當中,英偉達更關注的是數據訓練、模型訓練,而醫療將成為世界上對於計算能力需求最大的產業。一些主流的消費級AI工具無法處理。如果沒有更為先進的工具,AI就很難進入到下一個層級的應用。

作者 | 李雨晨

今年,醫學影像分析頂會MICCAI 2019在深圳舉行。在這次會上,英偉達醫療副總裁Kimberly Powell也來到了中國,並且帶來了一個20多人的隨行團。

作為全球最大的獨立 GPU 供應商,英偉達給外界釋放的信號不言而喻。Kimberly說到,之所以來參加MICCAI,是要見一些潛在的合作伙伴。同時,英偉達也將會在NVIDIA內部打造中國本土的醫療團隊。

2008年,Kimberly加入英偉達,負責將英偉達GPU開發為可應用於醫療成像儀器的加速器平臺。此前,她曾表示,醫療領域是英偉達規模最大、也是最為成熟的一個領域。“在放射學中,我們可以利用人工智能大幅的降低成本,提升圖像的質量,並且將醫療和人工智能整合到一起。”

作為入局醫療的重要一步,2018年,英偉達發佈了Clara平臺。時隔一年,Clara的進展如何?Clara能否支撐起英偉達的醫療夢想?

醫療:算力需求最大的產業

實驗室表現出色的AI遲遲難以在醫院落地應用,很重要的一個原因就是“臨床環境非常複雜”。

就以設備來說,很多醫院還在用十幾年前生產的成像設備,因為設備升級耗資巨大,醫院的“改造動力”並不充足。這也是英偉達入局醫療的動力之一。

Kimberly說,在消費級AI當中,英偉達更關注的是數據訓練、模型訓練。醫學影像的數據規模非常龐大,一些主流的消費級AI工具無法處理。如果沒有更為先進的工具,AI就很難進入到下一個層級的應用。

現在,英偉達更關注的是規模可擴展的推理,以更快、更大規模的方式來進行推理。在Clara平臺上,醫生可以繼續使用原來的超聲、CT等成像設備,輸入圖像後,系統可以自動推理出更加清晰的圖像。

Kimberly說,醫療將會是世界上對於計算能力需求最大的產業。“模型和數據集的規模較大,而且很多都是3D數據。想象一下,我們有十幾種醫療器械,身體結構、器官、疾病都有十幾種分類。因此,針對各個細分領域的AI算法種類是指數級增長的。”

除此之外,考慮到醫學數據的敏感性,醫院對於數據本地化的要求比較苛刻,對於底層CPU、GPU性能的要求不斷上升。

這些是英偉達決定開發Clara平臺來滿足醫療需求的原因。

一年來,Clara的四大進展

作為一個軟硬件相結合的平臺,Clara的核心是英偉達 Clara AGX,是一套以英偉達 Xavier 人工智能運算模塊和英偉達 Turing 架構 GPU 為基礎的運算架構。

2018年,Clara軟件開發工具包(SDK)在北美放射學會會議上發佈,定位於針對醫療行業分層的軟件堆棧。

發佈將近一年後,Kimberly也向雷鋒網AI掘金志分享了Clara平臺的成績。

其中一個比較大的進展,是工具集的高度模塊化。在Clara第一個版本當中,整個工作流是提前設定好的。也就是說,用現有的模型去訓練現有的預定好的模型。

而在最新的版本當中,用戶可以將自己的模型帶到平臺上來進行訓練,“所以在使用層面,Clara變得更加友好了。”

其次,英偉達還整合了一些開源的工具。比如,新的醫療影像瀏覽器能從三個視角觀察圖像,相當於是一個AI助理分析工具,從用戶的角度而言,使用更方便。

再然後是優化了性能,尤其是改善了數據加載訓練的時間。Kimberly笑道,“有開發者反映,有時候數據加載的時間,比訓練的時間還要長。”

最後,新的SDK還實現了自動化的多GPU訓練,不再需要用戶過多幹涉。

據瞭解,Clara主要針對三種類型醫療客戶,第一是醫療設備公司,第二是人工智能軟件開發公司,第三是那些擁有幾百個應用的醫院。

Kimberly認為,對於這些醫療領域的用戶,英偉達可提供四個方面的能力。

第一、訓練好的模型,可以用來訓練數據,利用這些模型來作為醫生的助理;第二,讓模型表現非常有效的一個辦法是對數據進行標記,在Clara平臺上,研究人員可以來做預標記的事情;第三,有一個預訓練模型讓開發者有一個比較高的起點,對這個模型再進行訓練時,可以用更少的數據量就達到非常高的準確度;第四,就是應用的部署。

很多AI初創企業手裡有一些AI模型,但是他們需要將這些AI模型進行大規模的運轉,比如:每天至少做上百個推理。

所以,Clara平臺實際上就提供了可擴展的AI推理功能,那些初創企業和醫療公司就可以用Clara平臺快速和低成本的擴展。

據瞭解,英偉達在醫療領域已經收穫國內包括平安保險、華大基因、碳雲智能、聯影智能、推想科技等在內的眾多合作伙伴。例如,推想科技使用的就是Clara裡的推理引擎,並行執行多個人工智能算法。如果沒有這個推理引擎,一個AI的模型就必須有一個專門的GPU執行。

此外,聯影智能也在NVIDIA DGX系統的基礎上構建AI架構,以便開發用於全棧式醫學影像的人工智能軟件uAI。

Kimberly說,AI初創企業現在基本上都是基於英偉達的技術來打造自己的應用,英偉達做的事情就是給他們的應用去加速,去做更底層的事情。

據瞭解,從發佈以來,Clara平臺的開發者數量增長非常迅速。Kimberly說,英偉達在今年春天正式發佈了這個應用框架,幾個月的時間,Clara開發者的數量增加了4倍。

將聯邦學習引入Clara

深度學習仍然是這波人工智能熱潮中佔“統治性”地位的技術。據AI掘金志瞭解,這一次的MICCAI會議上,仍然有超過70%的研究人員做的都是深度學習領域的研究。

但是,值得注意的一個現象是,聯邦學習悄悄成為了今年MICCAI上的一個熱詞。

大會主席沈定剛教授向AI掘金志表示,聯邦學習對於醫療數據的隱私性來說是一個很好的方法,既可以保證數據“不出院”,又能夠利用不同醫院的數據訓練同一個算法。

高调亮相 MICCAI,英伟达背后的医疗梦想

英偉達資深研究科學家Nicola Rieke說,聯邦學習的提出,主要是為了解決“數據收集”的問題。

“如果一項研究需要跨國或者跨區域,就不可能建一個共有的數據池。在聯邦學習裡,其實是模型找數據,而不是數據找模型,醫學數據一直沒有離開醫院。這個新技術的最大突破點在於,模型訓練完、數據回傳時,要保證最少的涉及到隱私的數據被回傳過來。所以我們只是回傳訓練後模型的數據,而不是原有的數據。”

其次,如果採取集中化的數據處理方式,會大大增加數據的規模。“比如,CT的圖象原來有1TB。我把這個數據集中之後,就相當於把1TB做一個拷貝,創造了2TB的數據。”

當然,Nicola Rieke也提到“數據安全”的問題:如果根據模型訓練出來的數據,又知道底層的運行邏輯,確實是可以進行模型反推。

因此,英偉達和倫敦國王學院的研究人員在這個模型上引入了稀疏向量技術(SVT,Sparse Vector Technique)。訓練完數據之後,在數據中加入“噪點”,讓數據變得模糊、改變原有數據的顆粒度,讓反推變得更加困難。

當然,任何一個方法都不是完美的。此前,很多的數據訓練放在雲端,用大量的GPU去做。但是,由於聯邦學習需要把集中於中心服務器的模型訓練過程分散到了各地。這對於合作對象的硬件條件提出了要求,會增加各地的GPU數量。

Nicola Rieke表示,確實存在這種情況,但是現在英偉達的GPU硬件,基本上對於每一個服務器的供應商來說都是可以使用的,最入門的、最低的投入可能只需要1萬美金,一定程度上降低了使用的門檻。

藉助於聯邦學習,今年8月,英偉達與總部位於英國的藥物研發聯盟MELLODDY組織聯手,圍繞藥物研究展開合作。

MELLODDY包括了10家領先的製藥公司,如安進、拜耳、葛蘭素史克、楊森和諾華;兩所歐洲頂尖大學——魯汶大學和布達佩斯科技經濟大學以及四家初創企業。MELLODDY的研究人員創建了一個分佈式深度學習模型,用於在不同的雲集群中的傳輸以及對未知的1000萬化合物註釋數據的訓練工作。

為AI生態打造“一個工具”

在英偉達內部,Clara的定位就是“一個工具”。

NVIDIA中國高性能計算、產業AI業務總經理劉通說到,對於任何使用Clara的用戶用,原則上是沒有任何限制的。相反,無論是初創企業還是大的醫療公司做AI,工具恰恰都能提供非常好的幫助。

Kimberly表示,Clara支持任何階段的初創企業。如果是非常早期的初創企業,可能需要的更多是技術上的幫助。如果是成熟一點的初創企業,可能它們需要的是市場方面的幫助。

市場化的能力體現在幾個方面。一方面,在英偉達的渠道上進行宣傳;另一方面,在GTC大會上,英偉達也會邀請這些公司參與大會、發表演講。“因為有很多風投參會,通過這種良性的循環,我們能幫助這些企業拿到一些好的風投基金。”

除此之外,英偉達也與學術機構合作。4月,英偉達與美國放射學會聯手,將Clara AI平臺整合到旗下的ACR AI-LAB中,讓超過38000名的放射科醫生創建滿足自己需求的AI工具。

而在半個月前,英偉達與加州大學舊金山分校合作,用DGX超級計算機打造自己的AI訓練架構,並且用Clara開發和部署了應用。

Kimberly補充說,英偉達更多的是扮演一個“賦能者”的角色,為整個AI生態系統打造了一個完善的開發工具,幫助創業公司更好地執行醫療AI的應用。

高调亮相 MICCAI,英伟达背后的医疗梦想高调亮相 MICCAI,英伟达背后的医疗梦想


分享到:


相關文章: