現在,連谷歌都翻了車

現在,連谷歌都翻了車

出品丨虎嗅科技組

作者丨石晗旭

題圖丨谷歌研究員博客

最頂級的醫生也不一定都有火眼金睛,更何況全球範圍內的頂級醫生又算得上稀有“物種”。

這正是海內外AI公司們發力醫療影像的根本原因。

但強如谷歌AI醫生,也被實操狠狠撞了一下腰。坐擁打敗人類的AlphaGo的谷歌,在醫療領域的初次實踐反倒給護士和患者們幫了倒忙。

2018年年底,谷歌在泰國啟動的AI篩查糖尿病視網膜病變(以下簡稱糖網)臨床項目終於在最近發佈了研究結果。

谷歌自曝的研究數據顯示,這套AI系統實際“看病”的結果在臨床應用的11家泰國診所間存在高度差異。

這也讓參與其中的醫護和患者們備受煎熬。

現在,連谷歌都翻了車

其中一家診所現場等待篩查的人們

在篩查中,21%的圖像因為清晰度問題被系統拒絕識別。隨後,護士不得不浪費時間重新拍攝患者眼底照片——即便這些模糊或者過暗的圖片用肉眼就可以辨別發病跡象。

而想即時拿到診斷的患者也因為等待時間過長抱怨不止。由於網絡問題,一家診所的篩查甚至中斷了兩個小時。

“他們從早上6點開始一直等在這兒。而最初的兩個小時中,我們只篩查了10個患者。”這是谷歌披露的一位護士的敘述。

臨床應用的效果分分鐘打了谷歌的臉。早在2016年,谷歌就公佈過利用AI篩查糖網的研究成果。經過幾年研究,這套系統已經可以在10分鐘內識別糖網,且準確率超過90%。

再聯想到IBM Watson的大撤退,我們不得不承認,理想還遠不能照進現實其實是整個醫療AI行業正在面臨的困境。

此前曾有醫生告訴虎嗅,對醫院來說,AI輔助診斷系統免費用用可以,付費免談,癥結其實也就在這裡。

說穿了,AI醫生根本沒有想象中那麼有用。

幫倒忙

這套AI糖網篩查系統,是Google Health團隊研究的核心項目之一。

糖網是糖尿病的嚴重併發症,也是主要致盲的眼病之一。美國疾控中心(CDC)數據顯示,14%的美國成年人患有糖尿病,這一慢性健康問題困擾了約3000萬人。其中,每年有超過2.4萬人因糖網而失明。

不過,如果可以更早、更及時地發現糖網病變跡象,治療效果就會得到極大提升。

然而在美國,並不是每個可以看糖尿病的全科醫生都能充當眼科醫生的角色。意識到問題,再去找眼科醫生看眼睛,又可能錯過了治療的絕佳窗口期。

糖網防治的現實難度,讓谷歌看到了需求。

為此,谷歌團隊建立了一個由12.8萬幅圖片組成的數據集,每張圖片均記錄著3~7名眼科醫生的診斷結果。

被這些數據投餵後的算法,再經過臨床數據集的驗證,

最終被團隊評估為已達到人類專家的水平,準確率超過90%。

不過由於尚未通過FDA批准,這套系統在美國的研究進展仍停留在實驗室階段。

直到與泰國衛生部合作,手握CE認證的谷歌才有了下場實踐的機會。泰國衛生部希望年度內完成對60%的糖尿病人進行糖網篩查。

在泰國的篩查體系中,護士先為患者拍攝眼底照片,然後將照片發送給專家進行診斷,這一過程往往需要5~6周、甚至10周的時間。而泰國有450萬糖尿病人,視網膜專家僅有200位,缺口巨大。

谷歌為泰國的11家診所安裝了數據表現傲人的AI系統。按照理想狀態,這無疑將大幅提升糖網篩查的效率——幾分鐘內就可以完成。

沒成想,這套系統令泰國的護士們叫苦不迭。

一方面,護士們想要拿到AI“認可”的眼底照片並不容易。如今,為了免去麻煩,眼底照片的拍攝採用免散瞳眼底相機。

現在,連谷歌都翻了車

眼底照相機

這一設備對環境要求非常高,因為人類必須在暗室中才能出現足夠的瞳孔自然擴大。但谷歌進入的11家診所中,只有2家有專門的暗室。

而為了保證篩查的準確性,谷歌AI對圖像的要求很高。如果模糊或者有暗區,即便圖像本身已經可以表明糖網跡象,系統也會拒絕識別。“有些圖片比較模糊,我能看清,但系統看不清”,護士吐槽。

現在,連谷歌都翻了車

護士嘗試將光線變化下拍攝的同一隻眼睛的眼底圖像合成一張清晰圖像,但顯然“騙不過”AI

在泰國11家診所的實際應用中,超過五分之一的圖像被拒絕識別。也就是說,每個護士在診所資源限制下每小時拍攝幾十名患者的眼底,但這些照片往往還要返工。而就算返工,也不一定能成,時間就這麼白白浪費了。

另一方面,網速限制讓簡單的圖片上傳都無限卡殼,也給效率添了堵。

此外,就算AI診斷順利,制定後續治療方案仍需患者實地就醫,這又是一個麻煩事兒。因此,谷歌觀察到其所標註的4號和5號診所中都有護士勸阻患者參加這項AI臨床研究。

泰國的患者們顯然也不太買賬。

對患者來說,圖像被系統踢出去意味著他們不得不另找時間就診。“患者並不關心準確性,而是更關心體驗如何”,護士告訴谷歌研究人員,“40%~50%的人不會加入研究,因為他們認為必須要去醫院”。

到底誰需要?

實際上,業內人士對谷歌醫療AI翻車並不意外。

在特定的場景下(比如要求嚴苛的實驗室),AI完成得再準確,也無法改變臨床時水土不服的窘境。

“從技術來講,我認為谷歌這套系統的算法還是處於初級的階段,存在很大的問題”,國內一家醫療AI公司的技術人員告訴虎嗅。

科研和臨床畢竟是兩碼事。而且所有拋開驗證集談準確率的說法,都是在‘耍流氓’。”

點內科技CEO葛亮也有相同的感受。“臨床有其特殊性,既需要產品開發人員對流程非常熟悉,又要進入場景根據醫生的需求一起不斷優化流程、打磨產品,挑戰團隊的恆心和耐心。”

顯然,這些問題無法在短時間內解決。

技術不足還只是表象。在葛亮看來,全球範圍內不少醫療AI產品都是從供給側出發,而非從臨床需求入手。換句話說,先解決技術問題,才拿去臨床試碰運氣。

以國內醫療AI公司扎堆的肺結節輔助診斷為例。葛亮在實際應用場景中發現,醫生最關心的不僅是結節的檢出,更是對於結節良惡性的分析、是否需要手術以及採取哪種手術方式的判斷——這也是患者所關心的。

這也不難理解。如果只是結節檢出,資歷稍深的醫生很快便可以完成。雖然AI理論上來講可以加速審片過程,但是其誤診或漏診給醫生帶來的複查負擔也並不小。

從患者的角度來講,沒有人關心到底是誰給我做出的診斷。讓患者做檢查和最終對檢查結果負責、提出治療方案的,始終是醫生,而非AI。

而肺部疾病的篩查,或者說AI+CT,已經是國內醫療AI發展得最快的領域了,但依然無法避免躺在醫院吃灰的冷遇。

也就是說,起碼在當下這一階段,醫生和患者的需求都並未得到滿足。

不過在遠毅資本合夥人楊瑞榮看來,谷歌在泰國面臨的網絡難題,在國內鮮少存在;同時,國內醫療AI產品的驗證數據集更為豐富,使得AI對源圖像的質量要求會更寬鬆一些,可能表現更好。

對這些問題,谷歌也有同樣的反思。

“在廣泛部署AI工具之前,我們必須瞭解AI工具將如何在特定環境中為人們服務,尤其是在醫療保健領域。”Google Health的用戶體驗研究人員Emma Beede在博客中寫道。

“在廣泛應用這項技術之前,研究和納入現實評估的臨床試驗同樣重要,我們應該與臨床醫生和患者進行更有意義的互動。”

說到這裡我們不難發現,醫療AI發展的進程,遠比實驗報告和滿天飛的企業公告中所描寫的慢得多。而這,正是醫療AI企業遲遲難以商業化的癥結所在。

除此之外,到底是哪個科室的醫生需要哪種醫療AI產品,也是企業們必須弄清楚的事實。

現在國內的AI產品大多湧入了影像科,但這些影像的輔助診斷結果是影像科醫生需要的嗎?答案顯然是否定的。

而最終需要這份診斷的科室和醫生,才是醫療AI產品最可能的付費方。

以糖網篩查產品為例。據悉,中國的糖尿病患者主要在內分泌科就診。儘管指南建議糖尿病患者定期做眼底檢查,但大多數病人仍直到出現視物模糊等症狀,才考慮去眼科做進一步檢查。

然而,“對眼科醫生來說,有時候根本不用拍眼底照片,只要看一下病人的眼底情況就瞭解了”,曾從事過糖網AI研究的點內科技合夥人兼CBO金勝昔告訴虎嗅。

當然,一些醫療AI公司也在探索醫療之外的更多應用場景。如Airdoc所做的眼底篩查產品目前與寶島眼鏡母公司星創視界合作,可以在眼鏡店這樣的場景中尋找更多的商業模式。

但若要真正打通技術、需求、場景的連接,從而獲得收入,醫療AI仍然任重道遠。


分享到:


相關文章: