阿里,人命關天請謹言慎行,切勿為炒作而損了品牌甚至國家信譽

從 2 月起,就看到不少關於阿里使用 AI 輔助新冠診斷的網文。這是來自阿里官方的新聞稿。

《阿里達摩院醫療AI:落地26家醫院,診斷3萬多新冠肺炎病例》

第一段:

近日,達摩院聯合阿里雲針對新冠肺炎臨床診斷研發了一套全新 AI 診斷技術,AI 可以在 20 秒內準確地對新冠疑似案例 CT 影像做出判讀,分析結果準確率達到 96%,大幅提升診斷效率

給讀者的第一印象就是,AI 看 CT 就知道你有沒有染上新冠。但後面的陳述並非如此:

AI 可以快速鑑別新冠肺炎影像與普通病毒性肺炎影像的區別,最終識別準確率高達 96%

鑑別出新冠和普通肺炎, 和鑑別出新冠和非新冠,有非常大的區別。前者也許技術上更難,但是,在真實情況下有多大用處?

CT 後,無論是什麼肺炎,只要疑似的肯定都要住院。住院後,即使由 AI 識別出某個病例只有 5% 的概率是新冠,也必然要靠試劑盒等手段進行最終確認。那麼這樣的識別到底有多大意義?

文中一個非常顯眼的對比是醫生分析的耗時和 AI 識別的時間:

醫生對一個病例的 CT 影像肉眼分析耗時大約為 5-15 分鐘
AI 每識別一個病例平均只需要不到 20 秒

給一般讀者的印象是,AI 20 秒就搞定醫生十幾分鐘的活了。但這裡沒有明確的是,AI 真的能通過這區區 20 秒完全替代醫生對 CT 影像的肉眼分析嗎?有很多方面:

  • AI 識別之後,是否還要靠醫生確認?
  • AI 的識別結果是否會影響醫生的診斷?比如給醫生先入為主的印象?
  • 一旦 AI 的識別結果與醫生診斷相悖,醫生要花多少額外精力去研判?有多少可能性是 AI 對了而醫生錯了?

下面截圖是來自 的回答,從中可見更多端倪:

《如何看待阿里達摩院研發的新冠肺炎 CT 影像 AI 診斷技術,平均識別不到 20 秒準確率達 96%?》


阿里,人命關天請謹言慎行,切勿為炒作而損了品牌甚至國家信譽

這裡的”影像表現“和”影像診斷“應該是來自醫生肉眼分析。假如這裡的 AI 系統需要參考這些內容來得出結論,那就意味著醫生的肉眼分析仍然是需要的。而假如 AI 是完全根據圖像得出結論,而不需要醫生完成這兩部分分析,那就有接下來的問題了。

對 AI 基礎和歷史有點了解的應該都知道,AI 的一個大課題就是如何解釋它自己得出的結論。僅僅一個 91.02% 的概率值,完全不能提供任何關於影像的具體信息以作論據。至於病灶區域的體積比,首先這個正確率就有待商榷,更不用說僅僅這一項數據根本提供不了醫生分析的內容那樣的具體和詳盡。

最近好像還聽說這樣的系統要走出國門,對其他同樣遭受疫情的國家和地區使用了。這就有了更大的影響和責任。

在此係統訓練階段,需要多少數據才能到達這一準確率?文中提到用了 5000 個病例。如果打算根據國內病例訓練出的 AI 來診斷國外病例,有什麼依據確定國內外病例的 CT 影像有這麼高的相似度?而如果是要靠國外病例的數據來訓練,是否會有那麼多的國外病例願意提供自己的醫療數據呢?

對某些醫療水平相對不高或者醫療資源滿負荷運轉的地區,也許更會依託此類工具進行輔助診斷,而一旦誤診,後果會更大,包括病人的心理影響、甚至是直接的生死,後者絕非危言聳聽,比如一位 80 歲的老者被 AI 誤診為新冠而其實是普通肺炎,而同時有一位 20 歲小夥是真的新冠,那在僅有一臺呼吸機的時候,可能醫生只得選擇讓 20 歲小夥使用而直接放棄老者。有擔起這樣重大責任的準備嗎?

在這個關鍵時刻走出國門,對國外醫生來說,這樣的系統不僅有了“中國援助”的意味,並且有“中國經驗”的印象加成,而這意味著更大的責任,更需要小心求證,用盡量嚴謹的態度對待每一例病人。

圖像識別等等技術自然能對醫療圖像分析和解讀有輔助作用,但是,在這個關鍵重大的時刻,任何誇大其詞、似是而非的宣傳導致的後果都是巨大的,影響也會成倍放大。

在此對阿里說一聲:

請敬畏生命,珍惜名望。為自己,也為國家。


分享到:


相關文章: