阿里,人命关天请谨言慎行,切勿为炒作而损了品牌甚至国家信誉

从 2 月起,就看到不少关于阿里使用 AI 辅助新冠诊断的网文。这是来自阿里官方的新闻稿。

《阿里达摩院医疗AI:落地26家医院,诊断3万多新冠肺炎病例》

第一段:

近日,达摩院联合阿里云针对新冠肺炎临床诊断研发了一套全新 AI 诊断技术,AI 可以在 20 秒内准确地对新冠疑似案例 CT 影像做出判读,分析结果准确率达到 96%,大幅提升诊断效率

给读者的第一印象就是,AI 看 CT 就知道你有没有染上新冠。但后面的陈述并非如此:

AI 可以快速鉴别新冠肺炎影像与普通病毒性肺炎影像的区别,最终识别准确率高达 96%

鉴别出新冠和普通肺炎, 和鉴别出新冠和非新冠,有非常大的区别。前者也许技术上更难,但是,在真实情况下有多大用处?

CT 后,无论是什么肺炎,只要疑似的肯定都要住院。住院后,即使由 AI 识别出某个病例只有 5% 的概率是新冠,也必然要靠试剂盒等手段进行最终确认。那么这样的识别到底有多大意义?

文中一个非常显眼的对比是医生分析的耗时和 AI 识别的时间:

医生对一个病例的 CT 影像肉眼分析耗时大约为 5-15 分钟
AI 每识别一个病例平均只需要不到 20 秒

给一般读者的印象是,AI 20 秒就搞定医生十几分钟的活了。但这里没有明确的是,AI 真的能通过这区区 20 秒完全替代医生对 CT 影像的肉眼分析吗?有很多方面:

  • AI 识别之后,是否还要靠医生确认?
  • AI 的识别结果是否会影响医生的诊断?比如给医生先入为主的印象?
  • 一旦 AI 的识别结果与医生诊断相悖,医生要花多少额外精力去研判?有多少可能性是 AI 对了而医生错了?

下面截图是来自 的回答,从中可见更多端倪:

《如何看待阿里达摩院研发的新冠肺炎 CT 影像 AI 诊断技术,平均识别不到 20 秒准确率达 96%?》


阿里,人命关天请谨言慎行,切勿为炒作而损了品牌甚至国家信誉

这里的”影像表现“和”影像诊断“应该是来自医生肉眼分析。假如这里的 AI 系统需要参考这些内容来得出结论,那就意味着医生的肉眼分析仍然是需要的。而假如 AI 是完全根据图像得出结论,而不需要医生完成这两部分分析,那就有接下来的问题了。

对 AI 基础和历史有点了解的应该都知道,AI 的一个大课题就是如何解释它自己得出的结论。仅仅一个 91.02% 的概率值,完全不能提供任何关于影像的具体信息以作论据。至于病灶区域的体积比,首先这个正确率就有待商榷,更不用说仅仅这一项数据根本提供不了医生分析的内容那样的具体和详尽。

最近好像还听说这样的系统要走出国门,对其他同样遭受疫情的国家和地区使用了。这就有了更大的影响和责任。

在此系统训练阶段,需要多少数据才能到达这一准确率?文中提到用了 5000 个病例。如果打算根据国内病例训练出的 AI 来诊断国外病例,有什么依据确定国内外病例的 CT 影像有这么高的相似度?而如果是要靠国外病例的数据来训练,是否会有那么多的国外病例愿意提供自己的医疗数据呢?

对某些医疗水平相对不高或者医疗资源满负荷运转的地区,也许更会依托此类工具进行辅助诊断,而一旦误诊,后果会更大,包括病人的心理影响、甚至是直接的生死,后者绝非危言耸听,比如一位 80 岁的老者被 AI 误诊为新冠而其实是普通肺炎,而同时有一位 20 岁小伙是真的新冠,那在仅有一台呼吸机的时候,可能医生只得选择让 20 岁小伙使用而直接放弃老者。有担起这样重大责任的准备吗?

在这个关键时刻走出国门,对国外医生来说,这样的系统不仅有了“中国援助”的意味,并且有“中国经验”的印象加成,而这意味着更大的责任,更需要小心求证,用尽量严谨的态度对待每一例病人。

图像识别等等技术自然能对医疗图像分析和解读有辅助作用,但是,在这个关键重大的时刻,任何夸大其词、似是而非的宣传导致的后果都是巨大的,影响也会成倍放大。

在此对阿里说一声:

请敬畏生命,珍惜名望。为自己,也为国家。


分享到:


相關文章: