想不到,阿里不甘只做扫地僧

随着2020的到来,疫情正逐渐蔓延至全球,国内疫情肆虐的风暴过后,每当复盘抗疫历程,总有一些大有作为的企业涌现出来。这其中不乏有“阿里、达摩院”,在中国乃至世界全球成为关键词条。

的确,不论是与浙江疾控中心合作的基因检测平台,将疑似病例基因分析时间缩至半小时;还是率先在郑州「小汤山」应用的 CT 影像系统;或是国内 57 座城市都在用的智能疫情机器人,亦或是当今中国掀起的健康码浪潮,阿里抗疫涉及到疫情咨询、药物研发、病毒基因分析、临床诊断甚至复工复产等多个环节,设计领域空前众多均具有重要意义。

如今影响力还在不断扩散,据阿里统计,截至 3 月 31 日,达摩院 CT 影像 AI 已在浙江、河南、湖北、上海、广东、江苏、安徽等 16 个省市近 170 家医院落地,已诊断 34 万临床病例。

随着疫情全球扩散,其影响力进一步渗透到海外世界。3 月 31 日,达摩院 AI 随着阿里云一同出海——日本知名医疗科技机构 JBC 正式上线阿里云新冠肺炎 AI 诊断技术,开始向日本医院提供这一服务,帮助医生通过 CT 影像快速进行新冠肺炎筛查。

(1) 达摩「仗剑」,扫地僧重出江湖


达摩问世


系统 20 秒内对新冠疑似患者 CT 影像做出判读,并量化病症的轻重程度,据华先胜透露这套系统分析结果准确率达到 金人的96%,直观地显示着这套系统的辅助作用。

华先胜是阿里巴巴集团副总裁、达摩院高级研究员,2001 年博士毕业于北大数学系,14 年后被「在微软工作的王坚挖角,开启阿里在 AI 视觉研发和落地方面的探索。

2 月 4 日,达摩院接到任务,要借助 AI 技术对新冠疑似案例 CT 影像做出判读,4 天内,达摩院算法团队便已构建出一个识别模型,模型刚出来,团队便在小范围数据集上做测试。

但仅仅基于小范围的数据产出的产品并不足以让人信服,加之彼时疫情尚处初期,全球尚无充足的临床数据,更无标准的数据集。

在这种情况下,团队转换思路,调取出原有存量数据——天池大赛中「肺部 CT 多病征智能诊断」数据,另一方面,达摩院还加紧与外部机构协作,与浙大一院、万里云、长远佳和古珀医院等多家机构合作,很快就突破了训练数据不足的局限。

据了解,天池大数据竞赛是由阿里巴巴主办,面向全球科研工作者的高端算法竞赛。通过开放海量数据和分布式计算资源,让参与者有机会运用其设计的算法解决社会或业务问题。

最终,达摩院基于 5000 多个病例的 CT 影像样本数据,学习、训练了样本的病灶纹理,通过 NLP 自然语言处理回顾性数据、使用 CNN 卷积神经网络训练 CT 影像的识别网络。

2 月 15 日,这套系统第一个赶赴的地方便是郑州岐伯山医院,作为郑州「小汤山」,它是一家新冠肺炎确诊患者定点救治医院,一位病人的 CT 影像大概有 300 张左右,而医生对一个病例的 CT 影像肉眼分析耗时大约为 5-15 分钟,这给医生临床诊断带来巨大压力。

达摩院 CT 影像 AI 系统能直接算出病灶部位的占比比例,量化、预测病症的轻重程度,大幅度提升诊断效率,为患者的治疗争取宝贵时间。

阿里AI 系统自动识别新冠肺炎病例 CT 胸片


值得一提的是,在 CT 影像识别算法之外,达摩院与阿里云共同研发了辅助诊断算法,该算法可以根据患者基本信息、症状、实验室检查结果、流行病学史、影像报告等多维信息,进一步帮助辅助医生制定科学的治疗方案。

截至 3 月 31 日,这套 AI 系统已在浙江、河南、湖北、上海、广东、江苏、安徽等 16 个省市的 170 家医院落地,诊断超过 34 万临床病例。

除了 CT 影像 AI 系统,疫情期间,达摩院做的事情还有很多,覆盖疫情咨询、药物研发、病毒基因分析、临床诊断等多个环节。

1 月 27 日,达摩院连夜研发的智能疫情机器人。上线后便在全国各地投入使用,很快落地全国 27 个省、直辖市、自治区,免费为 57 座城市拨打 1600 万通防控摸排电话,摸排超过 20 万身体异常人群。

2 月 1 日,达摩院医疗 AI 算法,正式应用于新冠肺炎的病原学检测。达摩院与浙江省疾控中心合作,利用算法将疑似病例基因分析时间缩至半小时,该技术可以避免核酸检测出现的漏检情况,同时可以及时检测到变异病毒。

「我们的基因分析覆盖了 95% 以上的全序列,准确率近乎 100%,从自动化建库到基因测序再到最后一步基因分析(达摩院只提供最后一步服务),整个流程只需 14 小时,其他全基因组测序方法则一般需要两三天」,华先生说道。

达摩院算法专家正在设置基因检测分析参数


此外,疫情期间,达摩院医疗 AI 团队还提供了医疗专业翻译系统、疫情预测等系统,为更大范围、更高层次的抗疫,提供信息支撑。

(2)四年「铸剑」,练就绝世武功

2016 年,达摩院医疗 AI 由时任阿里巴巴 iDST 副院长的华先胜带队打造。

彼时人工智能热潮刚刚掀起,行业内对人工智能的探讨还仅仅局限在技术研发上,在落地场景上基本没有考量,具体到医疗领域可以在哪些场景驱动技术的落地,更是一片未知。

但当时的华先胜坚信:人工智能进入医疗健康领域,是一个必然的事情,作为视觉智能领域深耕多年的专家,华先胜团队从肺部 CT 影像开始切入医疗 AI,很快就做出成绩。

2017 年 7 月,达摩院 AI 在国际权威的肺结节检测大赛 LUNA16 上打破世界纪录,凭借 89.7% 的平均召回率(在样本数据中成功发现结节占比的比例)夺冠。

大赛要求选手对 888 份肺部 CT 样本进行分析,寻找其中的肺结节。样本共包含 1186 个肺结节,75% 以上为小于 10mm 的小结节。最终,达摩院在 7 个不同误报率下发现的肺结节平均召回率达到 89.7%,超出第二名 0.2%。

系统自动分析不同误报次数下召回率情况


这一次「第一」俨然有着承上启下的「里程碑」意义,为阿里达摩院新冠肺炎的 CT 自动诊断系统打下了基础,同时开启了达摩院更加广泛的研究范围。

2018 年 12 月,达摩院 AI 从近百支队伍中脱颖而出,在全球 LiTS(Liver Tumor Segmentation Challenge,肝脏肿瘤病灶区 CT 图像分割挑战) 获得两项第一;

2019 年的心脏冠脉中心线提取鹿特丹比赛(Rotterdam)上,达摩院 AI 获得全自动提取赛事第一名,相关论文被国际顶级医学影像会议 MICCAI 2019 提前接收;

2019 年, 达摩院 AI 获得 EMNLP 2019 微生物群落信息抽取比赛 (BB Task)「关系和实体联合抽取」任务冠军。

正是由于达摩院此前四年基础研究的「厚积」,才带来了疫情期间的从点到线到面的技术应用,让阿里看到了底层创新与产业土壤深度结合,不断蝶变的可能。

而阿里健康的升级,便将发生在这些技术加持带来的业务应用全面爆发的背景下。

(3) 拔剑相助,为医解困

疫情发生的突然,无疑给各行各业进行一次「大考」,尤其是 AI 医疗行业,然而,如果将问题换个角度,这其实也是一场机遇,在阿里健康资深副总裁马立看来,疫情对消费者、医院对于互联网医疗、影像 AI 系统等认知大大增强。

原先,医疗 AI 产品在实际落地医院过程中并不顺畅,「医疗 AI 行业大家收入都很少,以前按研发比如说科研合作挣取收入,现在也可以通过招标将产品落地医院」,汇医慧影一位员工此前向机器之心透露道。

招标是医疗 AI 企业产品进入院方的一种方式,院方发布需求,同类别企业进行竞标,但是过程并不顺畅,无论是产品或是科研成果迅速落地比较难,因此渠道资源,医院人脉就显得十分重要,他们在一定程度上可以帮助产品「打入」医院内部。

然而,即使进入医院内部,能被多大程度接受,应用程度如何也是未知,据新京报「寻找中国创客」报道,在 AI 产品扎堆的影像领域,一个三甲医院可能同时安装 10 余家 AI 公司的产品,医生真正使用的只有一两家,因为 AI 找到结节后尚不能辅助诊断,且目前产品多集中在肺结节查找上,同质化严重,而这些需要深度学习的 AI 产品,少了医生的纠错与补充,模型迭代也会变慢。

这一点马立有很大感触,「之前跟很多资深医生交流,有一些医生对于信息技术比较开放,但有些医生对于 AI 便持怀疑态度」,「但疫情过后,根据我们接触过的医生,会发现他们对于 AI 医疗的认知有很明显提升」,马立补充说道。

除了普通民众和医院,疫情也正在推动互联网医疗相关政策的出台,2020 年 3 月 2 日,国家医保局、国家卫健委两部发布《关于推进新冠肺炎疫情防控期间开展「互联网」医保服务的指导意见》,明确互联网医疗机构可以为参保人在线开具电子处方,线下采取多种方式灵活配药,参保人可享受医保支付待遇;3 月 5 日,「互联网医疗」被首次纳入中央级医保文件。