03.06 中美研究人员利用推特数据追踪和预测疫情爆发

中美研究人员利用推特数据追踪和预测疫情爆发

2020年1月21日,美国亚利桑那州立大学和中国天津财经大学的研究人员发表《利用推特数据和PDE模型进行区域流感预测》(Regional Influenza Prediction with Sampling Twitter Data and PDE Model)的文章,通过采集推特(Twitter)数据和相关模型对流感等病毒性疫情进行追踪和预测,以更快速地检测和预测区域疫情。该文受美国国家科学基金会(NSF)资助,发表在《国际环境研究与公共卫生》(International Journal of Environmental Research and Public Health)杂志上。

流感每年导致全球数十万人的死亡,尽管医疗技术和疫苗取得了进步,但SARS、禽流感、埃博拉、寨卡病毒以及近期在中国爆发的新型冠状病毒等新发和再发传染病仍然对人类生命和健康构成巨大威胁。

科学家指出,早期发现和快速果断反应是流行病疫情防控最关键的环节。然而,在许多情况下,现有的流行病检测方法和算法无法与今天可用的社交媒体数据相匹配。而随着网络社交媒体的发展,很多时候在社交媒体上都体现出事件的发展过程,这些数据为开发改进疫情监测系统提供了机会。

大量带有地理标记的Twitter数据为研究人员提供了及时探索、建模和预测流感病例趋势的机会。然而,社交媒体数据的爆炸式增长使得数据抽样成为一种自然的选择。研究人员开发了一种基于社交媒体实时发文数据的流感预测方法,该方法保证了流感预测的实时性。然后建立一个特定的偏微分方程(PDE)模型来描述和预测流感发文总量,其中PDE模型整合了流感传播、流感恢复和积极的人类干预以减少流感的影响等多种情况。大量仿真结果表明,该PDE模型几乎可以消除采样过程中的数据约简的效应,也就是说在较少数据的情况下可以获得较强的预测结果,在1%的采样数据上,其相对精度可以达到90%以上。即使对于更少的数据采样率,例如0.1%和0.01%的采样率,该模型仍然能够分别达到85%和83%的相对精度。这些结果证明,该模型即使在小样本Twitter数据的情况下,仍然具有预测流感趋势时空模式方面的能力。

该项目正在开发的基于实时地理标记Twitter数据的流行病暴发早期检测的系统新框架。它结合了数学和计算机科学领域的科学家的专业知识来开发新的算法,以更快地检测区域疫情,后期也可对中国的新型冠状病毒类似的疫情进行类似的监测和预测。研究人员指出,该项目将产生准确的结果,并为未来的疫情提供可靠的信息。这项研究还得到了美国国家地理空间情报局的资助。

转载本文请注明来源及作者:中国科学院兰州文献情报中心《资源环境科学动态监测快报》2020年第03期,牛艺博 编译。


分享到:


相關文章: