冠状病毒:疾病背后的数据

TDS播客上的Jeremy Howard

冠状病毒:疾病背后的数据

编者注:迈向数据科学播客的"攀登数据科学阶梯"系列由杰里米·哈里斯(Jeremie Harris)主持。 Jeremie帮助运行名为SharpestMinds的数据科学指导初创公司。 您可以收听以下播客:

1月中旬,中国对湖北省的一系列异常肺炎病例进行了正式调查。 在不到两个月的时间里,这一系列病例将迅速发展成一场全面的大流行病,全球范围内将有数十万甚至是数百万的感染,并可能释放出自1918年西班牙流感或大萧条以来从未出现过的经济破坏浪潮萧条。

导致我们从少数几个孤立的感染发展到今天的指数式增长,与我们的直觉完全相反。 这对需要遏制冠状病毒传播特征的流行病学家,必须根据其建议行事并说服一般自满的公众实施挽救生命的社会疏远措施的决策者提出了许多挑战。

随着冠状病毒传的盛开,我认为现在是接触极受欢迎的Fast.ai机器学习教育网站的联合创始人杰里米·霍华德的好时机。 杰里米(Jeremy)与他的联合创始人瑞秋·托马斯(Rachel Thomas)共同撰写了一份近期病毒报告,概述了有关冠状病毒的数据驱动案例。 在聊天过程中,我们涵盖了很多领域,以下是一些关键要点:

· COVID-19病例的指数增长具有许多违反直觉的后果,其中之一是难以估计可靠的死亡率。 许多幼稚的估计要么通过低估真实病例(包括无症状和症状前携带者)的数量高估了死亡率,要么由于没有考虑到感染检测和威胁生命的症状发作之间的延迟而低估了死亡率 。 归根结底,获得合理估计的唯一方法是依赖生存分析之类的技术,这些技术旨在与受检查的数据一起使用(尚不清楚正在进行中的病例的结果)。

· 贝叶斯模型在处理呈指数级失控的问题时非常重要:低估病毒生长系数10%可能意味着数百万个感染之间的差异,造成可能病例数非常长的尾巴,这会产生严重影响 医疗保健系统避免崩溃的能力。

· 在这种情况下,来自学术界和政府的清晰沟通尤为重要。 这意味着,良好的数据可视化和清晰的统计效果描述对于确保不会误导人群所面临威胁的性质极为重要。 杰里米(Jeremy)以最新研究的形式指出了这个问题的一个重要例子,该研究显示冠状病毒的传播具有明显的季节性,但利用不良的数据可视化来阐明其观点,从而导致了不值得的怀疑。


(本文翻译自Jeremie Harris的文章《Coronavirus: the data behind the disease》,参考:https://towardsdatascience.com/coronavirus-the-data-behind-the-disease-68c912f1a5e0)


分享到:


相關文章: