「大数据战“疫”」大数据助力新型肺炎疫苗、药物筛选等的研发

此时此刻,中国疾控中心、全球健康药物研发中心(GHDDI)等机构,正在中国超算中心、BAT等企业免费算力支持下,基于2019新型冠状病毒资源库等数据资源,争分夺秒地推进新型肺炎疫苗、药物筛选等研发。大数据科研已表明:新型冠状病毒“确属可防可控的传染病!”

战胜新型冠状病毒感染肺炎,离不开科技支撑。大数据时代,“数据密集型科学发现”早已兴起,成为科学研究第四范式。早在2018年3月17日,国务院印发《科学数据管理办法》,进一步加强和规范科学数据管理,更好地支撑国家科技创新、经济社会发展和国家安全。现如今,大数据科研已进入疫情防控阻击战第一线,助力新型肺炎疫苗、药物筛选等的研发。

中共中央政治局常务委员会会议2月3日强调,“推动相关数据和病例资料的开放共享,加快病毒溯源、传播力、传播机理等研究,及时完善防控策略和措施。要加强有效药品和疫苗研发,注重科研攻关与临床、防控实践相结合。”自新型肺炎疫情爆发以来,与疫情相关的国内外高校、科研院所、企业等机构纷纷行动,共推新型肺炎科学研究,尤其采用大数据科研范式。

国家基因组科学数据中心发布2019新型冠状病毒资源库

其中,国家基因组科学数据中心1月22日正式发布2019新型冠状病毒资源库。该库整合了世界卫生组织(WHO)、中国疾病预防控制中心(CDC)、美国国家生物技术信息中心(NCBI)、全球流感序列数据库(GISAID)等机构公开发布的冠状病毒基因组序列数据、元信息、学术文献、新闻动态、科普文章。

同时,2019新型冠状病毒资源库基于不同参考基因组序列,开展2019-nCoV病毒株基因组变异分析,并对结果进行了统计与可视化展示,可为追溯病毒来源、追踪病毒株变异路径、防控新型冠状病毒引发的疫情、治疗病毒性肺炎提供重要的数据基础与决策支持。可以说,该库是国际科学数据开放共享的合作典范,夯实了2019新型冠状病毒大数据科研的基础。

经数据分析,2019新型冠状病毒(2019-nCoV)与2003年爆发的SARS病毒基因组序列相似度为80%,与2017年2月从国内的蝙蝠中采集到的Bat SARS-like coronavirus isolate bat-SL-CoVZC45基因组序列相似性最高,相似度为88%。

多个中国超算中心协助,多家企业免费开放算力

如今,新药和疫苗研发需要进行大量的数据分析、大规模文献筛选和科学超算工作,尤其利用超算进行靶点探寻、新药筛选、先导物及试验优化、药理毒理等研究工作。中国疾控中心现已获得多个中国超算中心协助,成功分离病毒,争分夺秒地进行疫苗研发和药物筛选。另外,中山大学药学院罗海彬教授1月24日提出“需要大量计算资源进行抵抗新型冠状病毒的药物筛选和病毒突变预测”,深圳超算中心迅速协调了大量计算资源。

BAT等企业也相继宣布免费开放算力,支持病毒基因测序、新药研发、蛋白筛选等工作,帮助科研机构缩短研发周期。阿里云1月29日宣布:疫情期间,面向全球公共科研机构免费开放一切AI算力,与合作机构向全球科学共同体免费开放相关药物研发资源。阿里云此前曾与基因公司仅用15分钟完成高精度的个人全基因组测序,联合打破世界纪录。类似流程,科学界之前普遍需要120个小时。

与此同时,阿里云正与全球健康药物研发中心(GHDDI)合作开发人工智能药物研发和大数据平台,针对SARS/MERS等冠状病毒的历史药物研发进行数据挖掘与集成,开放相关临床前和临床数据资源,计算靶点和药物分子性质,并跟进新型冠状病毒最新科研动态,实时向科学界和公众公布,为新型冠状病毒科学研究提供重要数据支撑。

此外,百度创始人、董事长兼CEO李彦宏2月3日在致全体员工的内部信中介绍,“我们的AI算法使新冠病毒RNA分析时间从55分钟缩短到27秒”,“公司成立了3亿元的专项基金,要结合我们的人工智能、大数据能力,支持抗击疫情的新药筛选和研发,还要从根本上去解决社会公共卫生安全意识缺失的问题。”

大数据科研表明:新型冠状病毒“确属可防可控的传染病!”

电子科技大学大数据研究中心主任周涛教授近日在微信公众号“DataCastle数据城堡”上连续发布研究结果,为打赢新型冠状病毒感染肺炎疫情防控阻击战“疫”建言献策,提供科学决策依据。他表示,“新型冠状病毒肺炎的基本再生数与SARS接近,具有中等传染能力,确属可防可控的传染病!”该系列研究得到四川大学牵头的四川省新型冠状病毒肺炎应急攻关研究项目的支持。

四川省已在1月22日召开紧急工作会议,研究部署新型冠状病毒防控工作,重点研究利用“大数据+人工智能+临床流行病学+循证医学”等手段研究新型冠状病毒的传播路径、危险期、致死性以及发病趋势,为疫情防控提供科学指导。

随后,由四川大学牵头,电子科技大学、国防科技大学共同组建新型冠状病毒大数据交叉学科研究平台,利用现有数据存储平台、运算平台,结合历史上国内外所有重大流行病和重大灾害的数据和规律,判断未来新型冠状病毒的趋势,并在此过程中逐步积累研究基础、培育一流的研究团队,为新型流行病研究和防控贡献科学力量。

在上述项目和平台的支持下,电子科技大学大数据研究中心学者利用《柳叶刀》和《新英格兰医学杂志》发表的流行病调查学结果并参考SARS的一些传播机制,认为新型冠状病毒“基本再生数”(Basic Reproduction Number,即在没有任何干预措施下一个感染者平均能传染多少人)估计值在2.2到3.0之前,不高于SARS,从而否定了“完全不可控制”的悲观结论。因此,我们要对这次战“疫”充满信心,不必过度恐慌和悲观,但是需要有效应对。


分享到:


相關文章: