全球疫情數據出現“烏龍”,關於“霍普金斯大數據”,你是否還有很多問號?

北京時間14日7時左右,美國約翰斯·霍普金斯大學新冠肺炎疫情數據鬧出“烏龍”。

根據該網站的數據,截至北京時間4月14日早5點31分,美國新冠肺炎累計確診病例為577307例。而1個多小時後,7點15分數據顯示,美國累計確診數突增10萬多例,達682619例,這也讓全球累計確診病例數突破200萬。

14日早7點15分數據

隨後這一消息被多家媒體引用。

美國國家廣播公司(NBC)報道截圖

美國廣播公司(ABC)報道截圖

據觀察者網報道,“美國1個多小時內新增10萬例”的背後,是霍普金斯大學在統計佛羅里達州數據時出現失誤。橫向對比CNN新聞網、《紐約時報》、WorldMeters數據可以發現,佛羅里達州累計確診數大概在2萬左右。

約翰斯·霍普金斯大學隨後也發表聲明稱,數據達到200萬是因為,團隊“ 發現美國佛羅里達州的數據出現異常,導致把數據從19985例算高致123019例。目前這一數字已被更正。”

According to a statement from JHU, at the time the tally was at the two million mark, their team "found an anomaly in Florida data for Okaloosa that drove a spike from 19,985 to 123,019. It has since been corrected."

目前,約翰斯·霍普金斯大學官網已更正數據,最新數據顯示美國累計病例仍為58萬例左右,全球累計確診數並未破200萬。

疫情數據為何由美國一所大學發佈?

隨著疫情在全球蔓延,多國主流媒體或政府衛生部門在進行疫情更新發布時,都在引用美國約翰斯·霍普金斯大學的疫情數據更新圖。

很多人都有疑問,絕大多數的國家和地區都由政府機構統一公佈數據,但是在美國,為什麼不是美國疾控中心公佈數據(CDC),而採納約翰斯·霍普金斯公佈的數據。

這是因為,美國疾控中心網站3月3日發佈消息稱,停止公佈檢測人數等相關數據,理由是隨著各州檢測數量的增加,這些數據由各州自行統計,全國數據不具有代表性。

隨後,美國各大媒體,如CNN、美聯社、今日美國網站、《國會山報》、CBS等,都開始參照霍普金斯大學發佈的實時數據進行新聞報道,全球媒體引用霍普金斯大學疫情數據的也越來越多。

那麼這個可視化實時數據發佈項目的開發者是誰呢?約翰斯·霍普金斯大學土木工程系副教授Lauren Gardner博士和她的兩位中國博士生一起開發了這個可視化、可交互的全球疫情地圖。

兩名“操盤”的中國博士生董恩盛(左)和杜鴻儒

據悉,約翰斯·霍普金斯大學的數據來自世界衛生組織以及中、美、歐的疾控中心等國際與地區公共衛生組織與部門,並會參考地方媒體報道和其他數據平臺。

霍普金斯大學數據為何

常常比世衛組織的偏高?

經過多次比較發現,來自霍普金斯大學的數據似乎和世衛組織數據並不完全一致,而且差別還不小。

例如:搜索世衛組織官網發現,截至北京時間4月13日16點,全球累計確診數為1773084例。

而按照霍普金斯大學公佈的數據,截至北京時間4月13日5點,全球累計確診就已經超過190萬例,比11小時後的世衛組織數據還多出10萬多。

霍普金斯數據為何要高於世衛組織數據?

1、數據來源不同

要搞清楚這個問題,我們首先要明白霍普金斯大學數據以及世衛組織數據的來源。

世衛組織的數據是怎麼收集的呢?世衛組織是眾多聯合國特別機構中,擁有地區分支最多的組織。據官網介紹,它既有在日內瓦的總部,還有六個區域辦事處,150個國家辦事處,194個會員國,全球現有7000多名工作人員。於是各種數據,包括重大傳染病疫情監控數據可通過層層上報統計出來。

世衛組織官網數據截圖

而霍普金斯的數據來源在兩三個月期間還經歷了一個變化的過程。

早在1月22日,霍普金斯大學數據就已誕生。該校的系統科學與工程中心就製作了“全球新冠病毒擴散地圖”,最初的數據來自世界衛生組織、美國疾控中心、Worldometers.info網站、BNO通訊社以及各國政府和衛生部門,並將疫情通過可視化方式向公眾展示。

據霍普金斯疫情地圖網頁介紹,1月22日至31日,霍普金斯大學的數據收集完全靠手動進行,每天早晚分別公佈一次。隨著疫情發展,手動更新已變得不可持續,於是從2月1日開始採用半自動化的實時數據流。

得益於手動收集與自動更新相結合的發佈方式,相較於官方和部分媒體每日公佈一次的方式,約翰斯·霍普金斯大學的數據基本實現了實時更新。

2、霍普金斯算上了“推定陽性病例”

霍普金斯大學項目團隊2月19日在《柳葉刀》雜誌發表了一篇介紹文章,對比了約翰·霍普金斯大學系統科學與工程中心(CSSE)和世界衛生組織(WHO)的數據報告,發現從1月底到2月初,兩者在病例數據上差別不大。但有些不同的是,霍普金斯大學數據在捕獲國家或地區首次報告新冠肺炎病例的時間上似乎略早於世衛組織。

另外,據牛津大學創立的“用數據看世界”(Our World in Data)網站3月19日發文稱,就美國初期的病例統計而言,世衛組織、歐洲疾控以及霍普金斯的數據幾乎是一致的,從3月10日開始,霍普金斯大學的數據明顯高於其他兩者,原因在於他們參考了“推定陽性病例”的估算。

這一項數據是指由州或地方實驗室確認的病例,但未經國家疾控中心證實。而美國疾控中心已經明確指出,各州的病例報告是最新數據。因此約翰·霍普金斯大學的數據相對而言更加實時,也更加準確。

來源:中國日報網