這麼多疫情地圖,為什麼約翰霍普金斯大學動態圖成為流量擔當?

此次新冠肺炎爆發,全球諸多機構都推出了各自不同的數據追蹤地圖,為什麼就約翰霍普金斯大學動態圖"火"了呢?

自新冠肺炎在全球爆發以來,每日的疫情數據一直是大家關注的焦點。為此,全球多家機構也陸續推出了多種不同類型的疫情數據彙總平臺,不論是世衛組織、各大學及醫院,還是微軟、谷歌等科技企業,其所提供的疫情動態地圖都為廣大公眾和全球的研究人員提供了重要的資訊。

期間,由美國約翰霍普金森大學(Johns Hopkins University 以下簡稱JHU)系統科學與工程中心(CSSE)製作的COVID-19動態地圖,因其上線早、更新快、數據準、信息全等多種優勢,迅速獲得了全球關注。

◎疫情地圖網址:https://www.arcgis.com/apps/opsdashboard/index.html#/bda7594740fd40299423467b48e9ecf6

"流量擔當"的疫情地圖

我們為什麼需要一個準確、快速、全面的疫情動態地圖?

"及時瞭解全球真實的確診人數,對於我們更好地瞭解這種疾病,比如何時會達到峰值、何時會開始下降很有幫助,還能幫助我們更好地瞭解什麼時候可以復工",芝加哥拉什大學醫學中心傳染病教授、副醫務官Bala Hota博士在接受美國CNN採訪時曾如是說。而這,也恰是JHU動態地圖如今能受到如此追捧的重要原因。

從技術角度來看,JHU動態地圖的核心並不複雜——使用美國Esri公司的ArcGIS在線交互地圖技術,將數學建模計算彙總出的全球新冠疫情數據,以更直觀、更簡單易懂的方式可視化呈現。

作為一切的核心,JHU動態地圖的數據源覆蓋面非常廣,包含了世衛組織、美國疾控中心、歐洲疾控中心、中國疾控中心以及全球其它媒體和健康部門公佈的數據。這些數據在被收集和彙總後,會被上傳至GitHub平臺,再由JHU動態地圖團隊導入ArcGIS。截至目前,該疫情地圖已經實現了對數據的全自動在線抓取和彙總。

據國際知名科學期刊《自然》稱,目前JHU動態地圖在GitHub平臺已收藏基礎數據近20000次,提交了近1700次問題反饋,並對數據提出了超350次的修改申請。由於數據抓取及時、更新頻次高,JHU動態地圖在發現各地區首例病例方面特別敏銳。對於這一點,國際權威醫學雜誌《柳葉刀》在此前就曾發文稱,研究人員通過對比發現,JHU動態地圖的更新速度遠快於世衛組織,僅次於澳大利亞、香港和意大利。

據悉,自1月22日正式上線至今,JHU動態地圖的網頁點擊量單日峰值曾突破10億次,是同類地圖中當之無愧的"流量擔當"。

這麼多疫情地圖,為什麼約翰霍普金斯大學動態圖成為流量擔當?

▲JHU新冠病毒研究中心給出的網頁實時流量監測。(圖源:JHU新冠病毒研究中心)

為什麼"火"的是它?

事實上,早在搭建JHU動態地圖之前,該項目總負責人、CSSE聯合負責人Lauren Gardner博士就曾帶領自己的學生做過類似的數據平臺,重點監測麻疹之類的傳染病爆發。那麼此次新冠肺炎爆發,全球諸多機構也都推出了各自不同的數據追蹤地圖,憑什麼就JHU動態地圖"火"了呢?

對於這個問題,Lauren Gardner博士認為"上線早"是JHU動態地圖能夠在眾多同類產品中脫穎而出的重要原因之一。

"我們是關注(COVID-19疫情發展)最久的(平臺),早在1月中國剛爆發的時候就開始了",作為一位曾為麻疹和寨卡病毒傳染病空間建模的學者,Lauren Gardner博士如是說。但與此同時她也坦言,其團隊此次之所以能如此快速地做出響應,更要歸功於自己的學生——董恩盛,一位來自中國的博士生。

"他個人對(新冠疫情)非常關注",Lauren Gardner博士說:"系統做好的第二天,我就把它分享在了Twitter上,然後它立刻就火了"。

這麼多疫情地圖,為什麼約翰霍普金斯大學動態圖成為流量擔當?

▲COVID-19動態地圖項目的總負責人、CSSE聯合負責人Lauren Gardner博士。(圖源:JHU)

除了關注得早,JHU動態地圖的另一大突出特點就是數據更準、更快。在疫情早期,新冠病例的增長還主要集中在中國國內,Lauren Gardner博士及其團隊的數據採集和彙總的主要來源是丁香園的數據。此後,隨著疫情在全球範圍的不斷髮展,包括世衛組織、美國疾控中心、Worldometers.info網站、中國疾控中心以及多種在線新聞服務平臺的數據也被他們納入了進來。

"有上百萬的眼睛在時刻關注著我們,所以就算我們遺漏了什麼,大家也會立刻發現,然後快速聯繫我們",Lauren Gardner博士說。

在她看來,是眾人的共同參與成就了現在的JHU動態地圖:"我們收到了上千封的郵件,大家會說'嘿,有兩例新增你們沒發現',而且我們現在也有一個異常檢測的提示系統,能幫我們自動收集數據"。

儘管如此,Lauren Gardner博士和她的團隊還面臨著諸多挑戰,比如,何防止他們自己彙總而來的數據在幾經中轉後,反過來又被當作新增病例被納入統計,最後導致數據出現重複統計?

"為了獲取美國的最新數據,我們一直密切著一個叫1point3Acres的資訊彙總平臺。我們從它提取美國數據,他們則從我們這裡獲取全球數據,所以我們必須非常小心,(確保)我們只援引它的國家(美國)數據。"

地圖背後的中國身影

正如Lauren Gardner博士多次所提,此次JHU動態地圖的成功離不開自己的學生——董恩盛,但很少有人能想到,這樣一個如今受到全球矚目的地圖,從無到有隻花了董恩盛不半天的時間。

"當時我和導師Lauren Gardner博士在討論新學期做點兒什麼新的項目,然後我就說,為什麼不弄一個可以追蹤新冠疫情的數據面板呢?",在回顧自己當初為什麼要做這個地圖,董恩盛笑著說:"我懂中文,還會說普通話,收集數據的效率快也更準"。

事實上,早在今年1月國內疫情剛爆發之時,董恩盛就開始醞釀"做點兒什麼"的想法了。他坦言,雖然彼時身在美國,但國內疫情的發展使他非常擔心自己的山西老家,更擔心生活在那裡的家人,"這是我想要做這個數據儀表的最初原因"。

當自己的提議得到了導師的認可,董恩盛決定說幹就幹,只用了7、8個小時就建好了一個簡易的動態地圖數據面板。此後,和導師Lauren Gardner博士一同優化後,第二天,初版的JHU動態地圖就這樣上線了——可以說,彼時幾乎沒人能想到,它在此後會成為世界瞭解新冠疫情全球發展的重要窗口。

在疫情初期(1月22日-31日),所有的數據收集和處理都是大家手動進行,每天早晚分別進行兩次彙總與更新。在人手方面,除了董恩盛,團隊裡還迎來了另一位中國留學生杜鴻儒,他主要負責的工作是為自動更新寫代碼和核對數據。

"最大的困難就是源數據格式不同、語言不同,我們得把數據彙總、重組、調整成能適配我們系統的格式,再將這些數據上傳",杜鴻儒說。

這麼多疫情地圖,為什麼約翰霍普金斯大學動態圖成為流量擔當?

▲董恩盛(左邊)和杜鴻儒(右邊)。(圖源:CGTN)

然而,儘管人手增加到了6個人,但他們的壓力卻沒能減小。相反,隨著疫情的快速發展,動態地圖對數據的總量、細化數據的計算壓力……這些都導致大家的工作量急劇上升。此刻他們意識到,手動查詢與錄入已經無法滿足現階段的需求——2月1日,JHU動態地圖終於升級成了半自動更新。

"用地圖的人越來越多,這就要求我們更得對數據的準確性負責……而且隨著訪問量的增長,我們的服務器也崩了好多次……這真的讓我特別緊張",董恩盛說:"但是好在後來我們得到了幫助,升級了服務器,現在我們能比較好地應付(大量的訪問量)了"。

據瞭解,這個6人小團隊最初能依賴的只有亞馬遜的雲計算服務器。爾後,為了更好地幫助Lauren Gardner博士和學生的工作需求,JHU校方也開始加入其中,為這個項目提供更多的內部支持。截至目前,包括JHU應用物理實驗室、Esri公司在內的更多專業機構都加入了技術支援之列。

"他們幫助我們確保網站不會崩潰,因為數小時之內(地圖的)點擊量就能高達10億次",Lauren Gardner博士說:"為此,我們也重新設計了好幾次這個框架,把這些服務器更新了好多次"。

這麼多疫情地圖,為什麼約翰霍普金斯大學動態圖成為流量擔當?

(圖注:4月10日JHU新冠疫情動態地圖的用戶界面。圖源:JHU)

一切還遠遠不夠

Lauren Gardner博士認為,雖然現在有了更多的專業技術支持,還有了更龐大的志願者團隊作為後援,但鑑於新冠疫情的發展,未來依舊是任重道遠。

"就我們目前要做的事兒來看,現在團隊的人手還是太少了",她說。

在她看來,如果不同地區的健康權威機構都能以一種更易外界援引數據的方式,持續不斷地更新自己的疫情數據,動態地圖的作用或能變得更好。

據悉,Lauren Gardner博士和自己的團隊已經擱置了實驗室的所有其它工作,以此來確保能夠全身心地做好疫情地圖。談及未來,他們表示將用一整年的時間持續追蹤疫情的發展。與此同時,鑑於多項都已經實現了全自動更新,他們也將花更多的時間進行不同種類的研究。

"現在,我幾乎九成的興趣和工作都回到了對這種疾病的數學建模上", Lauren Gardner博士說:"我們正在對美國的疫情做實時的風險評估,希望到時候,我們能通過將數據反饋給上層決策者,提醒他們'這些縣明天要額外關注'。我們能做到這一點,我們也應該這樣做"。

https://www.natureindex.com/news-blog/behind-johns-hopkins-university-coronavirus-dashboard

https://news.cgtn.com/news/2020-04-07/Who-has-the-most-high-profile-COVID-19-tracking-map--PuDYW0JZa8/index.html

https://www.sciencedirect.com/science/article/pii/S1473309920301201?via%3Dihub#fig1

這麼多疫情地圖,為什麼約翰霍普金斯大學動態圖成為流量擔當?

出品:科普中央廚房

監製:北京科技報 | 科學加客戶端

歡迎朋友圈轉發

請發郵件至[email protected]

閱讀更多權威有用的科普文章、瞭解更多精彩科技活動,請下載“科學加”客戶端。蘋果用戶可以在App store搜索“科學加”下載安裝,安卓用戶可以在應用寶、360手機助手、豌豆莢、華為、小米等應用市場搜索“科學加”下載安裝。


分享到:


相關文章: