日點擊10億的全球疫情圖背後,是倆中國博士生

日點擊10億的全球疫情圖背後,是倆中國博士生


每天早上起來第一件事,就是打開電腦查看網頁、郵箱,看看有沒有數據需要更新更正。然後全天隨時監控疫情數據,動輒還要以近乎7×24(每週每天連續24小時)的方式連軸轉……


新冠疫情爆發幾個月以來,這是約翰·霍普金斯大學博士生董恩盛和杜鴻儒每天的常態。


全球政府、媒體、專業人士奉為圭臬,日點擊量超過10億次的約翰·霍普金斯大學全球新冠疫情數據地圖,就誕生在這所學校兩名中國博士生的個人電腦上。


故事,還得從兩個多月前的一杯咖啡說起。


全球疫情數據No.1,從一杯咖啡開始


日點擊10億的全球疫情圖背後,是倆中國博士生

董恩盛


1月20日星期一是美國的馬丁·路德·金紀念日。法定假日與週六日連成了一個小長假,這使董恩盛和杜鴻儒導師勞倫·加德納原定每週一的組會推到了週二上午10點舉行。


24個小時之前,鍾南山院士剛剛通過央視直播畫面向全世界確認了新冠病毒人傳人和醫護人員感染的情況,美國也在同日確診了首例新冠肺炎病例。週二一早,董恩盛已從新聞得知武漢可能即將“封城”的消息,對國內的情況有些擔心。


日點擊10億的全球疫情圖背後,是倆中國博士生

杜鴻儒


但在約翰霍普金斯大學,剛剛結束假期的師生正一身輕鬆。假期裡舉行了博士資格考試,董恩盛和杜鴻儒都順利通過。導師加德納教授給每人買了一杯咖啡,大家邊喝邊聊,從假期生活聊到下學期的研究計劃。


師生三人所在的是約翰·霍普金斯大學土木和系統工程系的系統科學和工程中心,加德納教授在學校的傳染病學院掛職,他們的研究方向包含系統工程、數學建模、網絡分析和流行病學。


日點擊10億的全球疫情圖背後,是倆中國博士生

勞倫·加德納教授


喝著咖啡,加德納教授問董恩盛:“你知不知道最近中國的新冠肺炎很嚴重?”


2019年5月,董恩盛就曾設計過一個美國麻疹風險的地圖,被紐約時報、美國有線電視新聞網(CNN)等媒體報道。這次,加德納教授向董恩盛建議,針對中國的新冠疫情再做一個數據地圖。


“因為有做美國麻疹地圖的經驗,基本上我只要把麻疹換成新冠肺炎的數據就可以完成基礎工作了。”當天晚上,約翰斯·霍普金斯大學全球新冠疫情數據地圖便在董恩盛手中應運而生。不過這時的地圖默認視角還只限於東亞地區。


2月1日,杜鴻儒也正式加入了這項工作中。每天起早貪黑維護疫情地圖,關於中國疫情的數據,兩人主要通過中國國家衛健委和丁香園網站獲得。


隨著確診病例在更多國家出現,一個明顯的對比是,中國方面的數據在呈現形式和及時性上都要好非常多,為數據獲取和錄入帶來很大便利。”董恩盛告訴北京日報客戶端,起始階段,其他國家的疫情數據主要來自媒體,直到現在,全球疫情已非常嚴重的情況下,美國具體到一些郡縣的疫情數據都難以從公開渠道獲得,“但是中國的話,從各縣、市的衛健委基本都能相對容易地找到相關數據。”


這張圖,緣何成為全球關注中心


醫學和公共衛生是約翰·霍普金斯大學的強項,其公共衛生學院歷來在美國高校排名第一。2月底,美國的新冠肺炎確診病例悄然達到數十例,伊朗和意大利疫情呈現出暴發態勢,董恩盛和杜鴻儒製作的疫情地圖也受到越來越多關注。


“大概是在這個階段,美國地方衛生部門聯繫到了我們,表示希望在地圖看到美國的情況。”董恩盛說,如果再單做一個美國的地圖,工作量太大。除此之外,不同國家的用戶也找到他們,提出一些建議和需求,甚至有人希望能做一個本國語言的版本,“我說這我們可萬萬做不到了。”


既然無法滿足每個人特定的需求,團隊決定乾脆把疫情地圖的默認範圍擴大到全世界。


其實,鑑於新冠肺炎前所未有的破壞力和威脅性,這樣面向全球的“疫情數據地圖”系統,約翰·霍普金斯大學並不是獨一家。哈佛大學與牛津大學合作,美國疾控中心(CDC),以及微軟的必應搜索(Bing)都設計發佈了類似的系統,供全球公眾使用。


CDC發佈的美國疫情地圖能顯示各州疫情數據,因其官方性質,具有權威性。但董恩盛表示,與他們的地圖相比,CDC地圖有兩個明顯缺點,更新不及時,且精度有限。


“可能今天更新的還是前一天的數據,而我們基本是實時更新。他們的數據只能精確到州一級,我們可以精確到州下面的郡縣。”


事實上,也正是由於發現CDC數據精度不足,董恩盛和杜鴻儒才起意對自己地圖的美國部分進行了精度“升級”。


哈佛和牛津和合作設計的疫情地圖,更新速度和數據詳盡程度也不如約翰·霍普金斯大學。有一個明顯的區別是,前者用顏色深淺來體現疫情的嚴重程度,後者是用點的大小。杜鴻儒介紹,哈佛、牛津的地圖有動畫顯示新冠疫情發生以來全球發展過程的功能,這是他們沒有的。


董恩盛對微軟Bing設計的疫情地圖稱讚有加。


記者發現,Bing的地圖在某些方面可以提供比約翰·霍普金斯大學更精確的數據,例如俄羅斯、印度、印尼等國的地方疫情數據,而約翰·霍普金斯大學的地圖在這幾個國家還只顯示全國數據。不過,後者能用曲線、柱狀圖等形式體現疫情發生以來每個國家的疫情發展趨勢,功能更豐富,而且數據公開,為學術研究提供了便利。


數據的更新、功能的完善都須耗費大量時間和精力。對新冠疫情在全球範圍的發展進程,作為團隊的第一個“援兵”,杜鴻儒坦言出乎意料。


“加德納教授和恩盛開始只是想追蹤一下疫情在中國的發展,沒想到後來需要的人力越來越多,也沒想到兩個月以後美國的情況會比中國嚴重得多。”


兩個多月下來,約翰·霍普金斯大學全球新冠疫情數據地圖早已成為全球最權威的疫情數據平臺。


日點擊10億的全球疫情圖背後,是倆中國博士生


起初,在團隊只有七八個人的情況下,連續工作一週,每人每天要承擔15小時到20小時的工作量,壓力巨大。這在3月23日地圖數據更新模式升級為全自動後得到了改觀。團隊現在已有三四十名成員,來自美國各地和其他一些國家,通過網絡共同對地圖進行維護和相互溝通。董恩盛說,自己的角色也發生了轉變,“現在有點像個產品經理了。”


雖然師生三人並不屬於公共衛生院系,但約翰·霍普金斯大學從各方面給予他們很大支持。和導師加德納教授一起,董恩盛和杜鴻儒可以經常參與傳染病學院的討論,獲得學術建議;學校已停課並封閉半個多月,但專門給他們辦了出入證,以便他們進校繼續必要的科研活動;校長辦公室更直接給他們安排了一名行政助理。這些都成為疫情地圖得以發展至今的堅強後盾。


疫情數據有真偽?他們這麼看


董恩盛赴美學習已有七八年,杜鴻儒有三年。自疫情在湖北暴發以來,大洋彼岸的他們經歷了從擔心到被擔心的過程。截至當地時間4月8日,約翰·霍普金斯大學所在的巴爾的摩已有571個確診病例,這對200多萬人口的巴爾的摩來說不是個小數。同時,巴爾的摩出了名的混亂治安也加重了兩人和家人的擔憂。


董恩盛告訴北京日報客戶端,從1月到現在,自己出門買菜的次數不超過5次,更多情況下通過外賣購入物資。“巴爾的摩挺不安全的,經常發生槍擊。當地人對病毒的防護意識也還是不強,我們出門基本上只去防護比較好的亞洲超市。”


中國成功的疫情防控令世界矚目,出自中國留學生之手的約翰·霍普金斯大學全球新冠疫情數據地圖,自然也帶有了中國元素。杜鴻儒直言:“地圖能這麼快做出來,跟我和恩盛來自中國有一定關係。相較其他人來說,我們對疫情的重視程度更高,在地圖建設起始階段的投入也更大。”


丁香園網站是地圖最初的主要數據來源。“丁香園只有中文,語言的先天優勢讓我們可以最快地轉換丁香園的數據,並把資料翻譯成英文給導師參考。”杜鴻儒說。


對近來國際上圍繞中國疫情數據產生的“質疑”,董恩盛也有自己的見解。在他看來,中國疫情數據的增長曲線在達到一定水平後就很和緩,可以證明疫情得到了控制。想要進一步證明數據的真偽,很多國家都很難做到這一點,特別是在疫情蔓延全球之後。


2月13日,湖北突然通報新增了13000多例臨床診斷病例。董恩盛覺得這是一個比較合理的統計方式的變化,但國際上卻因此對中國疫情數據有很多批評。


“其實美國也有類似問題,還有像意大利有段時間只報重症病例。美國有的州縣不報外地的病例,比如緬因州挨著波士頓和紐約,如果有一個在大城市註冊了身份的感染者回到當地被確診,可能不會被納入當地確診病例進行通報。但他本來所在的大城市也可能不把他列入確診當中,因為他已經離開了。這就給數據的精確統計造成干擾。”


作為全球疫情數據“中心”的製造者,對美國日益嚴重的疫情狀況,兩人都表示“不容樂觀”。


杜鴻儒說,雖然從確診病例所佔人口比例來說,意大利和西班牙的情況比美國嚴重,但美國確診病例的確已呈現為指數型增長。


“自從美國頒佈居家隔離政策後,已經能看出個別地區出現好轉,但能否迎來‘拐點’還不太清楚。目前我們能做的分析只有判斷哪些地區風險比較高,未來的確診、死亡增長趨勢沒法預測,如果預測只能預測3天到5天的。”


董恩盛則說,最讓他擔心的還是美國普通民眾對疫情的重視程度,因為只有每一個人都真正關心自己和身邊人的安全,“全民戰疫”,才能真的把病毒控制住,而不是政府說你要怎麼做,才去應付。


兩人告訴北京日報客戶端,接下來,地圖的功能還要做進一步的優化和升級,他們可能將加入美國各州的病毒檢測數據,以及確診病例在人口中的比例,“都是很關鍵的數據。”


分享到:


相關文章: