全球上百個新冠數據集各顯神通,讓你我都成為“半個流行病學家”

隨著 COVID-19 數據集的日益普及,全球技術開發人員為流行病學家和數據科學專家們創建了一堆分析工具,來迅速彙總和分析 COVID-19 大流行的數據,讓這次新型冠狀病毒爆發成為有史以來最直觀的一次。


通過這些宏觀、全面、又詳細的可視化數據集,我們每一個“吃瓜網民”都可以算得上半個流行病學家。


第一個數據分析儀表板和匯合工具出現在 COVID-19 爆發後不久。該儀表板由約翰·霍普金斯大學提供,成為了目前重要的數據源,它將來自世衛組織、疾病預防控制中心、ECDC、NHC、DXY、1point3acres、Worldometers.info、BNO、國家政府衛生部門以及當地媒體報道的數據進行匯合,形成可視化數據展示。


全球上百個新冠數據集各顯神通,讓你我都成為“半個流行病學家”

約翰·霍普金斯大學的 COVID-19 全球儀表板


約翰斯·霍普金斯大學也將數據放在了 GitHub 上。自 1 月 23 日發佈該儀表板以來,COVID-19 已經成為公認的最可視化的大流行數據集。
GitHub 地址:
https://github.com/CSSEGISandData/COVID-19


可視化分析大流行


除了約翰·霍普金斯大學的 COVID-19 全球儀表板,目前全球還有許多優秀的可視化分析數據集,比如:

  • 利用約翰霍普金斯大學 GitHub 存儲庫的數據,Tableau 公司發佈了一個入門儀表盤,使其在 Tableau Public 上可用,提供各種可視化模板,也設置了數據集的 .hyper , .tde 和 CSV 版本,便於訪問。地址:https://www.tableau.com/covid-19-coronavirus-data-resources
  • 美國環境系統研究所公司(Esri)通過地圖和地理定位技術應用於 COVID-19 的跟蹤,此外還對 COVID-19 病例數據進行了本地化,並與來自權威醫療機構的病床可用性數據相結合。地址:https://www.esri.com/en-us/covid-19/overview
  • Facebook 和卡內基梅隆大學( Carnegie Mellon )將用戶數據匿名化,以追蹤全美範圍內的 COVID-19 狀況。地址:https://covid-survey.dataforgood.fb.com/
  • 《大西洋月刊》( Atlantic )的作者們正在使用開源軟件收集來自多個來源的數據。地址:https://covidtracking.com/
  • GitHub 有一系列關於新型冠狀病毒的數據集,而像 data.world 和 Kaggle這種競賽、預測和可視化的平臺也有新型冠狀病毒的數據集。地址:https://data.world/
  • Reddit 有個專題專門展示一群愛好者和數據科學家的可視化成果,Our World in Data也對 COVID-19 的研究和數據進行了概述。地址:https://www.reddit.com/r/dataisbeautiful/
  • 數據服務公司 Starschema 已經列出了一個免費的數據集,旨在成為 COVID-19 病例發病率和死亡率的唯一真實數據來源,這些數據可以用人口密度和地理位置來擴充。地址:https://www.snowflake.com/datasets/starschema/
  • IBM 彙總了 COVID-19 數據,並將其與 Weather Channel 應用程序進行集成,該應用程序將天氣數據和本地新型冠狀病毒事件融合在一起。通過其天氣頻道應用,IBM 的子公司可以將相關的 COVID-19 數據提供給 3 億的活躍用戶。在谷歌和微軟必應( Microsoft Bing )的共同努力下,IBM可視化技術將得以發展,把 COVID-19 數據帶給大眾。地址:https://accelerator.weather.com/bi
  • ESO是一家數據軟件公司,專注於研究EMS、火災和醫院的急救人員的情況,以追蹤全美各地的急救數據,該數據集收集了從院前到醫院的反應,收集自全美 2600 家 EMS 機構,但不包括加州。地址:https://www.eso.com/covid-19/
  • 健康指標與評估研究所( Institute for Health Metrics and Evaluation )也有一組數據,關注醫院病床的使用情況,以及重症監護床和呼吸機的需求。地址:https://covid19.healthdata.org/united-states-of-america
  • C3.ai 創建了一個統一的數據集,公開所有可用的 COVID-19 數據集。地址:https://c3.ai/products/c3-ai-covid-19-data-lake/


全球上百個新冠數據集各顯神通,讓你我都成為“半個流行病學家”


彙總到 C3 數據集中的數據集:


  • 約翰霍普金斯大學: COVID-19 數據倉庫
    https://github.com/CSSEGISandData/COVID-19
  • 大西洋: COVID 跟蹤項目
    https://covidtracking.com/
  • 紐約時報: COVID-19 在美國的數據
    https://github.com/nytimes/covid-19-data
  • nCoV-2019 數據工作組:流行病學數據
    https://github.com/beoutbreakprepared/nCoV2019/tree/master/latest_data
  • MOBS Lab: COVID-19 情況報告
    https://www.mobs-lab.org/2019ncov.html
  • 世界衛生組織:每日情況報告
    https://www.who.int/emergencies/diseases/novel-coronavirus-2019/situation-reports
  • 歐洲疾病預防和控制中心:全球最新情況
    https://www.ecdc.europa.eu/en/covid-19-pandemic
  • 蒙特利爾大學: COVID-19 圖像數據收集
    https://github.com/ieee8023/covid-chestxray-dataset
  • 美國國家生物技術信息中心病毒數據庫
    https://www.ncbi.nlm.nih.gov/labs/virus/vssi/#/virus?SeqType_s=Nucleotide&VirusLineage_ss=Severe%20acute%20respiratory%20syndrome%20coronavirus%202,%20taxid:2697049
  • COVID-19 開放研究數據集
    https://registry.opendata.aws/cord-19/
  • COVID-19 數據科學:韓國數據集
    https://github.com/ThisIsIsaac/Data-Science-for-COVID-19
  • 印度衛生和家庭福利部: COVID-19 印度
    https://www.mohfw.gov.in/
  • 民防部網址-冠狀病毒緊急情況
    https://github.com/pcm-dpc/COVID-19
  • COVID-19 印度尼西亞的數據科學
    https://www.kaggle.com/ardisragen/indonesia-coronavirus-cases
  • 凱撒健康:美國醫院 ICU 病床
    https://khn.org/news/as-coronavirus-spreads-widely-millions-of-older-americans-live-in-counties-with-no-icu-beds/#lookup
  • HealthData.org :美國醫院容量
    https://covid19.healthdata.org/united-states-of-america
  • 美國環保局:美國空氣質量
    https://aqs.epa.gov/aqsweb/documents/data_api.html
  • 美國人口普查局:人口數據
    https://data.census.gov/cedsci/
  • IEEE: COVID-19 Tweets 數據集
    https://ieee-dataport.org/open-access/corona-virus-covid-19-tweets-dataset
  • 華盛頓大學: COVID-19
    https://covid19.healthdata.org/united-states-of-america
  • 凱撒家庭基金會:社會距離政策
    https://www.kff.org/health-costs/issue-brief/state-data-and-policy-actions-to-address-coronavirus/#socialdistancing


新冠肺炎( COVID-19 )開放數據源


不久前,為了對抗蔓延全球的新冠肺炎疫情,幫助研究者、政策制定者、醫療工作者和普通民眾更深入地瞭解病毒和疫情,清華大學聯合中國工程科技知識中心、清華大學附屬北京長庚醫院、阿里巴巴智能計算實驗室、北京智源人工智能研究院數據開放研究中心、搜狗搜索、智譜.AI共同上線了“新冠肺炎( COVID-19 )開放數據源”


全球上百個新冠數據集各顯神通,讓你我都成為“半個流行病學家”

全球上百個新冠數據集各顯神通,讓你我都成為“半個流行病學家”


新冠肺炎( COVID-19 )開放數據源,自疫情發端即致力於收集來自世界各地各種類型的相關開放數據,並保持持續更新。數據源涵蓋流行病研究、知識、媒體和政策等多個領域,目前已收集 194 條開放數據源。


感興趣的“業餘流行病學家”們,可以複製網址(


https://www.aminer.cn/data-covid19/)或點擊文末閱讀原文,一鍵直達新冠肺炎( COVID-19 )開放數據源專題頁面。


參考資料:
https://www.zdnet.com/article/tableau-makes-johns-hopkins-coronavirus-data-available-for-the-rest-of-us/

https://www.zdnet.com/article/as-covid-19-data-sets-become-more-accessible-novel-coronavirus-pandemic-may-be-most-visualized-ever/


分享到:


相關文章: