數據分析系列 19/32

數據分析系列 19/32 | 數據可視化初探

俗話說得好,一圖勝千言。數據可視化是數據科學中的一個重要部分。創建可視化很簡單,但是創建優秀的可視化很難。數據可視化有兩種主要用途:探索數據和交流數據。


數據分析系列 19/32 | 數據可視化初探

PART

01

數據可視化


現在有很多工具都可以用來可視化數據,比如我們常用的Excel,還有數據科學另一門重要的語言R,以及百度的Echarts等可視化工具。

說到這裡,說一個經典的可視化案例:俄法戰爭

數據分析系列 19/32 | 數據可視化初探

1969年,Charles Minard做了一張圖表,是1812年拿破崙率軍攻佔莫斯科的行軍圖,顯示了軍隊規模的縮減。在頂端較粗的線代表了從波蘭到莫斯科的行軍規模變化。


下方的細深色線則代表了撤退時的軍隊規模。線條的寬度代表了軍隊的規模,從400000大軍縮減到了10000。底部線條是溫度和時間刻度,而整個圖形分佈展示了行軍距離。


簡單來說,數據可視化就是用圖形描繪信息。

數據可視化是一種以圖形描繪密集和複雜信息的表現形式。數據可視化的視覺效果旨在使數據容易對比,並用它來講故事,以此來幫助用戶做出決策。

數據可視化可以表達不同類型和規模的數據,包括從幾個數據點到有大量變量的數據集。

  • 準確的:優先考慮數據的準確性、清晰度和完整性,以不會曲解信息的方式呈現信息。
  • 有助於理解:幫助用戶做比較、對比分析等。
  • 擴展性要好:對於不同的用戶群體、設備等可調整展示內容和形式。


數據分析系列 19/32 | 數據可視化初探

PART

02

數據可視化的分類


數據可視化可以以不同的形式表達。圖表是表達數據的常用方式,因為它們能夠展示和對比多種不同的數據。
圖表類型的選擇主要取決於兩點:要表現的數據和表現該數據的用意。本文描述各種類型的圖表及其用例。

1. 隨時間變化

隨時間變化的圖表顯示一段時間的數據,例如多個類別之間的趨勢或比較。

常見用例包括:股價表現、衛生統計、年表。

適合的圖表有以下幾種:

數據分析系列 19/32 | 數據可視化初探

2. 類別比較

類別比較圖表是多個不同類別數據之間的比較。

常見用例包括:不同國家的收入、熱門場地時間、團隊分配。

數據分析系列 19/32 | 數據可視化初探


3. 排名

排名圖表顯示項目在有序列表中的位置。

常見用例包括:選舉結果、性能統計。

數據分析系列 19/32 | 數據可視化初探


4. 佔比

佔比類圖表顯示了局部與整體的關係。

常見用例包括:產品類別的綜合收入、預算。

數據分析系列 19/32 | 數據可視化初探


5. 關聯

關聯類圖表顯示兩個或以上變量之間的關係。

常見用例包括:收入和預期壽命。

數據分析系列 19/32 | 數據可視化初探


6. 分佈

分佈類圖表顯示每個值在數據集中出現的頻率。

常見用例包括:人口分佈、收入分佈。

數據分析系列 19/32 | 數據可視化初探


7. 流程

流程類圖表顯示了多個狀態之間的數據移動。

常見用例包括:資金轉移、投票計數和選舉結果。

數據分析系列 19/32 | 數據可視化初探


8. 關係

關係圖表顯示多個項目之間的關係。

常見用例包括:社交網絡、詞圖。

數據分析系列 19/32 | 數據可視化初探

面對多種類型的圖表,我們該怎麼選擇和使用呢,後面我們會繼續拆分並詳細描述。


數據分析系列 19/32 | 數據可視化初探


分享到:


相關文章: