做數據可視化,需要用到哪些知識與技術?

每日一發小視頻


作為一名十年經驗的諮詢顧問,做過的項目裡面多多少少涉及一些數據可視化的需求和知識;而且畢業於國內排名前10的某大學數學系,算是有一些還不錯的基礎。整理一下回答您的問題,供您參考。另外我的頭條號“數據圖每日看”會定時發佈一些數據可視化的案例和知識,歡迎關注。

這裡我會從:1.什麼是數據可視化、2.為什麼要做數據可視化、3.怎麼做數據可視化、4.高端進階路線、5.可視化技術與工具,一共五個方面來嘗試建立一共知識框架,針對性回答您的問題。

一、什麼是數據可視化

  • 我不喜歡複製粘貼定義,我的簡單表達就是:把(表格的行和列+繁瑣的數字)---變成---> (直觀的+形象的+一目瞭然的+容易理解的+好看的)平面圖或者立體圖,甚至是立體3D模型。

  • 來張截圖鎮下場。和有些人追求無限創新無限炫酷不同,我認為,可讀性>美觀性>創新性。

  • 還有個分類,我覺得也是合適的:數據可視化其實是個寬泛的定義,還可以分為“信息圖/數據圖”-“Infographic”和“可視化”-“Data Visualization”兩個方向,前者用於網站、期刊雜誌等媒體,有社會傳播需求;後者用於商業/政府數據分析,用於進行商業分析和決策支持。

二、為什麼要做數據可視化

  • 數據可視化的直接目的:精準而快速、簡單又全面地傳遞信息和知識。

  • 數據可視化的最終目的:數據可視化能夠加深和強化受眾對於數據的理解和記憶。

為什麼呢?因為可視化能將不可見的數據現象轉化為可見的圖形符號,能將錯綜複雜、看起來沒法解釋和關聯的數據,建立起聯繫和關聯,發現規律和特徵,獲得更有商業價值的洞見和價值。


三、怎麼做數據可視化

基本上,先不談高階的操作,只談基本的流水操作。

  • 首先說信息圖這類,這類偏設計,較為輕數據分析。可以說是設計/平面設計的延申子分類,和數據可視化的交叉子分類。怎麼做呢:

  • 1.搞清楚要做的可視化的材料和數據的結構(至少是邏輯結構,並列/因果……,以時間軸來看的(比如XX發展史和分析),以地區來看的(比如XX病各地發病率),以流程關係來看的(比如XX轉化率分析)。

  • 2.選擇風格,包括但不限於調色板、字體、圖標、標題等等,要從1)誰看,2)什麼場合看,什麼媒體傳播,3)用什麼設備看,手機和電腦不同,這三個方面來選擇風格。

-----------這些東西展開都能寫專題文章了,請關注我,我會在7月份一點點地寫出來。


  • 3.重新整理材料,用設計者的思維。
  • 4.選擇合適的圖表類型,參照下圖。對比圖?關係圖?分類分組圖?組合類型?妥妥的,如果對下圖有疑問,歡迎評論或私信我溝通交流(我會抽空做箇中文版,發佈到我的頭條號“數據圖每日看”,歡迎關注)。

  • 5.畫紙上草圖。理清楚邏輯。

  • 6.打開軟件開始畫圖了。一般都是Adobe全家桶、PowerPoint、Keynote、或者一些簡單的前端套件。


  • 對於真數據可視化這個比較複雜。
  • 因為更偏數據分析,商業分析和決策支持,所以做法會更靈活。但是也脫離不開以下內容:收集清洗數據、分析維度、搞清楚目的(現狀分析、原因/因果分析、預測模型)、然後建模、模型測試、洞察結論然後優化模型驗證、然後選擇合適的邏輯結構選擇合適的圖表、構建可視化圖表。甚至還有一些動態的BI模型,需要不斷的輸入輸出。這裡涉及到Excel、BI工具軟件、Python等等。

四、進階數據可視化

有一位專家和我提過,數據可視化是整個數據分析業務的最後一個環節。在數據可視化之前,我們需要對原始數據進行清洗處理,SQL是必備工具,數據處理之後才是分析和可視化。於是來了進階方向:商業智能BI與動態交互圖表。

所以,學好SQL,學商業智能BI工具和學習怎麼做動態交互圖表。


五、數據可視化工具推薦

這個東西入門不用數學專家,但是要成為專家,需要有數學思維。

工具不斷地有新的東西要學。

1.EChart、D3.js、Three.js;和開發語言R、Python;

2.數據報表類:Excel和SQL,日常的報表製作,更加易學實用;

3.可視化BI類:比如Tableau(剛剛被Salesforce收購了),更直接地針對業務分析。

另外我的頭條號“數據圖每日看”會定時發佈一些數據可視化的案例和知識,以及我認為不錯的材料推薦,歡迎關注。


分享到:


相關文章: