據IDC預測,全球數據圈將從 2018 年的 33ZB 增至 2025 年的 175ZB。其中,中國數據圈增速最為迅速,2018 年,中國數據圈佔全球數據圈的23.4%,即 7.6ZB。預計到 2025 年將增至 48.6ZB,佔全球數據圈的 27.8%,中國將成為全球最大的數據圈。
然而人類處理分析數據的能力卻遠遠落後於所獲取的海量數據,近年來,數據的多維度、多來源、多態等特性更加提高了數據分析的難度,依靠傳統的工具已經越來越難滿足這些新的挑戰。
為了應對這些難題,數據可視化技術逐漸受到各行業的重視,比起表格以及簡單的傳統圖表,圖形符號以及其他基礎視覺元素更容易被人理解與接受,英文中有句俗語“A picture is worth a thousand words”,即“一圖勝千言”,一張與主題相關的圖片有時比起詳細的解釋,能夠更有效的描述有關主題。
受Mason Currey的著作《Daily Rituals》啟發,RJ Andrews繪製出了16名創作者(作曲家,畫家,作家,科學家,哲學家)在一天之內的生活創作軌跡,利用數據可視化方法,將一本書濃縮為一張簡單的圖表。
下圖是數據可視化案例中較為經典的:John Snow霍亂地圖。圖中的小條形圖標記出了倫敦每個家庭中死於霍亂的人數,旨在試圖查明這些地區的死亡率高於其他地區的原因。調查結果顯示:霍亂感染者人數最多的家庭所使用的飲用水均來自同一口水井。
它幫助人們認識到,霍亂疾病與受汙染的水井之間存在相關性,預防霍亂的辦法就是建立排汙系統並保護水井不受汙染。
數據可視化不僅可以真實還原複雜的數據集結構,例如將地理位置以及人數關係結合起來,甚至可以在其基礎上針對數據細節做出了進一步增強,幫助用戶理解系統中相關的信息。
可視化結果本身就能夠揭示問題的根本原因,還能啟發人們找到解決方案。
數據可視化的意義與全部工作不僅僅在於如何繪製出一張好看的圖表,在進行可視化項目之前,我們需要:
1)理解系統中相關的信息以及目標任務,例如本次數據可視化項目是為了怎樣的目標服務,需要在何時何地怎樣進行展示,讀者基本情況以及顯示硬件設備參數等也是不可或缺的關鍵信息。
附:設計師可能還需要進行實地設備考察,進行下一步設計。
2)與專業人員溝通並確定數據與視覺元素之間的映射關係,例如將生產數據映射為柱狀圖的長度(數據之間進行比較)還是餅狀圖的面積大小(數據之間的佔比關係)。
3)與設計師討論並確定可視化的視覺特點,便於他們提供設計稿,以確認最終的屏幕呈現效果。此外,如果該項目包含的頁面較多,還需要與設計師確認各頁面之間以及頁面中組件的交互方式。
下圖列出了可視化項目中詳細的11個步驟,右側詳細列出了每個階段用戶以及交付團隊需要提供的文檔,便於雙方的溝通。
一個優秀的統計圖標需要在傳達複雜信息的同時保證:清晰、準確以及高效。
數據可視化展示圖像應當:
1)展示數據內容;
1)Show the data
2)引導讀者去思考項目主旨,而非實現方式、設計或是技術等無關細節;
2)Make the viewer think about the substance (not the methods/design/technology)
3)避免扭曲數據,展示錯誤事實
3)Avoid distorting the data
4)在較小的空間內展示大量數據
4)Present many numbers in a small space
5)保證大數據集之間的相關性
5)Make large datasets coherent
6)引導用戶比較不同的數據
6)Encourage the eye to compare different pieces of data
7)從不同層級來揭示數據結構
7)Reveal data structure at different levels
8)服務於相同的明確目標:描述、探索、製表或是裝飾
8)Serve a clear purpose: description, exploration, tabulation, decoration
最後,將上面的標準抽象出來,一份優秀的可視化設計則應該滿足以下3項標準:
在一個數據可視化項目實施過程中,保證及時的溝通,避免項目的多次返工是保證實施過程順利進行的重要條件,瞭解自己的數據特點與項目目標也是保證最後獲得理想效果的必要前提。
轉載自IOT【根雲視界】