一、什麼是數據可視化?
從專業的角度上來講,數據可視化是一個屬於計算機方面的學科,多用於數據分析與預測方面。
當然,要是這樣解釋,就太。空。乏。了。
舉個栗子,我們無時無刻產生都在產生大量數據;
比如我們的住址,起床時間、年齡、身高、體重,早飯吃的什麼,晚飯吃的什麼。
假如這些數據被一個統一的儀器收集起來,存在一個文檔裡面。
因為單位不同,數據格式不同,使用的場景不同,導致收集起來的數據凌亂沒有任何規律;
是沒有任何關聯,所以沒有任何的價值。
而這個時候,我們需要通過一些工具去將這些凌亂的數據進行一些整理。
比方說,藉助一個工具,我們可以在凌亂的數據庫中,分別將住址,起床時間,提取出來列成一個單獨的規範的數據表。
這個數據再通過一些簡單的分析,我們可以得出一個結果「你家小區住戶的平均起床時間分佈」。
這個結果有價值麼?顯然這對小區門口的早餐包子店鋪非常有價值。
但是因為小店老闆的文化水平有限,呈現出的結果報表維度太多,他看不懂啊。。。
這個時候就需要通過一些圖示化的手段,提取出最重要的幾個數據維度「起床時間」「人群」「區域」做一個小店老闆能夠輕鬆看懂的的「數據報表」。
以上就是一個完整的數據可視化的過程。
在專業的術語裡面
利用手段,收集數據,這個步驟叫做「數據收集」
將凌亂的數據整理成規範的文檔,這個步驟,叫做「數據清洗」
而精簡維度,用可視化的手段做出一個人人都能看懂的報表的過程,這個步驟,叫做「視覺化呈現」
「數據收集」+「數據清洗」+「視覺化呈現」叫做「數據可視化」
以上每個步驟,都離不開專業的公司和專業的工具。
但千萬別把數據可視化想的太難,其實無非就是幫助理解,甚至狹義講起來,你就認為是「用圖表展現數據」就行了。
但是,為什麼數據可視化又能成為一名專業的學科呢?因為需要考量的因素太多了。
首先是數據量
正常人可以用常用的圖表類型展現幾組,幾十組,幾百組,甚至勉勉強強幾千組數據。
但是假如數據到達了十萬,百萬,千萬,乃至過億級呢?另外是多方面的複雜因素纏繞,導致無法回到需求本身;
又一個非常典型的栗子,倫敦地鐵線路圖演變史;
按照傳統的地圖思路,設計師應該將線路圖和實際地理位置對應準確。
結果這樣基於實際的線路圖卻複雜到讓整個倫敦絕望了。
實際的站臺地理距離有長有短,方位差距過遠,整個地圖在地鐵線路多的市區,站點過多,在線路圖上顯得非常擁擠不堪無法看清文字,而郊區位置則是大量鬆散的留白;
直到1926年,Fred Stingemore 去掉了背景繁雜的地圖,調整了每個站臺點的地圖上的距離,讓線路和實際有所偏差,才讓整個線路圖得到了改善。
但是這樣的地圖依舊不夠均勻,線路交集較多的區域,繁雜的站點還是在線路圖中顯得過於擁擠;
直到1931年,Harry Back 的線路圖徹底脫離了真實地理的侷限,讓地鐵線路圖呈現水平,垂直和對角線延伸,才讓現代的地鐵線路圖得以出現;
就這麼10條地鐵線路圖,倫敦足足花了10年才設計出一個滿意的結果。更何況現今爆炸的數據時代?
但複雜的領域,不是我們要討論的重點,我們來說些有意思的。
在數據可視化中,視覺化呈現是最有意思的一個部分。
@Anna Vital 在信息圖工具adioma上有一篇文章,講的是視覺化的思考。
裡面提出了一個非常有意思的觀點:可視化好壞的判斷標準,是指能否方便理解。
而在視覺化呈現的時候,如果使用相似,類比的事物則更容易進行讀者理解。
@Anna Vital 做了一個理解梯度,從上往下,愈發容易人們方便理解。
我們一般使用的普通圖表,餅圖,折線圖,柱狀圖,是簡單的抽象圖表範疇。
而像漏斗圖,儀表盤,天平等則屬於抽象類比的範疇,看起來像是現實中存在,但是被簡化和抽象的事物。
像冰山圖,鐘錶圖,洋蔥圖等則已經是屬於真實的類比,看起來就像是我們平時能夠接觸到的事物。
而食物鏈,馬拉松,進化這種是屬於本身就已經自帶含義的寓言試圖表,本身就會帶上比如時間,高度,地域等自帶的維度。
從這篇文章中,我們可以看出來,其實可視化程度越高,就越靠近人類最熟悉的事物。
美帝的一位萌萌噠的妹子 @lisacrast 做了一個實驗——她想用氣泡圖統計2015年187個國家的人均GDP和人口;她使用了12種不同的數據可視化工具,來呈現這個圖表。其中有,Processing、D3.js、RAW 之類專業的代碼數據可視化工具。
也有 TEABLEAU、Lyra 之類的專業桌面數據可視化產品
也有 EXCEL、Google表格 之類的我們常見的辦公數據處理工具。
甚至還閒著蛋疼的用到了 AI 這個專業的設計軟件。
最終,雖然軟件的使用難度和具體的操作方式都不一樣,但是最終都能夠得到想要的結果。
這也就說明了,數據可視化別看它很高冷,其實只要掌握對了工具,想怎麼玩弄它,就能怎麼玩弄它。
接下來,我們來看一些比較風騷的。。
二、有意思的數據可視化案例
1. 全球氣象洋流圖
這是一個實時更新,能夠用來展示全球當前氣候的數據可視化案例,一共提供了9種不同的查看模式;
只要在左下角簡單配置一下,就可以展示的內容包括,海洋,化學汙染物和顆粒物;
雖然,你們應該只認識一個PM2.5。
2.三維地球
一個能夠自轉的三維地球,從地形到紋理,做的都非常精緻;
恩,地理課可以用來裝裝逼。
3.磁性顆粒
提供了紅綠兩個帶有磁性的點,綠色的小點用來讓粒子交匯,而紅色的小點用來讓粒子避開;
4.音樂像素
這不是一般的立體像素,這是一個自帶BGM的立體像素,而且會跟著節奏跳動。
5.開普敦計程車車流量
運用了三維效果配上光亮線段來實時展現開普敦計程車流量的數據可視化。
你問他用處?
恩。。。總之。。
看起來挺酷的吧。。。
有了小汽車,那當然會有小灰機。
6.航空公司線路圖
我們在左上角選擇不同的航空公司,地圖上會用紫色的發光線段來展現選中的航空公司的線路;
三、還有哪些數據可視化的大殺器
1.圖表秀
這是一款致力於通過簡單幾步就能製作出炒雞美觀圖表的工具網站。
我們只要在EXCEL中羅列好具體的數據,然後上傳到圖表秀中,就能夠一鍵生成漂亮的圖表!
圖表秀還自帶了一系列非常漂亮美觀的模板!
畫風是這樣的:
一共提供了包括儀表圖,地圖在內25種圖表。選擇圖表之後,可以點擊參數調整對顏色,格式,文字格式等進行調整
3.FineBI
這個也是推薦了很多次的自助式BI工具,集數據連接、數據清洗、數據分析、可視化展示一體。具有豐富的數據可視化圖表。
連接好數據源,識別表中數據字段,拖拽即可實現!
數據大屏報表
4.EXCEL
EXCEL中,有兩個讓人驚嚇的可視化神器。
4.1 POWERVIEW
4.2 POWERMAP
能夠生成三維地圖!
這也是重複了好多遍的功能介紹。
雖然,以上推薦的工具都很酷炫;
但,以上的幾種工具要麼太難,或者都偏向於圖表,僅僅侷限於一個工作場景;
然而數據可視化使用的場景很多,其實更多需要一個多方面小能手。
閱讀更多 數據分析不是個事兒 的文章