數據之美——Python數據可視化(1)

數據可視化就是使用圖形圖表等方式來呈現數據,圖形圖表能夠高效清晰地表達數據包含的信息。數據可視化在各個領域都得到了廣泛的應用,例如,產品銷售數據的可視化,統計樣本數據可視化,機器學習數據可視化等。因此,掌握一些數據可視化的技能是非常有必要的。

在這篇文章中我們會簡單的介紹一下基於Python的數據可視化。Python有很多非常優秀易用的數據可視化的庫,作為入門文章我們這裡使用Python的matplotlib,事實上Python中很多可視化庫都是基於matplotlib開發的,例如pandas等。下面我們將使用幾種不同數據圖表來講解基於matplotlib的數據可視化。

線段圖

線條圖適合用來呈現基於時間序列或有固定間隔的序列數據。橫軸表示時間或者間隔,而縱軸則表示對應的數值。例如,店鋪每天的銷售額,旅遊景點每天遊客接待量等。現在假設我們有某個店鋪最近一年的的銷售額數據,使用線段圖可以非常直接的呈現出來。

代碼和線圖圖如下:

數據之美——Python數據可視化(1)

數據之美——Python數據可視化(1)

條形圖

條形圖主要是用來將數據分類顯示,橫軸表示數據的類型,而縱軸則表示對應類型的數值。例如,我們有5種不同類型產品的銷售量,利用條形圖我們可以非常方便的把數據呈現出來。

數據之美——Python數據可視化(1)

數據之美——Python數據可視化(1)

柱狀圖

柱狀圖,也叫直方圖,通常用來呈現變量的分佈。它將數據按照一定的區間分組,而縱軸表示位於這一區間數據的個數。例如,下面我們生成一組正態分佈的隨機數據,柱狀圖按照一定的區間分組數據,並統計位於各個區間的數據量。

數據之美——Python數據可視化(1)

數據之美——Python數據可視化(1)

箱線圖

箱線圖用來顯示一組數據的分散情況。在箱線圖中,數據集的50%被一個矩形覆蓋,既矩形的底邊位於數據集的25%處,矩形的頂邊位於數據集的75%處;在矩形中心既數據集50%處有一條橫線;矩形頂邊和底邊差值的1.5倍稱為IRQ值,離矩形底邊和頂邊IRQ處分別畫一條稱為邊緣的線。所有位於邊緣線以外的數據點稱為異常點。

下面我們隨機的生成三組數據,並使用箱線圖呈現每組數據的分散情況。

數據之美——Python數據可視化(1)

數據之美——Python數據可視化(1)

散點圖

散點圖是數據在直角座標系平面的分佈圖。散點圖是非常有用的的顯示兩組變量之間的關係。例如身高和體重之間的關係,產品價格與銷量之間的關係等。

下面的代碼中,我們隨機的生成1000組數據,然後使用散點圖呈現出來。

數據之美——Python數據可視化(1)

數據之美——Python數據可視化(1)

最後

這篇文章裡我們簡單的討論瞭如何使用matplotlib繪製條形圖和柱狀圖等基本的圖表,後續文章中我們介紹更多的python可視化庫和一些更復雜的繪圖。

往期文章:


分享到:


相關文章: