12個流行的Python數據可視化庫總結

總結了10個不同領域的 Python 數據可視化庫,有常用的,也有比較小眾的。

12個流行的Python數據可視化庫總結

1. matplotlib

matplotlib是Python數據可視化庫的OG。儘管它已有十多年的歷史,但仍然是Python社區中使用最廣泛的繪圖庫。它的設計與MATLAB非常相似,MATLAB是20世紀80年代開發的專有編程語言。

2. Seaborn

Seaborn利用matplotlib的強大功能,可以只用幾行代碼就創建漂亮的圖表。關鍵區別在於Seaborn的默認款式和調色板設計更加美觀和現代。由於Seaborn是在matplotlib之上構建的,因此還需要了解matplotlib以便調整Seaborn的默認值。

3. ggplot

ggplot基於ggplot2,一個 R 語言繪圖系統,以及The Grammar of Graphics的概念。ggplot的運行方式與matplotlib不同:它允許你對組件進行分層以創建完整的繪圖。例如,你可以從軸開始畫,然後添加點,然後是線、趨勢線等。雖然圖形語法被稱為繪圖的“直觀”方法,但經驗豐富的matplotlib用戶可能需要時間來適應這個新的方式。

4. Bokeh

與ggplot一樣,Bokeh同樣基於The Grammar of Graphics,但與ggplot不同的是,它是原生Python的,而不是從R語言移植過來的。它的優勢在於能夠創建交互式的網站圖,它可以很容易地輸出為JSON對象、HTML或交互式Web應用程序。Bokeh還支持流媒體和實時數據。

5. pygal

與Bokeh和Plotly一樣,pygal提供可以嵌入Web瀏覽器的交互式圖。它的主要區別在於能夠將圖表輸出為SVG格式。如果你使用較小的數據集,SVG格式的圖像就可以了。但是如果製作的圖表包含數十萬個數據點,它們就會很難渲染並變得反應遲鈍。

6. Plotly

你可能知道Plotly是一個數據可視化的在線平臺,但你是否也知道可以從Python筆記本使用它的功能?與Bokeh一樣,Plotly的強項正在製作交互式圖,但它提供了一些在大多數庫中沒有的圖表,如等高線圖,樹狀圖和3D圖表。

7. geoplotlib

geoplotlib是一個用於創建地圖和繪製地理數據的工具庫。可以使用它來創建各種地圖類型,例如等值線,熱圖和點密度貼圖。你必須安裝Pyglet(面向對象的編程接口)才能使用geoplotlib。儘管如此,由於大多數的Python數據可視化庫都沒有提供地圖類型,因此有一個專門的庫還是可以的。

8. Gleam

Gleam的靈感來自 R 語言的 Shiny 包。它允許你僅使用Python腳本就將分析結果轉換為交互式Web應用程序,因此你不必瞭解任何其他語言,如HTML,CSS或JavaScript。Gleam適用於任何Python數據可視化庫。創建繪圖後,你可以在它上面添加字段,以便用戶可以對數據進行篩選和排序。

9. missingno

處理缺失的數據是一件痛苦的事。missingno 允許你使用視覺摘要來快速評估數據集的完整性,而不是通過大篇幅的表格。你可以根據熱圖或樹形圖的完成度或點的相關度對數據進行過濾和排序。

10. Leather

就像Leather 的創造者克里斯托弗·格羅斯科普夫(Christopher Groskopf)說得:“Leather是Python圖表庫,適合那些現在需要圖表並且不關心它們是否完美的人。” 它適用於所有數據類型並生成圖表作為SVG,可以縮放它們而不會丟失圖像質量。由於這個庫相對較新,一些文檔仍在進行中。你可以製作非常基本的圖表 - 但這是就是您想要的。

11. Chartify

Chartify是一個可以使數據科學家輕鬆創建圖表的Python庫。

為什麼使用Chartify?

  1. 一致的輸入數據格式:花費更少的時間來轉換數據。所有繪圖功能都使用一致的整齊的數據格式。
  2. 智能默認樣式:創建一個漂亮的圖表,只需要很少的自定義變量。
  3. 簡單的API:使API儘可能直觀且易於學習。
  4. 靈活性:Chartify建立在Bokeh之上,如果需要更多的樣式,可以隨時使用Bokeh的API。

12. Altair

Altair是一個基於 Vega-lite 的聲明性統計(declarative statistical)可視化python庫。聲明意味著只需要提供數據列與編碼通道之間的鏈接,例如x軸,y軸,顏色等,其餘的繪圖細節它會自動處理。聲明使Altair變得簡單,友好和一致。使用Altair可以輕鬆設計出有效且美觀的可視化代碼。

12個流行的Python數據可視化庫總結


分享到:


相關文章: