好書推薦|利用Python進行數據分析(附PDF及源碼下載)

好書推薦|利用Python進行數據分析(附PDF及源碼下載)

本書提供一份關於在Python下操作、處理、清洗、規整數據集的完整說明。本書第二版針對Python 3.6進行了更新,並增加實際案例向你展示如何高效地解決一系列數據分析問題。你將在閱讀過程中學習到新版本的pandas、NumPy、IPython和Jupyter。 本書由Wes McKinney創作,他是Python pandas項目的創始人。

—文末附本書PDF下載地址—

本書簡介

本書是對Python數據科學工具的實操化、現代化的介紹,非常適合剛學Python的數據分析師或剛學數據科學以及科學計算的Python編程者。數據文件和相關的材料可以在GitHub上找到:

使用IPython shell和Jupyter notebook進行探索性計算

學習NumPy(Numerical Python)的基礎和高級特性

入門pandas庫中的數據分析工具

使用靈活工具對數據進行載入、清洗、變換、合併和重塑

使用matplotlib創建富含信息的可視化

將pandas的groupby功能應用於對數據集的切片、分塊和彙總

分析並操作規則和不規則的時間序列數據

利用完整的、詳細的示例學習如何解決現實中數據分析問題

本書目錄

前言

第1章 準備工作

1.1 本書內容

1.2 為何利用Python進行數據分析

1.3 重要的Python庫

1.4 安裝與設置

1.5 社區和會議

1.6 快速瀏覽本書

第2章 Python語言基礎、IPython及Jupyter notebook

2.1 Python解釋器

2.2 IPython基礎

2.3 Python語言基礎

第3章 內建數據結構、函數及文件

3.1 數據結構和序列

3.2 函數

3.3 文件與操作系統

3.4 本章小結

第4章 NumPy基礎:數組與向量化計算

4.1 NumPy ndarray:多維數組對象

4.2 通用函數:快速的逐元素數組函數

4.3 使用數組進行面向數組編程

4.4 使用數組進行文件輸入和輸出

4.5 線性代數

4.6 偽隨機數生成

4.7 示例:隨機漫步

4.8 本章小結

第5章 pandas入門

5.1 pandas數據結構介紹

5.2 基本功能

5.3 描述性統計的概述與計算

5.4 本章小結

第6章 數據載入、存儲及文件格式

6.1 文本格式數據的讀寫

6.2 二進制格式

6.3 與Web API交互

6.4 與數據庫交互

6.5 本章小結

第7章 數據清洗與準備

7.1 處理缺失值

7.2 數據轉換

7.3 字符串操作

7.4 本章小結

第8章 數據規整:連接、聯合與重塑

8.1 分層索引

8.2 聯合與合併數據集

8.3 重塑和透視

8.4 本章小結

第9章 繪圖與可視化

9.1 簡明matplotlib API入門

9.2 使用pandas和seaborn繪圖

9.3 其他Python可視化工具

9.4 本章小結

第10章 數據聚合與分組操作

10.1 GroupBy機制

10.2 數據聚合

10.3 應用:通用拆分-應用-聯合

10.4 數據透視表與交叉表

10.5 本章小結

第11章 時間序列

11.1 日期和時間數據的類型及工具

11.2 時間序列基礎

11.3 日期範圍、頻率和移位

11.4 時區處理

11.5 時間區間和區間算術

11.6 重新採樣與頻率轉換

11.7 移動窗口函數

11.8 本章小結

第12章 高階pandas

12.1 分類數據

12.2 高階GroupBy應用

12.3 方法鏈技術

12.4 本章小結

第13章 Python建模庫介紹

13.1 pandas與建模代碼的結合

13.2 使用Patsy創建模型描述

13.3 statsmodels介紹

13.4 scikit-learn介紹

13.5 繼續你的教育

第14章 數據分析示例

14.1 從Bitly獲取1.USA.gov數據

14.2 MovieLens 1M數據集

14.3 美國1880~2010年的嬰兒名字

14.4 美國農業部食品數據庫

14.5 2012年聯邦選舉委員會數據庫

14.6 本章小結

附錄A 高階NumPy

附錄B 更多IPython系統相關內容

後臺私信回覆關鍵字“pyda”即可獲得本文書籍PDF版本。

注:本資料來源互聯網,版權歸該資源的合法擁有者所有。

—完—

關注微信公眾平臺“智慧坊”(微信號:intelliworkshop),獲取更多原創文章及優質內容。


分享到:


相關文章: