今天,在GitHub上偶然看到了Kailash Ahirwar作者的一個項目cheatsheets-ai,該項目包含了從不同渠道收集的數十張速查表,涉及到大數據分析、機器學習和深度學習等領域,包括數據科學相關庫Pandas、PySpark等,機器學習相關庫Scikit-learn等,以及深度學習相關庫TensorFlow等,非常適用於初學者。還等什麼,趕快拿去用吧。
1. 數據科學庫速查表
1. 1 Numpy
Numpy 作為Python科學計算核心庫之一,能夠創建高性能多維數組對象Array,並提供了處理數組的相關工具。
1.2 Pandas
Pandas是基於Numpy的數據分析庫,提供了python編程語言的數據結構和數據分析工具。
1.3 Scipy
Scipy也是基於Numpy的擴展包,包含一些Python語言的數學算法和便捷方程,是科學計算核心庫之一。
1.4 PySpark/PySpark-RDD/PySparkSQL
PySpark、PySpark-RDD與PySparkSQL是 Spark 為 Python 開發者提供的 API,是大數據內存計算的常用框架之一。
2. 數據可視化庫速查表
2.1 Matplotlib
Matplotlib是python的2D繪製圖庫,它以各種硬拷貝格式和跨平臺的交互式環境生成出版質量級別的圖形。
2.2 ggplot2
基於圖形語法的ggplot2核心理念是把是每張圖片拆解為一個數據集、一套可以展示數據點的視覺系統和一個座標系。
3. 機器學習庫速查表
3.1 Scikit-learn
Scikit-learn是python的一個用統一接口進行機器學習預處理、交叉驗證和可視化算法的開源庫。
4. 深度學習庫速查表
4.1 TensorFlow
作為深度學習領域最流行的框架,並不需要什麼介紹。
4.2 Karas
Karas是Theano和TensorFlow平臺上一款強大易用的深度學習庫。
4.3 Neural Networks Zoo
神經網絡結構盤點。
更多詳細內容,大家可以查詢原項目。
項目地址:https://github.com/kailashahirwar/cheatsheets-ai
閱讀更多 初沏的茶 的文章