如何入門大數據(數據挖掘方面)?

小明愛王者


首先數據挖掘還是需要一些理論基礎。常見的算法如分類,迴歸,聚類等算法要熟悉,再深入了還有學習數學,尤其是線性代數(推薦國外翻譯的《線性代數及其應用》第五版 [美] 戴維 C.雷 / [美] 史蒂文 R.雷 / [美] 朱迪 J.麥克唐納 機械工業出版社,看過最好的線代書)。

理論基礎知識之外,要有實際落地的能力,用什麼軟件。

建模的分為商業版和開源免費版

1-商業版軟件

SPSS Moderler,

SAS EM挖掘模塊,

2-開源的挖掘軟件也有很多

1.Weka(需要java編程基礎),

2.當今最火的Python scikit-learn建模模塊(常3見算法都有)

3.RapidMiner

4.Knime(大而全的一個軟件,做ETL和數據挖掘都可以,學過Python挖掘模塊再看這個會感覺比較簡單,反過來更容易理解python 挖掘算法)

從另外一個角度來說,分為編程,和圖形化操作兩種方式,圖形化方式無需要編程逐一配置各個節點,連線即可搭建。

推薦你2個,Python scikit-learn建模模塊(編程方式),以及Knime(圖形化操作,非編程,下圖為knime操作界面)。本人剛開通頭條,準備逐步講解如何快速入門knime該軟件,歡迎關注和留言。



分享到:


相關文章: