小明愛王者
首先數據挖掘還是需要一些理論基礎。常見的算法如分類,迴歸,聚類等算法要熟悉,再深入了還有學習數學,尤其是線性代數(推薦國外翻譯的《線性代數及其應用》第五版 [美] 戴維 C.雷 / [美] 史蒂文 R.雷 / [美] 朱迪 J.麥克唐納 機械工業出版社,看過最好的線代書)。
理論基礎知識之外,要有實際落地的能力,用什麼軟件。
建模的分為商業版和開源免費版
1-商業版軟件
SPSS Moderler,
SAS EM挖掘模塊,
2-開源的挖掘軟件也有很多
1.Weka(需要java編程基礎),
2.當今最火的Python scikit-learn建模模塊(常3見算法都有)
3.RapidMiner
4.Knime(大而全的一個軟件,做ETL和數據挖掘都可以,學過Python挖掘模塊再看這個會感覺比較簡單,反過來更容易理解python 挖掘算法)
從另外一個角度來說,分為編程,和圖形化操作兩種方式,圖形化方式無需要編程逐一配置各個節點,連線即可搭建。
推薦你2個,Python scikit-learn建模模塊(編程方式),以及Knime(圖形化操作,非編程,下圖為knime操作界面)。本人剛開通頭條,準備逐步講解如何快速入門knime該軟件,歡迎關注和留言。