如何入门大数据(数据挖掘方面)?

小明爱王者


首先数据挖掘还是需要一些理论基础。常见的算法如分类,回归,聚类等算法要熟悉,再深入了还有学习数学,尤其是线性代数(推荐国外翻译的《线性代数及其应用》第五版 [美] 戴维 C.雷 / [美] 史蒂文 R.雷 / [美] 朱迪 J.麦克唐纳 机械工业出版社,看过最好的线代书)。

理论基础知识之外,要有实际落地的能力,用什么软件。

建模的分为商业版和开源免费版

1-商业版软件

SPSS Moderler,

SAS EM挖掘模块,

2-开源的挖掘软件也有很多

1.Weka(需要java编程基础),

2.当今最火的Python scikit-learn建模模块(常3见算法都有)

3.RapidMiner

4.Knime(大而全的一个软件,做ETL和数据挖掘都可以,学过Python挖掘模块再看这个会感觉比较简单,反过来更容易理解python 挖掘算法)

从另外一个角度来说,分为编程,和图形化操作两种方式,图形化方式无需要编程逐一配置各个节点,连线即可搭建。

推荐你2个,Python scikit-learn建模模块(编程方式),以及Knime(图形化操作,非编程,下图为knime操作界面)。本人刚开通头条,准备逐步讲解如何快速入门knime该软件,欢迎关注和留言。



分享到:


相關文章: