想入门大数据,不知道怎么开始,大数据学习的路线图是什么?

ShenZhen之围


随着互联网科技的迅速发展,传统的数据分析技术已无法满足新时代以TB为单位的大量数据处理需求。由此衍生出了一系列针对不同类型的海量数据的处理技术,比如:有监督数据挖掘算法和无监督数据挖掘算法。那么针对看起来讳莫如深的大数据,我们应该怎样学习呢?这里我想介绍下我的一些经验:

一、要学“大数据”,先学“小数据”

很多同学在学习大数据的时候,有一个误区,那就是一上来就钻研各种高深的数据挖掘算法。其实对于零基础的人来讲,这些算法单单是其原理就已能够令人望而却步,更遑论其算法实现。所以我们不妨放下“身段”,先从基本的统计学,多元统计分析等基础的数据分析开始。这里推荐两本书:

1、《统计学》 中国人民大学出版社

2、《多元统计分析》 中国人民大学出版社

以上两本书需要熟练掌握因为书中所介绍的可以说是数据分析中最基础也是最重要的概念,尤其是多元统计中的回归算法,此算法可以说是数据挖掘中逻辑回归以及时间序列的基础。建议把书中的课后题也都做了,加深对相关概念的理解。

二、学习数据挖掘的基本概念

这里也给推荐几本书:

1、《数据挖掘导论》人民邮电出版社

2、《数据挖掘概念与技术》机械工业出版社

这两本书可以说是对数据挖掘理论技术的全看介绍,《数据挖掘导论》偏重于原理介绍,《数据挖掘概念与技术》则偏重于技术实现方法介绍。如果能把这两本书学会学透我相信对大数据分析而言,理论方面已经可以说是准备的非常充分了。

三、纸上得来终觉浅,绝知此事要躬行

理论知识掌握的再好也不过是纸上谈兵,我们的目标是要落实到一个一个的项目上来。

这里也给推荐几本书,书的内容是对时下比较流行的数据挖掘软件的介绍。

1、《SPSS Modeler+Weka数据挖掘从入门到实战》 电子工业出版社

2、《数据处理的SPSS和SAS EG实现》电子工业出版社

以上两本书主要介绍了时下最流行的个人数据挖掘工具SPSS和企业级数据挖掘工具SAS EG。内附多种案例供读者练手,是非常适合数据挖掘新手的实操指导书。

总结

大数据技术除了上面介绍过的数据挖掘之外,也包含技术环境的搭建,挖掘工具的使用及个性化开发等很多方面,这是一个范围很广的概念,作为新兴领域总有很多机遇等待我们去把握,同时也需要我们付出更多的努力来把握机遇。希望我的答复能对你有所帮助。


分享到:


相關文章: