如何学习“大数据”方面的知识?

用户8328945825930


大数据这个名词对于圈子里的同行是非常熟悉的,都知道大数据是个很牛逼的代名词,首先大数据的概念是指在一定时间范围内用常规软件工具进行捕捉,管理和处理的数据集合,是需要新处理模式才能具有更强的决策力,洞察发现力和流程优化能力的海量,高增长率和多样化的信息资产。大数据解释起来是这么回事,可能外行人听起来丈二和尚摸不着头脑,那么就需要自己多花时间去补充这方面的知识,要了解和学习一门技术,就得把这门技术的前和后都了解清楚,基于我个人的观点,对于大数据的学习,最基本的大数据组件Hadoop+Spark这个是必须掌握的基础,后面延伸的Hive,HBase等组件,尽然是对数据的处理,那么就少不了和数据库打交道,Sql语句那就是最基本的数据库语言,对于这类都是高级编程语言,那么还要掌握一门编程语言,目前市面上都是推荐Java和Python,如果是我推荐的话,偏向于Python,这个是针对零基础的朋友,关于Python我这里不多加介绍了,对于大数据技术的学习上面只是介绍了几个必学的组件,学起来肯定是困难的,学成之后就会封神了,哈哈!在学习过程中一定要沉静下心来学习,不能浮躁,多问多实操!理论基础要扎实然后结合项目来实战自己所掌握的理论,相辅相成,一定会有成。




虫师的成长之路


大数据如何学习

  一、基础知识学习:

  1、如果您此前对于数据库等方面的知识没有涉及,在学习大数据之前,建议先掌握基本的数据库知识,例如目前流行的关系型数据库管理系统MySQL, 非关系型数据库MongoDB,开源、支持网络、基于内存、键值对存储数据库Redis等相关的知识;

  2、Java 是目前使用最为广泛的编程语言,它具有的众多特性,特别适合作为大数据应用的开发语言。由于Java目前有不同的方向,如果是关于大数据方面可以着重学习标准版JavaSE;

  3、能够熟练掌握Linux系统,由于大数据相关的软件都是在Linux上运行,因此能够熟练使用Linux系统对大数据相关软件的操作相当重要,也能够对后面学习理解hadoop、HBase等大数据的软件的运行原理;

二、Scala基础:

Scala 是一种多范式的编程语言,其设计的初衷是要集成面向对象编程和函数式编程的各种特性。由于 Scala 运行于 Java 平台(Java 虚拟机),并兼容现有的Java 程序,所以 Scala 可以和大数据相关的基于 JVM 的系统很好的集成;

三、Hadoop技术模块;

Hadoop是一款支持数据密集型分布式应用并以 Apache 2.0 许可协议发布的开源软件框架,它能搭建大型数据仓库,PB 级别数据的存储、处理、分析、统计等业务。它拥有高容错率的特点,设计是用来部署在低廉硬件上;这个平台目前已经成为了大数据的代名词,通过对Hadoop的学习就能够明白并使用大数据;

四、Spark技术模块;

Spark 和 Hadoop 都是大数据框架。Hadoop 提供了 Spark 所没有的功能特性,比如分布式文件系统,而 Spark 为需要它的那些数据集提供了实时内存处理。所以学习 Spark 也非常必要;

五、大数据项目实战;

在经过以上的学习之后,需要进行大数据项目的实践,通过进行建模、分析和运算最终将学到的知识用于实践当中;

以上就是关于大数据如何学习的解答,希望可以帮助到大家




分享到:


相關文章: