盘点大数据十大经典工具,学会用这些大数据就入门了

大数据因其强大的数据分析功能而受到市场热捧,互联网的发展迫使企业纷纷将目光集中在大数据,通过对大数据的分析开发市场刚需产品,并获得大量用户。大数据入门首先要学会使用工具,今天小鸟就来给大家介绍常用的十大大数据所用工具的详细介绍。

盘点大数据十大经典工具,学会用这些大数据就入门了

1.Talend Open Studio

这是第一家针对数据集成工具市场的开源软件供应商,学习大数据多多少少得了解这个工具。从Talend的下载量来看,它的下载次数以超过2000万人次,功能方面也是毋庸置疑。它的开源软件提供了数据整合功能。其用户包括美国国际集团(AIG)、康卡斯特、电子港湾、通用电气、三星、Ticketmaster和韦里逊等企业组织。

2、DYSON

这是由探码科技自主研发的DYSON智能分析系统,它的功能非常强大,不仅可以完整的实现大数据的采集、分析、处理。DYSON智能分析系统专业针对互联网数据抓取、处理、分析,挖掘,而且也能非常灵活迅速地抓取网页上散乱分布的信息,并通过强大的处理功能,准确挖掘出所需数据,是目前使用人数最多的网页采集工具.

3、YARN

这个工具出现较晚,可以说是一种新的Hadoop资源管理器,它的功能主要是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度,解决了旧MapReduce框架的性能瓶颈。它的基本思想是把资源管理和作业调度/监控的功能分割到单独的守护进程。

盘点大数据十大经典工具,学会用这些大数据就入门了

4、Mesos

此款工具是开源群集管理软件,是由加州大学伯克利分校的AMPLab最先开发的,支持Hadoop、ElasticSearch、Spark、Storm和Kafka等架构。对数据中心而言它就像一个单一的资源池,从物理或虚拟机器中抽离了CPU,内存,存储以及其它计算资源,很容易建立和有效运行具备容错性和弹性的分布式系统。

5、Datale

由探码科技研发的一款基于Hadoop的大数据平台开发套件,RAI大数据应用平台架构。

6、Lustre

一个大规模的、安全可靠的、具备高可用性的集群文件系统,它是由SUN公司开发和维护的。该项目主要的目的就是开发下一代的集群文件系统,目前可以支持超过10000个节点,数以PB的数据存储量。

盘点大数据十大经典工具,学会用这些大数据就入门了

7、Ambari

作为Hadoop生态系统的一部分,提供了基于Web的直观界面,可用于配置、管理和监控Hadoop集群。目前已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、Hbase、Zookeper、Sqoop和Hcatalog等。

8、Thrift

在2007年facebook提交Apache基金会将Thrift作为一个开源项目,对于当时的facebook来说创造thrift是为了解决facebook系统中各系统间大数据量的传输通信以及系统之间语言环境不同需要跨平台的特性。

9、ZooKeeper

一个分布式的应用程序协调服务,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的工具,让Hadoop集群里面的节点可以彼此协调。ZooKeeper现在已经成为了Apache的顶级项目,为分布式系统提供了高效可靠且易于使用的协同服务。

10、Chukwa

监测大型分布式系统的一个开源数据采集系统,建立在HDFS/MapReduce框架之上并继承了Hadoop的可伸缩性和可靠性,可以收集来自大型分布式系统的数据,用于监控。它还包括灵活而强大的显示工具用于监控、分析结果。

盘点大数据十大经典工具,学会用这些大数据就入门了

想要了解更多大数据工具,关注小鸟,后续会持续更新大数据相关工具、案例等干货分享。当然若是你有更多的疑问或者想法,也欢迎私信小鸟一起讨论,学无止境,大家一起共同努力。


分享到:


相關文章: