学习大数据是应该先学Python,还是先学JAVA?

李淑洲

大数据现在很火,但是要进入这个领域还是有门槛的,而且还不小。如果你真的准备进入大数据,那么就要做好心理准备,没有基础的前提下,学习有一定难度。

大数据是什么

目前国内很多人在说大数据的时候,实际上是把大数据技术和数据科学(含数据分析、数据挖掘、机器学习)混在一起的。

数据科学侧重数学抽象和软件工具的使用,对数学和编程要求较高;而大数据技术侧重软件工程实施,对计算机和编程要求较高。

虽然两个方向都强调编程,但数据科学的编程是泛编程,可以简单理解为以使用脚本语言或需要编程的软件工具(如Matlab、SAS、R)。

而大数据技术的讲的编程是计算机通用编程语言(如Java/C/Python),职位也更接近我们所说的程序员或者说“码农”。

题主的这个问题,涉及的就是大数据技术方面。

大数据技术发展方向

大数据技术的发展方向有:大数据分析师、数据开发工程师、数据挖掘工程师等。

大数据分析师:偏SQL,当然也会经常用到一些脚本语言进行数据加工等等,其中Python就经常用到,而Java很少会用到。

数据开发工程师:属于硬件开发类,因为大数据框架大多都是基于Java,因此这也是这里流行Java的原因。

大数据挖掘:在传统的数据挖掘上,Pythom占尽优势。但是在分布式模式下,Python其实也是有一定局限性的。

Java和Python怎么选

其实大数据不管是数据开发也好、还是数据挖掘也罢,最重要的还是我们自己选择的一个方向,你定位的方向是什么,不要因为好学和不好学而去学习。

如果你的方向是数据开发工程师,那么可以先学Java,如果你的方向是分析师或者数据挖掘,那么可以先学Python。

其实Java和Python是没有好坏区分的,他们所涉及的领域不同,其实到后面你会发现这些东西你多少都会接触到,而且编程主要是还把基础打牢固,有基础了什么都好学习,没有基础一切都是空谈。