大數據應該怎麼學?有哪些要求?

何立廷


  大數據從入門到精通,一套專業的學習路線是必不可少的,尤其是對於想要自學的同學來說,這個至關重要。個人也整理了一套大數據學習路線,如果你是從零基礎開始的同學,可以作為自己的學習參考。

  大數據學習路線圖是分為五個大的階段的,學習時間不確定,要看自己的學習能力和集中學習的精力。

  階段一:是java基礎。此階段是針對沒有編程基礎,或者對基礎不紮實的同學一次補習,這個很重要,就像建一座大廈,這就是地基,地基不穩,就算修再高,總有一天會轟然倒塌!

  需要掌握的技術知識:

  (1)Java語言基礎

  Java開發介紹、熟悉Eclipse開發工具、Java語言基礎、Java流程控制、Java字符串、Java數組與類和對象、數字處理類與核心技術、I/O與反射、多線程、Swing程序與集合類

  (2) HTML、CSS與JavaScript

  PC端網站佈局、HTML5+CSS3基礎、WebApp頁面佈局、原生JavaScript交互功能開發、Ajax異步交互、jQuery應用

  (3)JavaWeb和數據庫

  數據庫、JavaWeb開發核心、JavaWeb開發內幕

  階段二:linux基礎和Hadoop生態系統。

  本階段的linux也是基礎課程,幫大家進入大數據領域,以便更好地學習Hadoop、hbase、NoSQL、Spark、Storm、docker、 kvm、openstack等眾多課程。因為企業中無一例外的是使用 Linux來搭建或部署項目。

  Hadoop生態系統的課程,對HDFS體系結構和shell以及java操作詳細剖析,從知曉原理到開發網盤的項目,讓大家打好學習大數據的基礎。

  需要掌握的技術知識:

  Linux體系、Hadoop離線計算大綱、分佈式數據庫Hbase、數據倉庫Hive、數據遷移工具Sqoop、Flume分佈式日誌框架

  階段三:分佈式計算框架和Spark&Strom生態體系

  Spark大數據處理本部分內容全面涵蓋了 Spark生態系統的概述及其編程模型,深入內核的研究,。不僅面向項目開發人員,甚至對於研究 Spark的學員,此部分都是非常有學習指引意義的課程。

  需要掌握的技術知識:

  (1)分佈式計算框架

  Python編程語言、Scala編程語言、Spark大數據處理、Spark—Streaming大數據處理、Spark—Mlib機器學習、Spark—GraphX 圖計算、實戰一:基於Spark的推薦系統(某一線公司真實項目)、實戰二:新浪網

  (2)storm技術架構體系

  Storm原理與基礎、消息隊列kafka、Redis工具、zookeeper詳解、實戰一:日誌告警系統項目、實戰二:猜你喜歡推薦系統實戰

  階段四:項目練習其實是穿插課程其中的,在講解大數據理論的同時,將實踐知識穿插其中,增加學生對大數據技術的理解和應用。

  階段五:此階段是深入提升階段,主要是人工智能的一些技術知識,也為學生想轉行人工智能打下良好的基礎,多重技能,更能大大提升就業質量。

  這個只是大體的大數據學習路線,想要什麼深入學習,還是要找相應的視頻教程和書籍配合學習。如果想快速進入大數據行業,可以選擇專業的學習方式。


千鋒鄭州


大數據現在正在鵬飛階段,門檻還不算太高,可以從基本的PYTHON編程語言開始瞭解,理解了基本的數據語言就可以更進一步瞭解信息的分發,儲存以及篩選機制,對宏觀大數據概念和模型做有一個全面的認識,之後可以深入到大數據的各項深耕技術,比如邏輯語言方面,智能識別方面,接口與協議等。

大數據的概念提出提出已經有些年了,至今仍然沒有大規模利用,一方面技術上還沒有取得突破性的成果,另一方面因為這是涉及到多方領域、各組平臺的全面協調。要真正開啟大數據的時代可以說仍需時日。


分享到:


相關文章: