大數據開發可以自學嗎?有哪些需要注意的地方?

侯佳儀


隨著大數據平臺的逐漸成熟,大數據在落地應用的過程中會逐漸釋放出大量的人才需求,對於普通職場人來說,掌握大數據開發技術也會在一定程度上拓展自己的發展渠道。

從近兩年大數據方向研究生的就業情況來看,大數據開發崗位的人才需求量還是比較大的,目前大型科技公司對於大數據開發人才的需求量也比較大,而且招聘更多集中在研發崗位上,主要以從事大數據平臺開發為主。

由於大數據開發的知識體系比較龐大,所以對於自學者的要求還是比較高的,往往需要自學者具備一定的數學、統計學基礎,同時還要有一定的計算機基礎,涉及到操作系統(Linux)和編程語言。所以,如果基礎比較薄弱的初學者如果要學習大數據技術,可以從編程語言開始學起。

在編程語言的選擇上可以重點關注一下Java和Python這兩門編程語言,目前這兩門編程語言的學習資料還是比較多的,而且整體的學習難度也並不算大,尤其是Python語言更是以簡單易學著稱。掌握編程語言是學習大數據開發的第一步,通常大部分初學者在學習編程語言的時候並不會遇到太大的障礙,所以這部分內容是完全可以自學的。

學習大數據技術比較困難的部分是第二部分,也就是大數據平臺的學習,這部分內容比較多,而且對於實驗環境(數據、算力)有一定的要求,這對於初學者來說往往還是有一定學習難度的。通常在學習完基本的大數據平臺知識之後,應該找一個大數據開發的實習崗位,這樣會有更快的進步速度。所以,學習大數據技術並不建議完全自學,這樣學習成本會比較高,而且也很難深入。

我從事互聯網行業多年,目前也在帶計算機專業的研究生,主要的研究方向集中在大數據和人工智能領域,我會陸續寫一些關於互聯網技術方面的文章,感興趣的朋友可以關注我,相信一定會有所收穫。

如果有互聯網、大數據、人工智能等方面的問題,或者是考研方面的問題,都可以在評論區留言,或者私信我!


IT人劉俊明


可以自學,現在網上可以找到很多的資料,現將部分可能會需要的東西羅列如下:

(一)需要的技能

目前大數據行業較火,出現了很多的職位,基本羅列如下(java相關的就不再說了):

1.數據採集類工作,主要是爬蟲,etl工具,flume等。

2.數據遷移類工作,主要是hdfs,hbase,hive,hsql,sqoop等。

3.數據分析類工作,主要是mapreduce,storm,spark streaming,當然,spark streaming在學習過程中會牽扯到一些別的技術,就像mapreduce會用到hdfs一樣,spark的其他知識也可能會用到。

目前大數據開發相關的基本這些就差不多夠用了,其他的可以在工作中不斷學習。

(二)如何學習

個人經驗來談,主要可以從一下幾個途徑來學習:

1.買一些經典教材,或者從網上找一些視頻資料,這些只能學習一些基本的內容。如果想深入瞭解,可以從get上找一些案例來看

2.跟團隊的前輩學習,一邊做項目一邊學習,這是最快、最有效的方法,但前提是公司領導能給你這個機會





分享到:


相關文章: