大數據怎麼入門學習好?

小明愛王者


一、首先要搞清楚一個概念,什麼是大數據。

大數據又稱巨量資料,就是數據量大、來源廣、種類繁多(日誌、視頻、音頻),大到PB級別,現階段的框架就是為了解決PB級別的數據。

專業的來講:大數據(big data,mega data),或稱巨量資料,指的是需要新處理模式才能具有更強的決策力、洞察力和流程優化能力的海量、高增長率和多樣化的信息資產。 在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》中大數據指不用隨機分析法(抽樣調查)這樣的捷徑,而採用所有數據進行分析處理。大數據的5V特點:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值密度)、Veracity(真實性)。

二、學習大數據需要什麼語言基礎?

首先,學習大數據是需要有java,python和R語言的基礎。

1)Java學習到什麼樣的程度才可以學習大數據呢?java需要學會javaSE即可。javaweb,javaee對於大數據用不到。學會了javase就可以看懂hadoop框架。

2)python是最容易學習的,難易程度:python java Scala 。python不是比java更直觀好理解麼,因為會了Python 還是要學習java的,你學會了java,再來學習python會很簡單的,一週的時間就可以學會python。

3)R語言也可以學習,但是不推薦,因為java用的人最多,大數據的第一個框架Hadoop,底層全是Java寫的。就算學會了R還是看不懂handoop。

java在大數據中的作用是構成大數據的語言,大數據的第一個框架Hadoop,底層全是Java寫的 ,所以推薦首選學習java。再給你們舉例說明下它們的分工和作用,java注重業務,大數據注重數據,前端是臉(頁面顯示),java是胳膊(業務),大數據是直男大腦,人工智能,深度學習是有情商的大腦。


臺灣小城大事


大數據入門首先要學習javase,掌握了javase之後,最好再學學javaee,如果不學的話,影響也不是特別大。接下來要學的東西就比較多了,主要是兩塊,一種是離線計算,以hadoop為主,一種是實時計算,以spark為主,當然大數據不是一兩個技術的組合,而是一整套完整的生態系統,所以要學的東西還是很多的,大數據主要解決的是海量數據的存儲和計算問題,建議還是把java學好,因為很多大數據的軟件都是基於java編寫的,所以入門大數據的話,建議先從java入門學習比較好!





分享到:


相關文章: