想自學大數據,不知道從哪裡學起,有什麼書籍和學習路線推薦麼?

用戶8328945825930


作為一名IT從業者,同時也是一名教育工作者,我來回答一下這個問題。

首先,要自學大數據還是具有一定難度的,大數據不僅內容比較多,難度比較高,同時還需要學習者具有一定的場景支撐,比如數據中心等等,所以初學者自學大數據通常需要按照三個階段來安排學習計劃。

學習大數據的第一個階段要根據自身的知識基礎和發展方向來完成一些基礎知識的學習,不論是從事大數據開發還是大數據分析,都需要具有一定的程序設計基礎,初學者從Java和Python開始學起都是不錯的選擇。Java的前期學習難度要大一些,Python則要相對簡單一些,而且目前Python語言在大數據領域的應用前景也比較廣闊。

學習大數據的第二個階段是掌握大數據平臺的相關知識,大數據領域的諸多崗位任務都離不開大數據平臺的支撐,所以學習大數據平臺是學習大數據技術的重要環節。學習大數據平臺可以從Hadoop和Spark開始學起,一方面這兩個平臺是開源平臺,另一方面這兩個平臺的應用範圍也比較廣泛,相關的學習案例也比較多。

相對於編程語言來說,大數據平臺的內容相對比較多,而且也具有一定的難度,往往還需要初學者具備一定的Linux操作系統知識,所以如果自身的計算機基礎知識比較薄弱,那麼也可以從Linux操作系統開始學起。

學習大數據的第三個階段就是實踐階段,實踐階段最好能夠在實習崗位上來完成,一方面實習崗位能夠提供場景支撐,另一方面在實習崗位上也更容易與有經驗的技術人員進行交流學習。

我從事互聯網行業多年,目前也在帶計算機專業的研究生,主要的研究方向集中在大數據和人工智能領域,我會陸續寫一些關於互聯網技術方面的文章,感興趣的朋友可以關注我,相信一定會有所收穫。

如果有互聯網、大數據、人工智能等方面的問題,或者是考研方面的問題,都可以在評論區留言,或者私信我!


IT人劉俊明


大數據可以自學,有Java開發經驗的童鞋可以挑戰一下。大數據主要學習三個平臺Hadoop、Spark、Storm。不過因為大數據技術體系龐大複雜,不同的就業方向使用的技術差異也比較大,加之作為比較新的技術網上的學習資源很少,自學難度大,零基礎建議報班培訓學習。

推薦書籍:

《Effective Java中文版》

《Big Data》

《Hadoop權威指南》

《Hive編程指南》

《Learning Spark》

《Spark機器學習:核心技術與實踐》

自學大數據可以學習哪些內容?有哪些書籍推薦?

https://www.toutiao.com/i6724194937652380171/


加米穀大數據


大數據學習可以從最基礎的java語言入手,然後去學習Linux&Hadoop生態體系,一些分佈式的技術理念,再然後就是學習機器學習,深度學習算法。

階段一、大數據基礎——java語言基礎方面

(1)Java語言基礎

Java開發介紹、熟悉Eclipse開發工具、Java語言基礎、Java流程控制、Java字符串、Java數組與類和對象、數字處理類與核心技術、I/O與反射、多線程、Swing程序與集合類

(2)JavaWeb和數據庫

數據庫、JavaWeb開發核心、JavaWeb開發內幕

推薦書籍:

《Effective Java中文版》(第2版)

這本書是學習java必備書籍,看完這本書也就掌握了入門的基礎知識。

階段二、 Linux&Hadoop生態體系

學習大數據離不開hadoop,圍繞hadoop有一套生態體系,分佈式數據庫Hbase、數據倉庫Hive、數據遷移工具Sqoop、Flume分佈式日誌框架需要了解並掌握。

推薦書籍:

1、《Big Data》

2、《Hadoop權威指南》

3、《Hive編程指南》

階段三、 分佈式計算。

(1)分佈式計算框架

Python編程語言、Scala編程語言、Spark大數據處理、Spark—Streaming大數據處理、Spark—Mlib機器學習、Spark—GraphX 圖計算等

(2)storm技術架構體系

Storm原理與基礎、消息隊列kafka、Redis工具、zookeeper集群

推薦書籍:

1、《Learning Spark》

2、《Spark機器學習:核心技術與實踐》

階段四、機器學習和深度學習算法的學習,可以更好的利用大數據去處理問題。






丁哥帶你玩編程


隨著互聯網技術的發展,大數據行業前景非常被看好,有很多朋友對大數據行業心嚮往之,卻苦於不知道該如何下手,或者說學習大數據不知道應該看些什麼書。作為一個零基礎大數據入門學習者該看哪些書?今天就給大家分享幾本那些不容錯過的大數據書籍。

1、《數據挖掘》

這是一本關於數據挖掘領域的綜合概述,本書前版曾被KDnuggets的讀者評選為最受歡迎的數據挖掘專著,是一本可讀性極佳的教材。它從數據庫角度全面系統地介紹數據挖掘的概念、方法和技術以及技術研究進展,並重點關注近年來該領域重要和最新的課題——數據倉庫和數據立方體技術,流數據挖掘,社會化網絡挖掘,空間、多媒體和其他複雜數據挖掘。

2、《Big Data》

這是一本在大數據的背景下,描述關於數據建模,數據層,數據處理需求分析以及數據架構和存儲實現問題的書。這本書提供了令人耳目一新的全面解決方案。但不可忽略的是,它也引入了大多數開發者並不熟悉的、困擾傳統架構的複雜性問題。本書將教你充分利用集群硬件優勢的Lambda架構,以及專門用來捕獲和分析網絡規模數據的新工具,來創建這些系統。

3、《Mining of Massive Datasets》

這是一本書是關於數據挖掘的。但是本書主要關注極大規模數據的挖掘,也就是說這些數據大到無法在內存中存放。由於重點強調數據的規模,所以本書的例子大都來自Web本身或者Web上導出的數據。另外,本書從算法的角度來看待數據挖掘,即數據挖掘是將算法應用於數據,而不是使用數據來“訓練”某種類型的機器學習引擎。


分享到:


相關文章: