03.02 如何學習大數據以及雲計算方面的知識?


大數據和雲計算有密切的聯繫,比如核心都在於分佈式存儲和分佈式計算,只是大數據更關心數據的價值化,而云計算更注重為用戶提供服務。

大數據是物聯網和雲計算發展的必然產物,所以學習大數據的過程也是學習物聯網和雲計算的過程。學習大數據可以按照以下幾個步驟進行:

第一:從數據採集開始瞭解大數據。大數據目前正處在落地應用的階段,大數據的落地應用也是產業互聯網發展的關鍵。大數據的產業鏈從數據採集開始,所以要想了解大數據首先就要了解如何完成數據的採集,而數據的採集則是通過物聯網、Web和傳統信息系統三個渠道完成的,其中物聯網是主要的數據來源。

第二:數據整理和數據存儲。數據整理包括數據的清洗和分類,數據清洗往往需要根據數據自身的完整度決定是否保留相應的維度。而數據分類則是大數據分析的重要環節,不同類型的數據往往有不同的分析方式。數據存儲則涉及到雲計算技術,雲計算技術為大數據提供了支撐性服務,雲計算把服務分為三個級別來對應於不同的需求,分別是Iaas、PaaS和SaaS。

第三:數據分析。數據分析是大數據技術的重要環節,因為數據分析是實現數據價值化的重要手段。隨著大數據技術的不斷髮展,數據分析的方式和手段也在不斷的發展,比如從基礎報表分析到BI分析再到機器學習,這個發展的過程也是數據價值不斷得到挖掘和提升的過程。學習數據分析可以從分析工具開始學起,然後進一步學習編程語言、數據庫、算法設計等內容。

第四:實踐。大數據和雲計算知識的學習一定要注重實踐,由於大數據相關內容比較多,所以不建議單純的自學,應該結合實際項目進行,參加一個項目組的實習是一個不錯的選擇。

作者簡介:中國科學院大學計算機專業研究生導師,從事IT行業多年,研究方向包括動態軟件體系結構、大數據、人工智能相關領域,有多年的一線研發經驗。

歡迎關注作者,歡迎諮詢計算機相關問題。


分享到:


相關文章: