Hive是大數據(hadoop)生態系統非常重要的一個工具,它提供了一種類SQL的語言,可以查詢存儲在Hadoop分佈式文件系統(HDFS)中的數據,也可以查詢Hadoop數據庫(Hbase)中的數據,可以說通過Hive這個數據倉庫工具大大降低了開發難度,對於數據分析師來說真的非常友好,只要使用SQL語言的分析師就可以輕鬆的使用Hive玩轉大數據,當然Hive和其他的基於SQL的環境還是有一些差異,所以通過寫這一系列文章來幫助數據分析人員學習Hive使用。
下面是學習Hive整體知識框架,我們會從最基本的安裝配置到項目實戰進行講解,當然遇到疑惑的問題,一定要學會去思考和解決,你可以去百度,當然也可以和小編一起探討。
- Hive基礎知識
- Hive安裝使用
- Hive數據類型與文件格式
- Hive數據定義(DDL)
- Hive數據操作(DML)
- Hive查詢
- 函數
- 壓縮和存儲
- 調優
- 項目實戰
文章最後:
1.Hive官網地址
Apache Hive TMhive.apache.org
2.Hive文檔查看地址
Apache Software Foundationcwiki.apache.org
3.Hive下載地址
Index of /dist/hivearchive.apache.org
4.github地址
github地址github.com
閱讀更多 長老坐穩了 的文章