《大數據分析教程-Hive》

Hive是大數據(hadoop)生態系統非常重要的一個工具,它提供了一種類SQL的語言,可以查詢存儲在Hadoop分佈式文件系統(HDFS)中的數據,也可以查詢Hadoop數據庫(Hbase)中的數據,可以說通過Hive這個數據倉庫工具大大降低了開發難度,對於數據分析師來說真的非常友好,只要使用SQL語言的分析師就可以輕鬆的使用Hive玩轉大數據,當然Hive和其他的基於SQL的環境還是有一些差異,所以通過寫這一系列文章來幫助數據分析人員學習Hive使用。

下面是學習Hive整體知識框架,我們會從最基本的安裝配置到項目實戰進行講解,當然遇到疑惑的問題,一定要學會去思考和解決,你可以去百度,當然也可以和小編一起探討。

  1. Hive基礎知識
  2. Hive安裝使用
  3. Hive數據類型與文件格式
  4. Hive數據定義(DDL)
  5. Hive數據操作(DML)
  6. Hive查詢
  7. 函數
  8. 壓縮和存儲
  9. 調優
  10. 項目實戰

文章最後:

1.Hive官網地址

Apache Hive TM​hive.apache.org

2.Hive文檔查看地址

Apache Software Foundation​cwiki.apache.org

3.Hive下載地址

Index of /dist/hive​archive.apache.org

4.github地址

github地址​github.com



分享到:


相關文章: