大數據Hadoop,細數HDFS的那些概念(一)成都加米谷大數據分享

HDFS是Hadoop中自帶的分佈式文件系統,並且是Hadoop工具的核心基礎組件之一,今天,加米穀帶大家對HDFS做一些深入的瞭解,對其內部概念進行闡述。

一、namenode和datanode

大數據Hadoop,細數HDFS的那些概念(一)成都加米穀大數據分享

在HDFS中,每個服務器稱之為一個節點。而所有的節點都分為兩類,一個類是namenode,另一類是datanode。普通模式HDFS集群只有一個namenode和多個datanode,作用分別是管理和工作。

  • namenode

namenode是HDFS的管理節點,其維護著HDFS的命名空間。它會時刻監控著整個HDFS的樹狀系統以及系統內的所有目錄和文件,並將它們以文件的形式保存在磁盤上。

namenode還維護著HDFS中每個數據塊所在的節點的信息,其中位置信息不會永久保存。因為HDFS啟動的時候每個datanode會向namenode彙報信息。

namenode是整個HDFS的外接接口,客戶端在對HDFS進行交互請求之前都要先經過namenode驗證。

  • datanod

datanode是HDFS的工作節點,每個datanode都維護著本節點的數據和剩餘空間。datanode會隨時向namenode彙報本節點的存儲情況,這樣在有客戶端請求來臨時,namenode才能對整個HDFS系統有清晰的把控。

大數據Hadoop,細數HDFS的那些概念(一)成都加米穀大數據分享

namenode和datanode是整個HDFS中最核心的概念,但是如果namenode節點出現故障的話,整個HDFS文件系統就會失效,所有數據都會丟失。因此需要有一種止損方案來避免這種情況的出現,這個方案就是HDFS高可用。後續加米穀將持續介紹HDFS高可用以及其他HDFS概念,歡迎關注一起學習。


分享到:


相關文章: