為什麼 MongoDB 索引選擇B-樹,而 Mysql 選擇B+樹(精幹總結)

這個問題是我在看視頻的時候老師提到的,雖然之前知道他們各自的索引結構但是還沒有研究過原因。在網上一搜答案特別多。但是都特別的囉嗦。於是總結了這篇文章。

一、B-樹和B+樹的區別

很明顯,我們要想弄清楚原因就要知道B-樹和B+樹的區別。為了不長篇大論。我們直接給出他們的形式總結他們的特點。

1、B-樹

B-樹是一種自平衡的搜索樹,形式很簡單:

為什麼 MongoDB 索引選擇B-樹,而 Mysql 選擇B+樹(精幹總結)

這就是一顆B-樹。針對我們這個問題的最核心的特點如下:

(1)多路,非二叉樹

(2)每個節點既保存索引,又保存數據

(3)搜索時相當於二分查找

在這裡我們假定都已經瞭解了B樹相關的結構。

2、B+樹

B+樹是B-樹的變種

為什麼 MongoDB 索引選擇B-樹,而 Mysql 選擇B+樹(精幹總結)

最核心的特點如下:

(1)多路非二叉

(2)只有葉子節點保存數據

(3)搜索時相當於二分查找

(4)增加了相鄰接點的指向指針。

從上面我們可以看出最核心的區別主要有倆,一個是數據的保存位置,一個是相鄰節點的指向。就是這倆造成了MongoDB和Mysql的差別。為什麼呢?

3、B-樹和B+樹的區別

(1)B+樹查詢時間複雜度固定是logn,B-樹查詢複雜度最好是 O(1)。

(2)B+樹相鄰接點的指針可以大大增加區間訪問性,可使用在範圍查詢等,而B-樹每個節點 key 和 data 在一起,則無法區間查找。

(3)B+樹更適合外部存儲,也就是磁盤存儲。由於內節點無 data 域,每個節點能索引的範圍更大更精確

(4)注意這個區別相當重要,是基於(1)(2)(3)的,B-樹每個節點即保存數據又保存索引,所以磁盤IO的次數很少,B+樹只有葉子節點保存,磁盤IO多,但是區間訪問比較好。

有了他們的區別之後,現在我們再來解釋這個原因就好多了。

二、原因解釋

想要解釋原因,我們還必須要了解一下MongoDB和Mysql的基本概念。

1、MongoDB

MongoDB 是文檔型的數據庫,是一種 nosql,它使用類 Json 格式保存數據。比如之前我們的表可能有用戶表、訂單表、購物籃表等等,還要建立他們之間的外鍵關聯關係。但是類Json就不一樣了。

為什麼 MongoDB 索引選擇B-樹,而 Mysql 選擇B+樹(精幹總結)

我們可以看到這種形式更簡單,通俗易懂。那為什麼 MongoDB 使用B-樹呢?

MongoDB使用B-樹,所有節點都有Data域,只要找到指定索引就可以進行訪問,無疑單次查詢平均快於Mysql

2、Mysql

Mysql作為一個關係型數據庫,數據的關聯性是非常強的,區間訪問是常見的一種情況,B+樹由於數據全部存儲在葉子節點,並且通過指針串在一起,這樣就很容易的進行區間遍歷甚至全部遍歷。

這倆區別的核心如果你能看懂B-樹和B+樹的區別就很容易理解。


分享到:


相關文章: