10.23 淺談Mysql索引

淺談Mysql索引

我們都知道,數據庫索引可以幫助我們更加快速的找出符合的數據,但是如果不使用索引,Mysql則會從第一條開始查詢,直到查詢到符合的數據,這樣也會導致一個問題:如果沒有添加索引,表中數據很大則查詢數據花費的時間更多。而這時候我們為字段添加一個索引,Mysql就會快速搜索數據,可以節省大量時間。MyISAM和InnoDB是最經常使用的兩個存儲引擎,MyISAM和InnoDB索引都是採用B+樹的數據結構,那B樹和B+樹的區別是什麼呢?

B樹B樹是一種多路搜索樹,搜索時從根節點開始,對節點內的有序關鍵字進行二分查找,如果命中則結束搜索,否則根據搜索大小結果進入左右子節點重複搜索,直到找到搜索結果。

特點:

  • 關鍵字分佈在B樹所有節點。
  • 關鍵字不會重複出現在多個節點。
  • 搜索可能在非葉子節點就結束。

B+樹

B+樹實際上是一種特殊的B樹,和B樹感官最明顯的一個不同點在於B+樹關鍵字只會出現在葉子結點中,並且關鍵字在鏈表中是有序的,也就是B+樹的搜索最後只會在葉子結點中命中結果,那非葉子結點在B+樹充當什麼角色呢?非葉子節點在B+樹中相當於是葉子結點的索引,而葉子結點是存儲關鍵字數據的數據層。既然Mysql索引採用B+樹的數據結構,那麼相比於B樹,B+樹做索引的優勢在哪裡呢:

  • 磁盤讀寫代價更低。
  • 查詢效率更穩定。
  • 遍歷元素效率高。

講完了B樹和B+樹的概念,接下來就需要開始談談索引了。其實Mysql索引的數據結構有兩種:B+樹、Hash。但是在MyISAM和InnoDB存儲引擎當中只能使用B+樹,索引其實總共可以分為四類:

  • 單列索引:單列索引有三種,包括普通索引、唯一索引、主鍵索引
  • 組合索引
  • 全文索引
  • 空間索引

單列索引

單列索引,顧名思義就是一個索引只能作用於單列,但是一個數據表可以同時擁有多個單列索引。單列索引一共有三種:普通索引、唯一索引、主鍵索引。

普通索引:

基本的索引類型,不會對數據加入任何限制,一樣允許添加了普通索引的普通索引的數據列存在空值或重複值,添加普通索引的目的只是為了查詢數據會更快一點。

唯一索引:

對單列添加唯一索引,就代表這個列只能是唯一值,比如用戶表用戶名可以添加唯一索引,這樣用戶名必須是唯一值,但是可以為空值。

主鍵索引:

其實就是在唯一索引的基礎上,不允許列出現空值的存在。

組合索引

選中數據表的多列組合然後創建索引,但是組合索引並不是說創建成功都可以被使用,而是需要遵循最左前綴集合。也就是隻有在查詢條件中使用了這些字段的左邊字段,組合索引才會生效。下面我們舉個例子來解釋下什麼叫做最左前綴。

首先創建一個表test1009,並且將id, username, sex三個列組合然後添加索引。

CREATE TABLE test_10_09 (
id INT NOT NULL,
username VARCHAR (20) NOT NULL,
idcard VARCHAR (18),
sex VARCHAR (3) NOT NULL,
INDEX MultiIdx (id, username, sex)
)

我們說組合索引想要生效需要滿足最左前綴。那什麼叫做最左前綴呢?最左前綴其實就是利用組合索引中最左邊的列來匹配數據,以上面的例子我們可以看到,組合索引最左邊的列是id,所以說如果我們查詢的條件不包括id,也就是不滿足最左前綴原則,這時候查詢操作是無法利用到我們創建的組合索引的。我們可以使用EXPLAIN指令來測試查詢條件帶與不帶id會有什麼效果:

淺談Mysql索引

淺談Mysql索引

可以看到我們帶id查詢可以通過索引去查詢,但是查詢不帶id查詢無法觸發最左前綴原則,於是組合索引並沒有生效。

全文索引

全文索引其實就是字面意思,使用全文索引可以在一連串文字中通過某個關鍵詞,就可以找到包含字段的記錄行。但是全文索引有著很多限制:

  • 在InnoDB存儲引擎不支持使用,只允許在MyISAM存儲引擎中使用。
  • 全文索引只能在char、varchar、text三種類型的數據列使用。
  • 所搜的關鍵字默認至少要4個字符。
  • 全局索引要藉助MATCH函數。

空間索引

  • mysql 5.7開始支持空間索引。空間索引一般是適用於包含空間操作的系統,比如遊戲開發。
  • 空間索引只能在GEOMETRY、POINT、LINESTRING、POLYGON4種空間數據類型的數據列使用。並且添加空間索引的數據列必須非空。
  • 在創建空間索引必須使用SPATIAL關鍵字。

索引優點

  • 數據表的所有數據列都可以添加索引。
  • 使用唯一索引或者主鍵索引可以保證數據的唯一性。
  • 使用索引可以提高查詢數據的效率和性能。

索引缺點

  • 使用索引會佔用一定的物理空間。
  • 數據插入以及修改都需要維護索引,會影響性能。

索引使用原則

  • 經常需要插入或者更新操作的表不宜設置太多索引,因為數據插入以及修改都需要維護索引,會影響性能。
  • 數據量少的表不建議添加索引,否則可能反而降低查詢效率及性能。
  • 在列取值範圍比較少時不使用索引,比如專業名只有三個取值,使用索引意義確實不大。
  • 組合索引將最經常使用的列放在第一列,保證組合索引能滿足最左前綴的要求。
  • 如果列取值唯一,可以為字段添加唯一性索引,提高查詢效率。
  • 索引儘量添加在數據量比較少的列上面,比如varchar(100)檢索效率肯定沒有varchar(30)來得快,所以說數據量多的列添加索引查詢效率會更慢。


分享到:


相關文章: