概述
之前在網上看到過很多關於mysql聯合索引最左前綴匹配的文章,自以為就瞭解了其原理,最近面試時和麵試官交流,發現遺漏了些東西,這裡自己整理一下這方面的內容。
什麼時候創建組合索引?
當我們的where查詢存在多個條件查詢的時候,我們需要對查詢的列創建組合索引
為什麼不對沒一列創建索引
- 減少開銷
- 覆蓋索引
- 效率高
減少開銷:假如對col1、col2、col3創建組合索引,相當於創建了(col1)、(col1,col2)、(col1,col2,col3)3個索引
覆蓋索引:假如查詢SELECT col1, col2, col3 FROM 表名,由於查詢的字段存在索引頁中,那麼可以從索引中直接獲取,而不需要回表查詢
效率高:對col1、col2、col3三列分別創建索引,MySQL只會選擇辨識度高的一列作為索引。假設有100w的數據,一個索引篩選出10%的數據,那麼可以篩選出10w的數據;對於組合索引而言,可以篩選出100w*10%*10%*10%=1000條數據
最左匹配原則
假設我們創建(col1,col2,col3)這樣的一個組合索引,那麼相當於對col1列進行排序,也就是我們創建組合索引,以最左邊的為準,只要查詢條件中帶有最左邊的列,那麼查詢就會使用到索引
創建測試表
填充100w測試數據
DROP PROCEDURE pro10;
CREATE PROCEDURE pro10()
BEGIN
DECLARE i INT;
DECLARE char_str varchar(100) DEFAULT 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789';
DECLARE return_str varchar(255) DEFAULT '';
DECLARE age INT;
SET i = 1;
WHILE i < 5000000 do
SET return_str = substring(char_str, FLOOR(1 + RAND()*62), 8);
SET i = i+1;
SET age = FLOOR(RAND() * 100);
INSERT INTO student(id, name, age) values(i, return_str, age);
END WHILE;
END;
CALL pro10();
場景測試
EXPLAIN SELECT * FROM student WHERE id = 2;
可以看到該查詢使用到了索引
EXPLAIN SELECT * FROM student WHERE id = 2 AND name = 'defghijk';
可以看到該查詢使用到了索引
EXPLAIN SELECT * FROM student WHERE id = 2 AND name = 'defghijk' and age = 8;
可以看到該查詢使用到了索引
EXPLAIN SELECT * FROM student WHERE id = 2 AND age = 8;
可以看到該查詢使用到了索引
EXPLAIN SELECT * FROM student WHERE name = 'defghijk' AND age = 8;
可以看到該查詢沒有使用到索引,類型為index,查詢行數為4989449,幾乎進行了全表掃描,由於組合索引只針對最左邊的列進行了排序,對於name、age只能進行全部掃描
EXPLAIN SELECT * FROM student WHERE name = 'defghijk' AND id = 2;
EXPLAIN SELECT * FROM student WHERE age = 8 AND id = 2;
EXPLAIN SELECT * FROM student WHERE name = 'defghijk' and age = 8 AND id = 2;
可以看到如上查詢也使用到了索引,id放前面和放後面查詢到的結果是一樣的,MySQL會找出執行效率最高的一種查詢方式,就是先根據id進行查詢
總結
如上測試,可以看到只要查詢條件的列中包含組合索引最左邊的那一列,不管該列在查詢條件中的位置,都會使用索引進行查詢。
後面小編會分享更多運維乾貨,感興趣的朋友可以關注一下~
閱讀更多 智能運維小講堂 的文章