模糊搜索c1 like '%a%'真的都不能走索引么
某DBA:like '%a%'肯定走不了索引的。。。
在MySQL數(shù)據(jù)庫使用規(guī)范或優(yōu)化建議中都明確說類似 like '%a%'的寫法不走索引。那么,真的是在任何條件下這種寫法都不能走索引么?
1、不走索引的情況
創(chuàng)建一個測試表并插入測試數(shù)據(jù)
CREATE TABLE test_tb1(
id INT PRIMARY KEY ,
c1 VARCHAR(10),
c2 VARCHAR(20),
KEY idx_c1(c1)
);
INSERT INTO test_tb1
VALUES
(1,'abc','dwdwdwd'),
(2,'cadw','kklll'),
(3,'rtyu','093jx'),
(4,'sfgh','pl;,efdsf'),
(5,'l,mi','45223sda'),
(6,'rty',',ngykmb'),
(7,'mju','wedffd'),
(8,'tyuo','yuxx'),
(9,'oiuyr','qwert'),
(10,'ytuion','wwwwww');
進行測試 c1 LIKE '%a%'的寫法是否走索引。
EXPLAIN SELECT * FROM test_tb1 WHERE c1 LIKE '%a%';
結(jié)果如下:
從執(zhí)行計劃來看,符合我們一貫的認知。
2、走索引的情況
重新創(chuàng)建一個表,并插入數(shù)據(jù)
# 創(chuàng)建表
CREATE TABLE test_tb2(
id INT PRIMARY KEY ,
c1 VARCHAR(10),
KEY idx_c1(c1)
);
# 插入數(shù)據(jù)
INSERT INTO test_tb2
VALUES
(1,'abc'),
(2,'cadw'),
(3,'rtyu'),
(4,'sfgh'),
(5,'l,mi'),
(6,'rty'),
(7,'mju'),
(8,'tyuo'),
(9,'oiuyr'),
(10,'ytuion');
此時使用上述相同的SQL來看一下執(zhí)行計劃。
EXPLAIN SELECT * FROM test_tb2 WHERE c1 LIKE '%a%';
此時結(jié)果與之前不同了,可以走索引了。
3、簡述原因
(1)索引內(nèi)容
上述2例中的差別在于test_tb1比test_tb2多了一個c2字段,這導(dǎo)致在進行c1 like '%a%'查詢時,一級索引(主鍵索引)primary key 及二級索引(輔助索引)idx_c1的執(zhí)行代價不同。
在MySQL中,主鍵索引存儲的是主鍵字段及對應(yīng)的整條記錄的數(shù)據(jù),即所有的數(shù)據(jù)都是按照主鍵進行排序組織在主鍵索引上的。而二級索引存儲的數(shù)據(jù)是按照對應(yīng)的字段排序后的數(shù)據(jù),包含索引字段+主鍵字段。
以上兩例中,一級索引與二級索引的內(nèi)容如下:
例1
例2:
如果例1中使用c1索引,則過程是,先在c1索引上進行整個索引的掃描,然后找到主鍵字段,因為找到的內(nèi)容還缺少c2的值,因此需要再回到主鍵索引上進行檢索,拿到所有字段的內(nèi)容,這個代價相對較高
而例2中,掃描c1索引后,便得到了所有需要返回的值,而不需要再回主鍵索引上取其他內(nèi)容(因為c1索引上已經(jīng)有主鍵字段),因此可以選擇走c1索引。
PS:成本計算當然不止這些內(nèi)容,還有一套公式,本次不贅述。
(2)例1的改寫
通過上面的對比,如果想例1中也走索引,可以只查詢c1字段或c1及主鍵id字段,此時也是可以走索引的,例如:
EXPLAIN SELECT id,c1 FROM test_tb1 WHERE c1 LIKE '%a%';
EXPLAIN SELECT c1 FROM test_tb1 WHERE c1 LIKE '%a%';
EXPLAIN SELECT id FROM test_tb1 WHERE c1 LIKE '%a%';
PS:全模糊搜索還有其他的方式解決,另外也可以使用ES等來解決。
4、小結(jié)
在數(shù)據(jù)庫學(xué)習(xí)的過程中,不可只記結(jié)論而忽視其原理。另外還有很多所謂的規(guī)范都是需要區(qū)別對待的,你知道的還有什么需要區(qū)別處理的數(shù)據(jù)庫規(guī)范么?