SQL優(yōu)化-隱式字符編碼轉(zhuǎn)換
MySQL中我們知道有:
- 如果對索引字段做函數(shù)操作,可能會破壞索引值的有序性,因此優(yōu)化器就決定放棄走樹搜索功能。
- 隱式類型轉(zhuǎn)換也會導(dǎo)致放棄走樹搜索。
因為類型轉(zhuǎn)換等價于在條件字段上使用了函數(shù)比如:
假設(shè)tradeid字段有索引,且為varchar類型:
mysql> select * from tradelog where tradeid=110717;
等價于:
mysql> select * from tradelog where CAST(tradid AS signed int) = 110717;
下面來看看隱式字符編碼轉(zhuǎn)換導(dǎo)致的一個慢SQL::
業(yè)務(wù)上有個SQL執(zhí)行需要1.31秒:
看看執(zhí)行計劃:
從執(zhí)行計劃分析看出問題出在r表也就是 h_merge_result_new_indicator 表全表掃描,查看該表的表結(jié)有聯(lián)合索引。但是聯(lián)合索引范圍后會失效,于是打算新建一個聯(lián)合索引:
查看預(yù)新建聯(lián)合索引的字段選擇性:
結(jié)合選擇性來看:
create index idx_hmrni on h_merge_result_new_indicator(keyName,module,BATCH_NO);
創(chuàng)建后,再次查看執(zhí)行計劃依然無效:
查看表結(jié)構(gòu):
另外3個表結(jié)構(gòu)其中有2個utf8mb4,1個utf8:
字符集 utf8mb4 是 utf8 的超集,所以當(dāng)這兩個類型的字符串在做比較的時候,MySQL 內(nèi)部的操作是:先把 utf8 字符串轉(zhuǎn)成 utf8mb4 字符集,再做比較。
因此:
這部分會轉(zhuǎn)換后再與h_merge_result_new_indicator關(guān)聯(lián)。
優(yōu)化就只需要將字符集編碼轉(zhuǎn)為utf8再和h_merge_result_new_indicator關(guān)聯(lián)就能用上索引:
再看查詢只需要0.02秒了:
但是還有個問題,如上執(zhí)行計劃key_len是606 =(100*3+3)+(100*3+3)
也就是說,沒有用上BATCH_NO字段上的索引,我們知道索引少一個字段,占用會減少,不會太臃腫。因此,聯(lián)合索引只需要包含r(keyName,module):
drop index idx_hmrni on h_merge_result_new_indicator;
create index idx_hmrni on h_merge_result_new_indicator(keyName,module);
結(jié)論
對索引字段做函數(shù)操作,可能會破壞索引值的有序性,因此優(yōu)化器就決定放棄走樹搜索功能。該例子是隱式字符編碼轉(zhuǎn)換,它們都跟其他條件索引上使用函數(shù)一樣,因為要求在索引字段上做函數(shù)操作而導(dǎo)致了全索引掃描。
MySQL 的優(yōu)化器確實有“偷懶”的嫌疑,即使簡單地把 where id+1=1000 改寫成 where id=1000-1 就能夠用上索引快速查找,也不會主動做這個語句重寫。
保證在條件索引上不做破壞索引值的有序性,是優(yōu)化索引的利器。