一文讀懂一條查詢語句的宿命
select * from XXX where id=1;
這應(yīng)該是n年前入門mysql必用的查詢語句了吧,學(xué)如逆水行舟,不進(jìn)則退,這么久過去了,你知道這條語句在Mysql內(nèi)部的執(zhí)行過程嗎?
我們先來看看司空見慣的Mysql基本架構(gòu)示意圖
可以看到,Mysql可以分為
- Server層,包括連接器、查詢緩存、分析器、優(yōu)化器、執(zhí)行器等,除了直接落地到磁盤、和從磁盤提取數(shù)據(jù)外的所有能力。
- 存儲(chǔ)引擎層,負(fù)責(zé)了數(shù)據(jù)的讀取和存儲(chǔ),支持InnoDB、MyISAM、Memory等多個(gè)存儲(chǔ)引擎,默認(rèn)的是InnoBD。
結(jié)構(gòu)大概講完了,有沒有感覺,Mysql就像一個(gè)大型的加工廠,你把原材料,也就是sql語句放進(jìn)去,然后Mysql就轉(zhuǎn)動(dòng)起來,從頭到尾給你加工,最后得出一款產(chǎn)品,也就是執(zhí)行結(jié)果。
嗯,這個(gè)比喻好,確實(shí)他媽的像,那么這個(gè)加工廠具體做了啥呢?
連接器小妹妹
首先,我們都會(huì)使用連接命令連上mysql
mysql -hip-pport -u$user -p
這個(gè)時(shí)候,出來接待我們的就是連接器小妹妹了
連接器小妹妹負(fù)責(zé)跟我們進(jìn)行了典型的TPC握手,然后開始問我們的身份,要拿芝麻開門什么的密碼來驗(yàn)證我們是否有權(quán)限,如果賬戶或者密碼錯(cuò)誤了,則會(huì)直接跟我們說
"Access denied for user“
驗(yàn)證通過了,則我們和連接器的連接便成功簡(jiǎn)歷了,可以使用
show processlist
查看連接的狀態(tài)
其中Sleep狀態(tài)表明是空閑連接
連接建立后,連接器小妹妹還會(huì)告訴我們一些規(guī)則,比如
如果連接太長(zhǎng)時(shí)間沒動(dòng)靜,則會(huì)自動(dòng)將連接斷開,默認(rèn)是8個(gè)小時(shí)
如果連接被斷開了,等我嗎再次發(fā)送請(qǐng)求的時(shí)候,連接器小妹妹則會(huì)告訴我們
Lost connection to MySQL server during query
那么能改嗎?
可以的,只需要我們告訴連接器小妹妹,將wait_timeout的參數(shù)修改一下就可以了
聽起來都是長(zhǎng)連接,那么能進(jìn)行短連接嗎?
可以的,連接器小妹妹說了:
如果你們和我建立長(zhǎng)連接的話,連接成功后,你們后續(xù)有請(qǐng)求,都會(huì)一直使用同一個(gè)連接。但是如果是短連接,則每次執(zhí)行完很少的幾次操作后我就要就斷開連接了,下次再來你們?cè)俳⒁淮芜B接吧
我們也可以看到,其實(shí)和連接器小妹妹建立連接的過程是挺麻煩的,所以平常我們盡量會(huì)減少這個(gè)行為,一般都會(huì)使用長(zhǎng)連接。
但是啊,有時(shí)候用著用著,mysql這邊內(nèi)存漲的特別快,這是為什么呢?我特地問了連接器小妹妹,她告訴我
mysql在執(zhí)行過程中臨時(shí)使用的內(nèi)存是管理在連接對(duì)象里邊的,而這些對(duì)象只有在連接斷開的時(shí)候才釋放,所以內(nèi)存占用越來越大,最后有可能被系統(tǒng)強(qiáng)行干掉了,也就是OOM
丟,這么嚴(yán)重,那么我到底用長(zhǎng)連接還是短連接呢?
肯定是長(zhǎng)連接啦,別急,還是有解決辦法的,我們這邊給了兩個(gè)方案
- 定期斷開長(zhǎng)連接,使用一段時(shí)間,或者程序里面判斷執(zhí)行過一個(gè)占用內(nèi)存的大查詢后,斷開 連接,之后要查詢?cè)僦剡B。
- 如果你用的是MySQL 5.7或更新版本,可以在每次執(zhí)行一個(gè)比較大的操作后,通過執(zhí)行mysql_reset_connection來重新初始化連接資源。這個(gè)過程不需要重連和重新做權(quán)限驗(yàn)證, 但是會(huì)將連接恢復(fù)到剛剛創(chuàng)建完時(shí)的狀態(tài)。
到了這里,連接器小妹妹的活就干完了,后面出來接待我們的是緩存查詢小哥哥。
緩存查詢小哥哥
緩存查詢小哥哥也比較簡(jiǎn)單,一來就將我們的sql語句拿去做對(duì)比,他那邊有個(gè)字典,用key-value的格式記錄著查詢過的key和結(jié)果,而他的做法也極其簡(jiǎn)單,只要找到一樣的,則將結(jié)果給回我們了,只有當(dāng)找不到記錄,才會(huì)繼續(xù)走后面的流程,然后繼續(xù)記錄到字典內(nèi)。
這個(gè)時(shí)候,我就很疑惑了,如果實(shí)際上數(shù)據(jù)更新了,但是你的字典還是舊的怎么辦呢?
緩存查詢小哥哥說了,這個(gè)不用擔(dān)心,字典上會(huì)記錄著查詢記錄對(duì)應(yīng)的表,如果對(duì)應(yīng)的表有了更新,我這邊就會(huì)將記錄全部清空掉的。
哦,這樣子,那么如果是更新比較頻繁的情況,可能你的作用也不大哦哈哈哈
是的,你們可以通過
query_cache_type = DEMAND
將關(guān)閉掉的,而且在8.0開始,我已經(jīng)被移除啦。
說完緩存查詢小哥哥流下了悲傷的淚水,是啊,畢竟跟不上時(shí)代的技術(shù),被淘汰也是難免的。
緩存查詢小哥哥說完,便將另一位小哥叫了出來,這位小哥叫分析器。
分析器小哥哥
分析器小哥哥在拿到sql語句后,就開始自己搗鼓了起來,那么他具體做了啥呢?我們?cè)谂赃吙磽v鼓了很久,其實(shí)他就做了兩步
第一步,詞法分析,就是從SQL 語句中提取關(guān)鍵字,比如:查詢的表,字段名,查詢條件等等。
第二步,語法規(guī)則,就是判斷SQL語句是否合乎MySQL的語法。
通過分析器小哥哥做的事情,我也明白了,其實(shí)詞法分析就是將整個(gè)SQL語句拆分成一個(gè)個(gè)單詞,而語法規(guī)則則根據(jù)MySQL定義的語法規(guī)則生成對(duì)應(yīng)的數(shù)據(jù)結(jié)構(gòu),并存儲(chǔ)在對(duì)象結(jié)構(gòu)當(dāng)中。
舉個(gè)例子,假設(shè)有這樣一個(gè)SQL語句“select id from XXX”。
先通過詞法分析,從左到右逐個(gè)字符進(jìn)行解析
然后再通過語法規(guī)則解析,判斷輸入的SQL 語句是否滿足MySQL語法,并且生成語法樹,語法樹大概是這樣的
優(yōu)化器小姐姐
到了這里,優(yōu)化器小姐姐已經(jīng)知道我們要干嘛了 畢竟分析器小哥哥已經(jīng)幫他分析好了,只是可能我們的語句不夠優(yōu)美,所以才需要知心的優(yōu)化器小姐姐來做優(yōu)化。
知心小姐姐怎么做的呢?我們看到小姐姐先將SQL語法樹拿了出來,然后就開始工作了起來,不得不說,小姐姐工作的樣子是真的好看,那么她具體做了啥呢?
在全程圍觀的我們,看到了她大概做了兩件事
- 邏輯變化
- 代價(jià)優(yōu)化
邏輯變化是啥呢?邏輯變換就是在關(guān)系代數(shù)基礎(chǔ)上進(jìn)行變換,其目的是為了化簡(jiǎn),同時(shí)保證SQL變化前后的結(jié)果一致,也就是邏輯變化并不會(huì)帶來結(jié)果集的變化。
其主要包括以下幾個(gè)方面:
- 否定消除:針對(duì)表達(dá)式“和取”或“析取”前面出現(xiàn)“否定”的情況,應(yīng)將關(guān)系條件進(jìn)行拆分,從而將外層的“NOT”消除。
- 等值常量傳遞:利用了等值關(guān)系的傳遞特性,為了能夠盡早執(zhí)行“下推”運(yùn)算。“下推”的基本策略是,始終將過濾表達(dá)式盡可能移至靠近數(shù)據(jù)源的位置。
- 常量表達(dá)式計(jì)算:對(duì)于能立刻計(jì)算出結(jié)果的表達(dá)式,直接計(jì)算結(jié)果,同時(shí)將結(jié)果與其他條件盡量提前進(jìn)行化簡(jiǎn)。
總結(jié)下來就是替換和預(yù)處理啦。
代價(jià)優(yōu)化呢?代價(jià)優(yōu)化是用來確定每個(gè)表,根據(jù)條件是否應(yīng)用索引,應(yīng)用哪個(gè)索引和確定多表連接的順序等問題,為了完成代價(jià)優(yōu)化,需要找到一個(gè)代價(jià)最小的方案。
可以這說,我們要執(zhí)行的查詢都是通過代價(jià)優(yōu)化來計(jì)算出來的,最終得出了最小代價(jià)計(jì)劃去執(zhí)行。
優(yōu)化好后,接下來就是我們的執(zhí)行器大哥出馬了。
執(zhí)行器大哥
到了這一步,就要準(zhǔn)備執(zhí)行了,開始執(zhí)行的時(shí)候,執(zhí)行器大哥會(huì)一臉嚴(yán)肅的翻看他的權(quán)限寶典
查看我們是否有執(zhí)行查詢的權(quán)限,如果沒有,則會(huì)直接告訴我們
SELECT command denied to user 'root'@'localhost' for table 'XXX'
如果驗(yàn)證沒問題,他則會(huì)根據(jù)表的引擎信息,判斷要調(diào)用哪種引擎接口
例如SQL:select * from XXX where id=1;
假設(shè) “id“ 字段沒有設(shè)置索引,就會(huì)調(diào)用存儲(chǔ)引擎從第一條開始查,如果碰到了id是1, 就將結(jié)果集返回,沒有查找到就查看下一行,重復(fù)上一步的操作,直到讀完整個(gè)表或者找到對(duì)應(yīng)的記錄。
執(zhí)行器還畫了個(gè)草圖解釋了他一貫的執(zhí)行順序
最后
一條查詢命令到了這里就算結(jié)束了,大致介紹了查詢請(qǐng)求的執(zhí)行流程,引入了連接器、查詢緩存、分析器、優(yōu)化器、執(zhí)行器幾兄弟的分工合作,最后,我們?yōu)榧磳⑾У牟樵兙彺嫫鞯艿苣昼?.....
本文轉(zhuǎn)載自微信公眾號(hào)「稀飯下雪」