靈魂拷問,SQL 查詢語句先執(zhí)行 SELECT嗎?
大家好,我是狼王,一個(gè)愛打球的程序員
大家平時(shí)和SQL語句打交道的時(shí)間肯定不少,有寫過簡(jiǎn)單SQL的,也有為很復(fù)雜的業(yè)務(wù)邏輯的SQL絞盡腦汁的,那我在這里問下大家一個(gè)簡(jiǎn)單的問題:那你知道SQl語句的查詢順序是怎么樣的嗎?
當(dāng)我剛看到這個(gè)問題的時(shí)候,我的內(nèi)心是這樣的
這個(gè)問題應(yīng)該很好回答,畢竟自己已經(jīng)寫了無數(shù)個(gè) SQL 查詢語句了,有一些還很復(fù)雜的。還裝不了這個(gè)逼了??
但事實(shí)是,我仍然很難確切地說出它的順序是怎樣的。
好了,不調(diào)侃了,我們先來看下SELECT語句的完整語法:
- 1. SELECT
 - 2. DISTINCT <select_list>
 - 3. FROM <left_table>
 - 4. <join_type> JOIN <right_table>
 - 5. ON <join_condition>
 - 6. WHERE <where_condition>
 - 7. GROUP BY <group_by_list>
 - 8. HAVING <having_condition>
 - 9. ORDER BY <order_by_condition>
 - 10.LIMIT <limit_number>
 
然而其執(zhí)行順序卻是下面這樣的
- FROM
 - <表名> # 笛卡爾積
 - ON
 - <篩選條件> # 對(duì)笛卡爾積的虛表進(jìn)行篩選
 - JOIN <join, left join, right join...>
 - <join表> # 指定join,用于添加數(shù)據(jù)到on之后的虛表中,例如left join會(huì)將左表的剩余數(shù)據(jù)添加到虛表中
 - WHERE
 - <where條件> # 對(duì)上述虛表進(jìn)行篩選
 - GROUP BY
 - <分組條件> # 分組
 - <SUM()等聚合函數(shù)> # 用于having子句進(jìn)行判斷,在書寫上這類聚合函數(shù)是寫在having判斷里面的
 - HAVING
 - <分組篩選> # 對(duì)分組后的結(jié)果進(jìn)行聚合篩選
 - SELECT
 - <返回?cái)?shù)據(jù)列表> # 返回的單列必須在group by子句中,聚合函數(shù)除外
 - DISTINCT
 - # 數(shù)據(jù)除重
 - ORDER BY
 - <排序條件> # 排序
 - LIMIT
 - <行數(shù)限制>
 
其實(shí),sql引擎在執(zhí)行上述每一步時(shí),都會(huì)在內(nèi)存中形成一張?zhí)摂M表,然后對(duì)虛擬表進(jìn)行后續(xù)操作,并釋放沒用的虛擬表的內(nèi)存,以此類推。
具體過程如下:(下面“VT”表示 → 虛擬表 virtual )
- from:select * from table_1, table_2; 與 select * from table_1 join table_2; 的結(jié)果一致,都是表示求笛卡爾積;用于直接計(jì)算兩個(gè)表笛卡爾積,得到虛擬表VT1,這是所有select語句最先執(zhí)行的操作,其他操作是在這個(gè)表上進(jìn)行的,也就是from操作所完成的內(nèi)容
 - on: 從VT1表中篩選符合條件的數(shù)據(jù),形成VT2表;
 - join: 將該 join 類型的數(shù)據(jù)補(bǔ)充到VT2表中,例如 left join 會(huì)將左表的剩余數(shù)據(jù)添加到虛表VT2中,形成VT3表;若表的數(shù)量大于2,則會(huì)重復(fù)1-3步;
 - where: 執(zhí)行篩選,(不能使用聚合函數(shù))得到VT4表;
 - group by: 對(duì)VT4表進(jìn)行分組,得到VT5表;其后處理的語句,如select,having,所用到的列必須包含在group by條件中,沒有出現(xiàn)的需要用聚合函數(shù);
 - having: 篩選分組后的數(shù)據(jù),得到VT6表;
 - select: 返回列得到VT7表;
 - distinct: 用于去重得到VT8表;
 - order by: 用于排序得到VT9表;
 - limit: 返回需要的行數(shù),得到VT10;
 
需要注意的是:
group by條件中,每個(gè)列必須是有效列,不能是聚合函數(shù);
null值也會(huì)作為一個(gè)分組返回;
除了聚合函數(shù),select子句中的列必須在group by條件中;
上述內(nèi)容讓我們知道一個(gè)查詢會(huì)返回什么,同時(shí),也回答了以下這些問題:
- 可以在 GRROUP BY 之后使用 WHERE 嗎?(不行,GROUP BY 是在 WHERE 之后!)
 - 可以對(duì)窗口函數(shù)返回的結(jié)果進(jìn)行過濾嗎?(不行,窗口函數(shù)是 SELECT 語句里,而 SELECT 是在 WHERE 和 GROUP BY 之后)
 - 可以基于 GROUP BY 里的東西進(jìn)行 ORDER BY 嗎?(可以,ORDER BY 基本上是在最后執(zhí)行的,所以可以基于任何東西進(jìn)行 ORDER BY)
 - LIMIT 是在什么時(shí)候執(zhí)行?(在最后!)
 
但是,數(shù)據(jù)庫(kù)引擎并不一定嚴(yán)格按照這個(gè)順序執(zhí)行 SQL 查詢,因?yàn)闉榱烁斓貓?zhí)行查詢,它們會(huì)做出一些優(yōu)化,這些問題會(huì)在下方進(jìn)行解釋↓↓↓。
SQL中的別名會(huì)影響SQL執(zhí)行順序么?
如下方SQL所示:
- SELECT
 - CONCAT(first_name, ' ', last_name) AS full_name,
 - count(*)
 - FROM table
 - GROUP BY full_name
 
從這個(gè)語句來看,好像 GROUP BY 是在 SELECT 之后執(zhí)行的,因?yàn)樗昧?SELECT 中的一個(gè)別名。但實(shí)際上不一定要這樣,數(shù)據(jù)庫(kù)引擎會(huì)把查詢重寫成這樣:
- SELECT
 - CONCAT(first_name, ' ', last_name) AS full_name,
 - count(*)
 - FROM table
 - GROUP BY CONCAT(first_name, ' ', last_name)
 
所以,這樣 GROUP BY 仍然先執(zhí)行。
另外,數(shù)據(jù)庫(kù)引擎還會(huì)做一系列檢查,確保 SELECT 和 GROUP BY 中的東西是有效的,所以會(huì)在生成執(zhí)行計(jì)劃之前對(duì)查詢做一次整體檢查。
數(shù)據(jù)庫(kù)很可能不按正常順序執(zhí)行查詢(優(yōu)化)
在實(shí)際當(dāng)中,數(shù)據(jù)庫(kù)不一定會(huì)按照 JOIN、WHERE、GROUP BY 的順序來執(zhí)行查詢,因?yàn)樗鼈儠?huì)進(jìn)行一系列優(yōu)化,把執(zhí)行順序打亂,從而讓查詢執(zhí)行得更快,只要不改變查詢結(jié)果。
這個(gè)查詢說明了為什么需要以不同的順序執(zhí)行查詢:
- SELECT * FROM
 - dept d LEFT JOIN student s
 - ON d.student_id = s.id
 - WHERE s.name = '狼王'
 
如果只需要找出名字叫狼王學(xué)生信息,那就沒必要對(duì)兩張表的所有數(shù)據(jù)執(zhí)行左連接,在連接之前先進(jìn)行過濾,這樣查詢會(huì)快得多,而且對(duì)于這個(gè)查詢來說,先執(zhí)行過濾并不會(huì)改變查詢結(jié)果。
好了。今天就說到這了,我還會(huì)不斷分享自己的所學(xué)所想,希望我們一起走在成功的道路上!

















 
 
 








 
 
 
 