大表分頁查詢非常慢，怎么辦？

作者：鴨血粉絲Tang 2022-07-28 07:49:29

本文主要圍繞大表分頁查詢性能問題，以及對應(yīng)的解決方案做了簡單的介紹。

一、問題復(fù)現(xiàn)

在實(shí)際的軟件系統(tǒng)開發(fā)過程中，隨著使用的用戶群體越來越多，表數(shù)據(jù)也會(huì)隨著時(shí)間的推移，單表的數(shù)據(jù)量會(huì)越來越大。

以訂單表為例，假如每天的訂單量在 4 萬左右，那么一個(gè)月的訂單量就是 120 多萬，一年就是 1400 多萬，隨著年數(shù)的增加和單日下單量的增加，訂單表的數(shù)據(jù)量會(huì)越來越龐大，訂單數(shù)據(jù)的查詢不會(huì)像最初那樣簡單快速，如果查詢關(guān)鍵字段沒有走索引，會(huì)直接影響到用戶體驗(yàn)，甚至?xí)绊懙椒?wù)是否能正常運(yùn)行！

下面我以某個(gè)電商系統(tǒng)的客戶表為例，數(shù)據(jù)庫是 Mysql，數(shù)據(jù)體量在 100 萬以上，詳細(xì)介紹分頁查詢下，不同階段的查詢效率情況（訂單表的情況也是類似的，只不過它的數(shù)據(jù)體量比客戶表更大）。

下面我們一起來測試一下，每次查詢客戶表時(shí)最多返回 100 條數(shù)據(jù)，不同的起始下，數(shù)據(jù)庫查詢性能的差異。

當(dāng)起點(diǎn)位置在 0 的時(shí)候，僅耗時(shí)：18 ms

當(dāng)起點(diǎn)位置在 1000 的時(shí)候，僅耗時(shí)：23 ms

當(dāng)起點(diǎn)位置在 10000 的時(shí)候，僅耗時(shí)：54 ms

當(dāng)起點(diǎn)位置在 100000 的時(shí)候，僅耗時(shí)：268 ms

當(dāng)起點(diǎn)位置在 500000 的時(shí)候，僅耗時(shí)：1.16 s

當(dāng)起點(diǎn)位置在 1000000 的時(shí)候，僅耗時(shí)：2.35 s

可以非常清晰的看出，隨著起點(diǎn)位置越大，分頁查詢效率成倍的下降，當(dāng)起點(diǎn)位置在 1000000 以上的時(shí)候，對于百萬級(jí)數(shù)據(jù)體量的單表，查詢耗時(shí)基本上以秒為單位。

而事實(shí)上，一般查詢耗時(shí)超過 1 秒的 SQL 都被稱為慢 SQL，有的公司運(yùn)維組要求的可能更加嚴(yán)格，比如小編我所在的公司，如果 SQL 的執(zhí)行耗時(shí)超過 0.2s，也被稱為慢 SQL，必須在限定的時(shí)間內(nèi)盡快優(yōu)化，不然可能會(huì)影響服務(wù)的正常運(yùn)行和用戶體驗(yàn)。

對于千萬級(jí)的單表數(shù)據(jù)查詢，小編我剛剛也使用了一下分頁查詢，起點(diǎn)位置在 10000000，也截圖給大家看看，查詢耗時(shí)結(jié)果：39 秒！

沒有接觸過這么大數(shù)據(jù)體量的同學(xué)，可能多少對這種查詢結(jié)果會(huì)感到吃驚，事實(shí)上，這還只是數(shù)據(jù)庫層面的耗時(shí)，還沒有算后端服務(wù)的處理鏈路時(shí)間，以及返回給前端的數(shù)據(jù)渲染時(shí)間，以百萬級(jí)的單表查詢?yōu)槔?，如果?shù)據(jù)庫查詢耗時(shí) 1 秒，再經(jīng)過后端的數(shù)據(jù)封裝處理，前端的數(shù)據(jù)渲染處理，以及網(wǎng)絡(luò)傳輸時(shí)間，沒有異常的情況下，差不多在 3～4 秒之間，可能有些同學(xué)對這個(gè)請求時(shí)長數(shù)值還不太敏感。

據(jù)互聯(lián)網(wǎng)軟件用戶體驗(yàn)報(bào)告，當(dāng)平均請求耗時(shí)在1秒之內(nèi)，用戶體驗(yàn)是最佳的，此時(shí)的軟件也是用戶留存度最高的；2 秒之內(nèi)，還勉強(qiáng)過的去，用戶能接受；當(dāng)超過 3 秒，體驗(yàn)會(huì)稍差；超過 5 秒，基本上會(huì)卸載當(dāng)前軟件。

有的公司為了提升用戶體驗(yàn)，會(huì)嚴(yán)格控制請求時(shí)長，當(dāng)請求時(shí)長超過 3 秒，自動(dòng)放棄請求，從而倒逼技術(shù)優(yōu)化調(diào)整 SQL 語句查詢邏輯，甚至調(diào)整后端整體架構(gòu)，比如引入緩存中間件 redis，搜索引擎 elasticSearch 等等。

繼續(xù)回到我們本文所需要探討的問題，當(dāng)單表數(shù)據(jù)量到達(dá)百萬級(jí)的時(shí)候，查詢效率急劇下降，如何優(yōu)化提升呢？

二、解決方案

下面我們一起來看看具體的解決辦法。

1. 方案一：查詢的時(shí)候，只返回主鍵 ID

我們繼續(xù)回到上文給大家介紹的客戶表查詢，將select *改成select id，簡化返回的字段，我們再來觀察一下查詢耗時(shí)。

當(dāng)起點(diǎn)位置在 100000 的時(shí)候，僅耗時(shí)：73 ms

當(dāng)起點(diǎn)位置在 500000 的時(shí)候，僅耗時(shí)：274 ms

當(dāng)起點(diǎn)位置在 1000000 的時(shí)候，僅耗時(shí)：471 ms

可以很清晰的看到，通過簡化返回的字段，可以很顯著的成倍提升查詢效率。

實(shí)際的操作思路就是先通過分頁查詢滿足條件的主鍵 ID，然后通過主鍵 ID 查詢部分?jǐn)?shù)據(jù)，可以顯著提升查詢效果。

-- 先分頁查詢滿足條件的主鍵ID
select id from bizuser order by id limit 100000,10;

-- 再通過分頁查詢返回的ID，批量查詢數(shù)據(jù)
select * from bizuser where id in (1,2,3,4,.....);

2. 方案二：查詢的時(shí)候，通過主鍵 ID 過濾

這種方案有一個(gè)要求就是主鍵ID，必須是數(shù)字類型，實(shí)踐的思路就是取上一次查詢結(jié)果的 ID 最大值，作為過濾條件，而且排序字段必須是主鍵 ID，不然分頁排序順序會(huì)錯(cuò)亂。

查詢 100000～1000100 區(qū)間段的數(shù)據(jù)，僅耗時(shí)：18 ms

查詢 500000～5000100 區(qū)間段的數(shù)據(jù)，僅耗時(shí)：18 ms

查詢 1000000～1000100 區(qū)間段的數(shù)據(jù)，僅耗時(shí)：18 ms

可以很清晰的看到，帶上主鍵 ID 作為過濾條件，查詢性能非常的穩(wěn)定，基本上在20 ms內(nèi)可以返回。

這種方案還是非?？尚械?，如果當(dāng)前業(yè)務(wù)對排序要求不多，可以采用這種方案，性能也非常杠！

但是如果當(dāng)前業(yè)務(wù)對排序有要求，比如通過客戶最后修改時(shí)間、客戶最后下單時(shí)間、客戶最后下單金額等字段來排序，那么上面介紹的【方案一】，比【方案二】查詢效率更高！

3. 方案三：采用 elasticSearch 作為搜索引擎

當(dāng)數(shù)據(jù)量越來越大的時(shí)候，尤其是出現(xiàn)分庫分表的數(shù)據(jù)庫，以上通過主鍵 ID 進(jìn)行過濾查詢，效果可能會(huì)不盡人意，例如訂單數(shù)據(jù)的查詢，這個(gè)時(shí)候比較好的解決辦法就是將訂單數(shù)據(jù)存儲(chǔ)到 elasticSearch 中，通過 elasticSearch 實(shí)現(xiàn)快速分頁和搜索，效果提升也是非常明顯。

關(guān)于 elasticSearch 的玩法，之前有給大家介紹過具體的實(shí)踐，這里不在過多撰書。