偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

MySQL查詢性能優(yōu)化前,必須先掌握MySQL索引理論

數(shù)據(jù)庫 MySQL
數(shù)據(jù)庫索引在平時的工作是必備的,怎么建好索引,怎么使用索引,可以提高數(shù)據(jù)的查詢效率。而且在面試過程,數(shù)據(jù)庫的索引也是必問的知識點。

數(shù)據(jù)庫索引在平時的工作是必備的,怎么建好索引,怎么使用索引,可以提高數(shù)據(jù)的查詢效率。而且在面試過程,數(shù)據(jù)庫的索引也是必問的知識點,比如:

索引底層結(jié)構(gòu)選型,那為什么選擇B+樹?

不同存儲引擎的索引的體現(xiàn)形式有哪些?

索引的類型

  • 組合索引存儲方式
  • 查詢方式
  • 最左前綴匹配原則

覆蓋索引是什么?

看著這些,能說出多少,理解多少呢?因此我們需要去探究其內(nèi)在原理。

那索引是什么?

索引的目的為了加速檢索數(shù)據(jù)而設(shè)計的一種分散存儲(索引常常很大,屬于硬盤級的東西,所以是分散存儲)的數(shù)據(jù)結(jié)構(gòu),其原理以空間換時間。

快速檢索的實現(xiàn)的本質(zhì)是數(shù)據(jù)結(jié)構(gòu),通過不同數(shù)據(jù)結(jié)構(gòu)的選擇,實現(xiàn)各種數(shù)據(jù)快速檢索,索引有哈希索引和B+樹索引。

索引底層結(jié)構(gòu)選型,那為什么選擇B+樹?

數(shù)據(jù)庫索引底層選型歸根到底就是為提高檢索效率,那么就需要考慮幾個問題:

  • 算法時間復(fù)雜度
  • 是否存在排序
  • 磁盤IO與預(yù)讀

NOTE: 考慮到磁盤IO是非常高昂的操作,計算機操作系統(tǒng)做了一些優(yōu)化,當(dāng)一次IO時,不光把當(dāng)前磁盤地址的數(shù)據(jù),而是把相鄰的數(shù)據(jù)也都讀取到內(nèi)存緩沖區(qū)內(nèi),因為局部預(yù)讀性原理告訴我們,當(dāng)計算機訪問一個地址的數(shù)據(jù)的時候,與其相鄰的數(shù)據(jù)也會很快被訪問到。每一次IO讀取的數(shù)據(jù)我們稱之為一頁(page)。

哈希表( Hash Table,散列表 )

哈希表是根據(jù)鍵(Key)而直接訪問在內(nèi)存存儲位置的數(shù)據(jù)結(jié)構(gòu)。

通過計算一個關(guān)于鍵值的函數(shù),將所需查詢的數(shù)據(jù)映射到表中一個位置來訪問記錄,這加快了查找速度。雖然查詢時間復(fù)雜度為O(1),但存在著碰撞問題,最壞情況會導(dǎo)致時間復(fù)雜急劇增加;

而且哈希表其只適合精準(zhǔn)key(等于)檢索,不適合范圍式檢索,范圍檢索就需要一次把所有數(shù)據(jù)找出來加載到內(nèi)存,沒有效率,因此不適合Mysql的底層索引的數(shù)據(jù)結(jié)構(gòu)。

普通的二叉查找樹

為了優(yōu)化高效范圍查詢,且時間復(fù)雜度小,引入二叉查找樹

二叉查找樹的時間復(fù)雜度是 O(lgn),由于數(shù)據(jù)已排序好了,所以范圍查詢是可以高效查詢,

但會存在的問題:左右子節(jié)點的深度可能相差很大,最極端的情況只有左子樹或者右子樹,此時查找的效率為O(n),檢索性能急劇下降,因此也不適合Mysql的底層索引的數(shù)據(jù)結(jié)構(gòu)。

 

平衡二叉樹(AVL樹)

為了優(yōu)化二叉樹左右子樹深度相差太大的問題,我們引入了平衡二叉樹,即左右子節(jié)點的深度差不超過1,平衡二叉樹看來好像適合,實現(xiàn)了:

  • 范圍查找、數(shù)據(jù)排序
  • 查詢性能良好O(logn)

NOTE:上圖中一個磁盤塊,代表硬盤上的一個存儲位置

但是我們還有一個最重要因素需要考慮,磁盤IO與預(yù)讀,且數(shù)據(jù)庫查詢數(shù)據(jù)的瓶頸在于磁盤 IO,使用平衡二叉樹根據(jù)索引進(jìn)行查找時,每讀一個磁盤塊就進(jìn)行一次IO,這樣沒有實現(xiàn)計算機的預(yù)讀能力,導(dǎo)致檢索效率下降,總結(jié)出平衡二叉樹作為索引的問題

  • 太深了(即它只有二條路),深度越大進(jìn)行的IO操作也就越多
  • 太小了,每一次IO才查詢磁盤塊這么一點數(shù)據(jù),太浪費IO了。操作系統(tǒng)規(guī)定一次IO最小4K,Mysql一次IO 16K,而圖上的磁盤塊能明顯達(dá)不到4K

B+樹

為了優(yōu)化磁盤IO和預(yù)讀,減少IO操作,條路太少了,那么換成多條路,那么會想到使用B樹和B+樹,但B樹每個節(jié)點限制最多存儲兩個 key,也會造成IO操作過于頻繁,因此優(yōu)化思路為:盡可能在一次磁盤 IO 中多讀一點數(shù)據(jù)到內(nèi)存,那么B+樹也該出場:

  • B+樹一個節(jié)點能存很多索引,且只有B+樹葉子節(jié)點存儲數(shù)據(jù)
  • 相鄰節(jié)點之間有一些前驅(qū)后繼關(guān)系
  • 葉子節(jié)點是順序排列的

相對于B樹,B+樹的優(yōu)勢有:

  • B+樹掃庫掃表的能力更強
  • B樹的數(shù)據(jù)是存放在每一個節(jié)點中的,節(jié)點所在的物理地址又是隨機的,所以掃表的話,進(jìn)行的是隨機IO
  • B+樹的數(shù)據(jù)是存放在葉子節(jié)點的,且在一個葉子節(jié)點中的數(shù)據(jù)是連續(xù)的,所以掃表的話,進(jìn)行的相對的順序IO
  • B+樹的磁盤讀寫能力更強,枝節(jié)點不保存數(shù)據(jù),而保存更多的關(guān)鍵字。一次IO就能讀出更多的關(guān)鍵字
  • B+樹的排序能力更強,B+樹的葉子節(jié)點存儲的數(shù)據(jù)是已經(jīng)排好序的

索引的體現(xiàn)形式

索引在不同的存儲引擎中體現(xiàn)形式步一樣, 最常見的是:

  • Innodb 引擎中體現(xiàn)為聚集索引方式 (索引和數(shù)據(jù)是存放在同一個文件的)
  • Myisam引擎中體現(xiàn)為非聚集索引方式 (索引和數(shù)據(jù)是存放在兩個文件中的)

聚集索引方式(InnoDB存儲引擎)

InnoDB存儲引擎中,索引和數(shù)據(jù)是存放在同一個文件的,屬于聚集索引 。而且InnoDB會自動建立好主鍵 ID 索引樹, 因此建表時要求必須指定主鍵的原因。

其中,主鍵索引(聚集索引)的葉子節(jié)點記錄了數(shù)據(jù),而不是數(shù)據(jù)的物理地址。輔助索引的葉子節(jié)點存放的是主鍵key。所以當(dāng)利用輔助索引查找數(shù)據(jù)時,實際上查了兩遍索引(輔助索引和主鍵索引):

  • 先查詢輔助索引樹找出主鍵
  • 然后在主鍵索引樹中根據(jù)主鍵查詢數(shù)據(jù)

非聚集索引方式(Myisam存儲引擎)

Myisam存儲引擎中,索引和數(shù)據(jù)是存放在兩個文件中的,屬于非聚集索引 。不管是主鍵索引還是輔助索引,其葉子節(jié)點都是記錄了數(shù)據(jù)的物理地址。

MySQL的索引類型

MySQL索引可以分為:

  • 普通索引(index): 加速查找

唯一索引:

  • 主鍵索引:primary key :加速查找+約束(不為空且唯一)
  • 唯一索引:unique:加速查找+約束 (唯一)

聯(lián)合索引:

  • primary key(id,name):聯(lián)合主鍵索引
  • unique(id,name):聯(lián)合唯一索引
  • index(id,name):聯(lián)合普通索引

全文索引full text :用于搜索很長一篇文章的時候,效果最好。

其中,主要理解一下聯(lián)合索引的問題,存儲結(jié)構(gòu),查詢方式。

聯(lián)合索引

聯(lián)合索引,多個列組成的索引叫做聯(lián)合索引,單列索引是特殊的聯(lián)合索引。其存儲結(jié)構(gòu)如下:

 

對于聯(lián)合索引來說其存儲結(jié)構(gòu)只不過比單值索引多了幾列,組合索引列數(shù)據(jù)都記錄在索引樹上,(不同的組合索引,B+樹也是不同的),且存儲引擎會首先根據(jù)第一個索引列排序后,其他列再依次將相等值的進(jìn)行排序。

NOTE:葉節(jié)點第一排,按順序排序好,第二列,會基于第一列排序好的,將第一列相等的再下一列再排序,依次類推。

聯(lián)合索引查詢方式,存儲引擎首先從根節(jié)點(一般常駐內(nèi)存)開始查找,然后再依次在其他列中查詢,直到找到該索引下的data元素即ID值,再從主鍵索引樹上找到最終數(shù)據(jù)。

而且聯(lián)合索引其選擇的原則:

  • 最左前綴匹配原則(經(jīng)常使用的列優(yōu)先)
  • 離散度高的列優(yōu)先
  • 寬度小的列優(yōu)先

最左前綴匹配原則

最左前綴匹配原則和聯(lián)合索引的索引構(gòu)建方式及存儲結(jié)構(gòu)是有關(guān)系的。根據(jù)上述理解分析,可以得出聯(lián)合索引只能從多列索引的第一列開始查找索引才會生效,比如:

  • 假設(shè)表user上有個聯(lián)合索引(a,b,c),那么 select * from user where b = 1 and c = 2將不會命中索引
  • 原因是聯(lián)合索引的是存儲引擎先按第一個字段排序,再按第二個字段排序,依次排序。

離散度

當(dāng)索引中的一列離散度過低時,優(yōu)化器可能直接不走索引,離散度計算方法:

  • 離散度 = 列中不重復(fù)的數(shù)據(jù)量 / 這一列的總數(shù)據(jù)量

覆蓋索引

如果一個索引包含(或覆蓋)所有需要查詢的字段的值,稱為覆蓋索,即只需掃描索引而無須回表查詢 。覆蓋索引可減少數(shù)據(jù)庫IO,將隨機IO變?yōu)轫樞騃O,可提高查詢性能。

對于InnoDB輔助索引在葉子節(jié)點中保存了行的主鍵值,所以如果輔助索引(包括聯(lián)合索引)能夠覆蓋查詢,則可以避免對主鍵索引的二次查詢。比如:

  1. --創(chuàng)建聯(lián)合索引 
  2. create index name_phone_idx on user(name,phoneNum); 
  3. --此時是覆蓋索引,原因是根據(jù)name來查,命中索引name_phone_idx, 
  4. --其關(guān)鍵字為name,phoneNum,本身就已經(jīng)包含了查詢的列。 
  5. select name,phoneNum where name = "張三";   
  6. --如果id為主鍵的話,此時也稱作覆蓋索引,原因:輔助索引的葉子節(jié)點存的就是主鍵 
  7. select id,name,phoneNum where name = "張三"

總結(jié)

MySQL的索引有很多知識點要掌握,已學(xué)習(xí)了索引的底層存儲結(jié)構(gòu),不同存儲引擎中的索引體現(xiàn),以及索引類型的基礎(chǔ)原理知識分析,可以為后續(xù)的數(shù)據(jù)庫優(yōu)化提供理論知識的支撐,也會更好的理解優(yōu)化方案。

責(zé)任編輯:未麗燕 來源: Ccww技術(shù)博客
相關(guān)推薦

2018-06-07 08:54:01

MySQL性能優(yōu)化索引

2024-09-19 08:09:37

MySQL索引數(shù)據(jù)庫

2010-02-25 16:29:01

Fedora NFS

2020-10-19 19:45:58

MySQL數(shù)據(jù)庫優(yōu)化

2019-05-08 14:02:52

MySQL索引查詢優(yōu)化數(shù)據(jù)庫

2018-10-09 09:42:27

MySQL優(yōu)化單表

2024-10-09 23:32:50

2020-04-24 09:26:15

RocketMQ分布式MetaQ

2010-06-12 15:31:04

MySQL查詢優(yōu)化

2024-04-12 08:28:38

優(yōu)化查詢語句PostgreSQL索引

2010-05-27 16:12:10

MySQL索引

2010-03-02 09:53:14

MySQL性能優(yōu)化

2020-03-23 15:15:57

MySQL性能優(yōu)化數(shù)據(jù)庫

2009-04-20 08:51:50

MySQL查詢優(yōu)化數(shù)據(jù)庫

2018-07-11 20:07:06

數(shù)據(jù)庫MySQL索引優(yōu)化

2024-04-17 12:58:15

MySQL索引數(shù)據(jù)庫

2021-01-06 05:45:58

Dubbo源碼高并發(fā)

2018-11-30 14:47:13

2011-04-25 09:11:15

2010-06-03 09:24:46

Oracle
點贊
收藏

51CTO技術(shù)棧公眾號