MySQL索引之聚集索引
在MySQL里,聚集索引和非聚集索引分別是什么意思,有什么區(qū)別?
在MySQL中,InnoDB引擎表是(聚集)索引組織表(clustered index organize table),而MyISAM引擎表則是堆組織表(heap organize table)。
也有人把聚集索引稱(chēng)為聚簇索引。
當(dāng)然了,聚集索引的概念不是MySQL里特有的,其他數(shù)據(jù)庫(kù)系統(tǒng)也同樣有。
簡(jiǎn)言之,聚集索引是一種索引組織形式,索引的鍵值邏輯順序決定了表數(shù)據(jù)行的物理存儲(chǔ)順序,而非聚集索引則就是普通索引了,僅僅只是對(duì)數(shù)據(jù)列創(chuàng)建相應(yīng)的索引,不影響整個(gè)表的物理存儲(chǔ)順序。
我們先來(lái)看看兩種存儲(chǔ)形式的不同之處:
簡(jiǎn)單說(shuō),IOT表里數(shù)據(jù)物理存儲(chǔ)順序和主鍵索引的順序一致,所以如果新增數(shù)據(jù)是離散的,會(huì)導(dǎo)致數(shù)據(jù)塊趨于離散,而不是趨于順序。而HOT表數(shù)據(jù)寫(xiě)入的順序是按寫(xiě)入時(shí)間順序存儲(chǔ)的。
IOT表相比HOT表的優(yōu)勢(shì)是:
范圍查詢(xún)效率更高;
數(shù)據(jù)頻繁更新(聚集索引本身不更新)時(shí),更不容易產(chǎn)生碎片;
特別適合有一小部分熱點(diǎn)數(shù)據(jù)頻繁讀寫(xiě)的場(chǎng)景;
通過(guò)主鍵訪問(wèn)數(shù)據(jù)時(shí)快速可達(dá);
IOT表的不足則有:
數(shù)據(jù)變化如果是離散為主的話,那么效率會(huì)比HOT表差;
HOT表的不足有:
索引回表讀開(kāi)銷(xiāo)很大;
大部分?jǐn)?shù)據(jù)讀取時(shí)隨機(jī)的,無(wú)法保證被順序讀取,開(kāi)銷(xiāo)大;
每張InnoDB表只能創(chuàng)建一個(gè)聚集索引,聚集索引可以由一列或多列組成。
上面說(shuō)過(guò),InnoDB是聚集索引組織表,它的聚集索引選擇規(guī)則是這樣的:
首先選擇顯式定義的主鍵索引做為聚集索引;
如果沒(méi)有,則選擇***個(gè)不允許NULL的***索引;
還是沒(méi)有的話,就采用InnoDB引擎內(nèi)置的ROWID作為聚集索引;
我們來(lái)看看InnoDB主鍵索引的示意圖:
圖片來(lái)自高性能MySQL
可以看到,在這個(gè)索引結(jié)構(gòu)的葉子節(jié)點(diǎn)中,節(jié)點(diǎn)key值是主鍵的值,而節(jié)點(diǎn)的value則存儲(chǔ)其余列數(shù)據(jù),以及額外的ROWID、rollback pointer、trx id等信息。
結(jié)合這個(gè)圖,以及上面所述,我們可以知道:在InnoDB表中,其聚集索引相當(dāng)于整張表,而整張表也是聚集索引。主鍵必然是聚集索引,而聚集索引則未必是主鍵。
MyISAM是堆組織表,它沒(méi)有聚集索引的概念。