偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

如何在DB2中提高Insert性能

運(yùn)維 數(shù)據(jù)庫(kù)運(yùn)維 數(shù)據(jù)庫(kù)
本文向您介紹了在IBM DB2數(shù)據(jù)庫(kù)中優(yōu)化和提高Insert性能的一些方法、原理以及Insert的替代方案。

 INSERT處理過(guò)程概述

首先讓我們快速地看看insert一行時(shí)的處理步驟。這些步驟中的每一步都有優(yōu)化的潛力,對(duì)此我們?cè)诤竺鏁?huì)一一討論。

1、在客戶(hù)機(jī)準(zhǔn)備語(yǔ)句。對(duì)于動(dòng)態(tài)SQL,在語(yǔ)句執(zhí)行前就要做這一步,此處的性能是很重要的;對(duì)于靜態(tài)SQL,這一步的性能實(shí)際上關(guān)系不大,因?yàn)檎Z(yǔ)句的準(zhǔn)備是事先完成的。

2、在客戶(hù)機(jī),將要插入的行的各個(gè)列值組裝起來(lái),發(fā)送到DB2服務(wù)器。

3、DB2服務(wù)器確定將這一行插入到哪一頁(yè)中。

4、DB2在用于該頁(yè)的緩沖池中預(yù)留一個(gè)位置。如果DB2選定的是一個(gè)已有的頁(yè),那么就需要讀磁盤(pán);如果使用一個(gè)新頁(yè),則要在表空間(如果是SMS,也就是系統(tǒng)管理存儲(chǔ)的表空間)中為該頁(yè)物理地分配空間。插入了新行的每一頁(yè)最后都要從緩沖池寫(xiě)入到磁盤(pán)。

5、在目標(biāo)頁(yè)中對(duì)該行進(jìn)行格式化,并獲得該行上的一個(gè)X(exclusive,獨(dú)占的)行鎖。

6、將反映該insert的一條記錄寫(xiě)入到日志緩沖區(qū)中。

7、最后提交包含該insert的事務(wù),如果這時(shí)日志緩沖區(qū)中的記錄還沒(méi)有被寫(xiě)入日志文件的話(huà),則將這些記錄寫(xiě)到日志文件中。

此外,還可能發(fā)生很多類(lèi)型的附加處理,這取決于數(shù)據(jù)庫(kù)配置,例如,索引或觸發(fā)器的存在。這種額外的處理對(duì)于性能來(lái)說(shuō)也是意義重大的,我們?cè)诤竺鏁?huì)討論到。

INSERT的替代方案

在詳細(xì)討論insert的優(yōu)化之前,讓我們先考慮一下insert的兩種替代方案:load和import。import實(shí)用程序?qū)嶋H上是SQLINSERT的一個(gè)前端,但它的某些功能對(duì)于您來(lái)說(shuō)也是有用的。load也有一些有用的額外功能,但是我們使用load而不使用insert的主要原因是可以提高性能。

load直接格式化數(shù)據(jù)頁(yè),而避免了由于插入導(dǎo)致的對(duì)每一行進(jìn)行處理的大部分開(kāi)銷(xiāo)(例如,日志記錄在這里實(shí)際上是消除了)。而且,load可以更好地利用多處理器機(jī)器上的并行性。在V8load中有兩個(gè)新功能,它們對(duì)于load成為insert的替代方案有著特別的功效,這兩個(gè)功能是:從游標(biāo)裝載和從調(diào)用層接口(CLI)應(yīng)用程序裝載。

從游標(biāo)裝載

這種方法可用于應(yīng)用程序的程序代碼(通過(guò)db2LoadAPI),或用于DB2腳本。下面是后一種情況的一個(gè)例子:

declarestaffcursorcursorforselect*fromstaff;

loadfromstaffcursorofcursorinsertintomyschema.new_staff;

這兩行可以用下面一行替代:

insertintomyschema.new_staffselect*fromstaff

同等效的INSERT...SELECT語(yǔ)句相比,從游標(biāo)裝載幾乎可以提高20%的性能。

從CLI裝載

這種方法顯然只限于調(diào)用層接口(CLI)應(yīng)用程序,但是它非??臁_@種技巧非常類(lèi)似于數(shù)組插入,DB2附帶了這樣的示例,使用load時(shí)的速度是使用經(jīng)過(guò)完全優(yōu)化的數(shù)組插入時(shí)的兩倍,幾乎要比未經(jīng)優(yōu)化的數(shù)組插入快10倍。

所有INSERT可以改進(jìn)的地方

讓我們看看插入處理的一些必要步驟,以及我們可以用來(lái)優(yōu)化這些步驟的技巧。

1.語(yǔ)句準(zhǔn)備

作為一條SQL語(yǔ)句,INSERT語(yǔ)句在執(zhí)行之前必須由DB2進(jìn)行編譯。這一步驟可以自動(dòng)發(fā)生(例如在CLP中,或者在一次CLISQLExecDirect調(diào)用中),也可以顯式地進(jìn)行(例如,通過(guò)一條SQLPrepare、CLISQLPrepare或JDBCprepareStatement語(yǔ)句)。該編譯過(guò)程牽涉到授權(quán)檢查、優(yōu)化,以及將語(yǔ)句轉(zhuǎn)化為可執(zhí)行格式時(shí)所需的其他一些活動(dòng)。在編譯語(yǔ)句時(shí),語(yǔ)句的訪(fǎng)問(wèn)計(jì)劃被存儲(chǔ)在包緩存中。

如果重復(fù)地執(zhí)行相同的INSERT語(yǔ)句,則該語(yǔ)句的訪(fǎng)問(wèn)計(jì)劃(通常)會(huì)進(jìn)入到包緩存中,這樣就免除了編譯的開(kāi)銷(xiāo)。然而,如果insert語(yǔ)句對(duì)于每一行有不同的值,那么每一條語(yǔ)句都將被看成是惟一的,必須單獨(dú)地進(jìn)行編譯。因此,將像下面這樣的重復(fù)語(yǔ)句:

insertintomytablevalues(1,'abc')

insertintomytablevalues(2,'def')

換成帶有參數(shù)標(biāo)記的語(yǔ)句,一次準(zhǔn)備,重復(fù)執(zhí)行,這樣做是十分可取的:

insertintomytablevalues(?,?)

使用參數(shù)標(biāo)記可以讓一系列的insert的運(yùn)行速度提高數(shù)倍。(在靜態(tài)SQL程序中使用主機(jī)變量也可以獲得類(lèi)似的好處。)

2.發(fā)送列值到服務(wù)器

可以歸為這一類(lèi)的優(yōu)化技巧有好幾種。最重要的一種技巧是在每條insert語(yǔ)句中包括多行,這樣就可以避免對(duì)于每一行都進(jìn)行客戶(hù)機(jī)-服務(wù)器通信,同時(shí)也減少了DB2開(kāi)銷(xiāo)。可用于多行插入的技巧有:

在VALUES子句中包含多行的內(nèi)容。例如,下面的語(yǔ)句將插入三行:INSERTINTOmytableVALUES(1,'abc'),(2,'def'),(3,'ghi')

在CLI中使用數(shù)組插入(arrayinsert)。這需要準(zhǔn)備一條帶參數(shù)標(biāo)記的INSERT語(yǔ)句,定義一個(gè)用于存儲(chǔ)要插入的值的數(shù)組,將該數(shù)組綁定到參數(shù)標(biāo)記,以及對(duì)于每個(gè)數(shù)組中的一組內(nèi)容執(zhí)行一次insert。而且,示例程序sqllib/samples/cli/tbload.c提供了數(shù)組插入的基本框架(但是執(zhí)行的是CLILOAD)。從不使用數(shù)組改為使用包含100行的數(shù)組,可以將時(shí)間縮短大約2.5倍。所以應(yīng)該盡可能地使用包含至少100行的數(shù)組。

在JDBC中使用批處理操作。這跟CLI中的數(shù)組插入一樣,基于相同的概念,但是實(shí)現(xiàn)細(xì)節(jié)有所不同。當(dāng)通過(guò)prepareStatement方法準(zhǔn)備了insert語(yǔ)句之后,剩下的步驟是針對(duì)每一列調(diào)用適當(dāng)?shù)膕etXXXX方法(例如,setString或setInt),然后是addBatch。對(duì)于要插入的每一行,都要重復(fù)這些步驟,然后調(diào)用executeBatch來(lái)執(zhí)行插入。要查看這方面的例子,請(qǐng)參閱“參考資料”一節(jié)中的JDBCTutorial。

使用load將數(shù)據(jù)快速地裝入到一個(gè)staging表中,然后使用INSERT...SELECT填充主表。(通過(guò)這種方法節(jié)省下來(lái)的代價(jià)源于load的速度非常快,再加上INSERT...SELECT是在DB2內(nèi)(在服務(wù)器上)傳輸數(shù)據(jù)的,從而消除了通信上的代價(jià)。一般情況下我們不會(huì)使用這種方法,除非在INSERT...SELECT中還要另外做load無(wú)法完成的處理。

如果不可能在一條insert語(yǔ)句中傳遞多行,那么最好是將多條insert語(yǔ)句組成一組,將它們一起從客戶(hù)機(jī)傳遞到服務(wù)器。(不過(guò),這意味著每條insert都包含不同的值,都需要準(zhǔn)備,因而其性能實(shí)際上要比使用參數(shù)標(biāo)記情況下的性能更差一些。)將多條語(yǔ)句組合成一條語(yǔ)句可以通過(guò)CompoundSQL來(lái)實(shí)現(xiàn):

在SQL中,復(fù)合語(yǔ)句是通過(guò)BEGINATOMIC或BEGINCOMPOUND語(yǔ)句創(chuàng)建的。

在CLI中,復(fù)合語(yǔ)句可以通過(guò)SQLExecDirect和SQLExecute調(diào)用來(lái)建立。對(duì)于DB2V8FixPak4,另一種生成復(fù)合語(yǔ)句的方法是在(對(duì)一條預(yù)處理語(yǔ)句)發(fā)出多個(gè)SQLExecute調(diào)用之前設(shè)置語(yǔ)句屬性SQL_ATTR_CHAINING_BEGIN,并在調(diào)用之后設(shè)置語(yǔ)句屬性SQL_ATTR_CHAINING_END。

下面是關(guān)于該話(huà)題的其他一些建議:

如果可能的話(huà),讓客戶(hù)機(jī)與要存取的數(shù)據(jù)庫(kù)使用相同的代碼頁(yè),以避免在服務(wù)器上的轉(zhuǎn)換代價(jià)。數(shù)據(jù)庫(kù)的代碼頁(yè)可以通過(guò)運(yùn)行“getdbcfgfor”來(lái)確定。

在某些情況下,CLI會(huì)自動(dòng)執(zhí)行數(shù)據(jù)類(lèi)型轉(zhuǎn)換,但是這樣同時(shí)也會(huì)帶來(lái)看不見(jiàn)的(小小的)性能損耗。因此,盡量使插入值直接處于與相應(yīng)列對(duì)應(yīng)的格式。

將應(yīng)用程序中與插入相關(guān)的設(shè)置開(kāi)銷(xiāo)最小化。例如,當(dāng)在CLI中使用數(shù)組插入時(shí),對(duì)于整個(gè)一組插入,應(yīng)該盡量保證對(duì)于每一列只執(zhí)行一次SQLBindParameter,而不是對(duì)每一組數(shù)組內(nèi)容都執(zhí)行一次。對(duì)于個(gè)體來(lái)說(shuō),這些調(diào)用的代價(jià)并不高,但是這些代價(jià)是累積的。#p#

3.找到存儲(chǔ)行的地方

DB2使用三種算法中的一種來(lái)確定將行插入到哪里。(如果使用了多維群集(Multi-dimensionalClustering,MDC),則另當(dāng)別論,我們?cè)谶@里不予討論。)

缺省模式是,DB2搜索散布在表的各頁(yè)上的自由空間控制記錄(FreeSpaceControlRecords,F(xiàn)SCR),以找到有足夠自由空間存放新行的頁(yè)。顯然,如果每頁(yè)上的自由空間都比較少的話(huà),就要浪費(fèi)很多的搜索時(shí)間。為了應(yīng)付這一點(diǎn),DB2提供了DB2MAXFSCRSEARCH注冊(cè)表變量,以便允許將搜索范圍限制為少于缺省的5頁(yè)。

當(dāng)表是通過(guò)ALTERTABLE以APPEND模式放置時(shí),就要使用第二種算法。這樣就完全避免了FSCR搜索,因?yàn)橹恍韬?jiǎn)單地將行直接放到表的末尾。

當(dāng)表有群集索引(clusteringindex)時(shí),就要用到最后一種算法。在這種情況下,DB2試圖將每一行插入到有相似鍵值的一頁(yè)中。如果那一頁(yè)沒(méi)有空間了,DB2就會(huì)嘗試附近的頁(yè),如果附近的頁(yè)也沒(méi)有空間,DB2就進(jìn)行FSCR搜索。

如果只考慮插入時(shí)間的優(yōu)化,那么使用APPEND模式對(duì)于批量插入是最快的一種方法,但是這種方法的效果遠(yuǎn)不如我們這里討論的很多其他方法那么成效顯著。第二好的方法應(yīng)該是采用缺省算法,但是,如果在最佳環(huán)境中,更改DB2MAXFSCRSEARCH的值影響很小,而在一個(gè)I/O約束較少的環(huán)境中,這種更改所造成的影響就比較可觀了。

如果有群集索引,則對(duì)insert的性能會(huì)有很大的負(fù)面影響,這一點(diǎn)也不驚奇,因?yàn)槭褂萌杭饕哪康木褪峭ㄟ^(guò)在插入時(shí)做額外的工作來(lái)提高查詢(xún)(即select)性能的。如果的確需要群集索引,那么可以通過(guò)確保有足夠的自由空間來(lái)使其對(duì)插入的影響降至最?。菏褂肁LTERTABLE增加PCTFREE,然后使用REORG預(yù)留自由空間。不過(guò),如果允許太多自由空間的存在,則可能導(dǎo)致查詢(xún)時(shí)需要讀取額外的頁(yè),這反而大大違反了使用群集索引的本意。另一種選擇是,在批量插入之前先刪除群集索引,而后再重新創(chuàng)建群集索引,也許這是最優(yōu)的方法(創(chuàng)建群集索引的開(kāi)銷(xiāo)跟創(chuàng)建常規(guī)索引的開(kāi)銷(xiāo)差不多,都不是很大,只是在插入時(shí)有額外的開(kāi)銷(xiāo))。

4.緩沖池、I/O和頁(yè)清除

每一條insert在執(zhí)行時(shí),都是先將新行存儲(chǔ)在一個(gè)頁(yè)中,并最終將那個(gè)頁(yè)寫(xiě)到磁盤(pán)上。一旦像前面討論的那樣指定了頁(yè),那么在將行添加到該頁(yè)之前,該頁(yè)必須已經(jīng)在緩沖池中。對(duì)于批量插入,大部分頁(yè)都是最新指派給表的,因此讓我們關(guān)注一下對(duì)新頁(yè)的處理。

如果表在系統(tǒng)管理存儲(chǔ)的(SystemManagedStorage,SMS)表空間中,當(dāng)需要新頁(yè)時(shí),缺省情況下是從文件系統(tǒng)中分別為每一頁(yè)分配空間。但是,如果對(duì)數(shù)據(jù)庫(kù)運(yùn)行了db2empfa命令,那么每個(gè)SMS表空間就會(huì)為新頁(yè)一次性分配一個(gè)區(qū)段。我們建議運(yùn)行db2empfa命令,并使用32頁(yè)的區(qū)段。

對(duì)于數(shù)據(jù)庫(kù)管理的存儲(chǔ)(DatabaseManagedStorage,DMS)表空間,空間是在創(chuàng)建表空間時(shí)就預(yù)先分配的,但是頁(yè)的區(qū)段則是在插入處理過(guò)程中指派給表的。與SMS相比,DMS對(duì)空間的預(yù)分配可以提高大約20%的性能--使用DMS時(shí),更改區(qū)段大小并沒(méi)有明顯的效果。

如果表上有索引,則對(duì)于每個(gè)插入的行,都要添加一個(gè)條目到每條索引。這要求在緩沖池中存在適當(dāng)?shù)乃饕?yè)。晚些時(shí)候我們將討論索引的維護(hù),但是現(xiàn)在只需記住,插入時(shí)對(duì)緩沖池和I/O的考慮也類(lèi)似地適用于索引頁(yè),對(duì)于數(shù)據(jù)頁(yè)也是一樣。

隨著插入的進(jìn)行,越來(lái)越多的頁(yè)中將填入被插入的行,但是,DB2不要求在insert或Commit后將任何新插入的或更新后的數(shù)據(jù)或索引寫(xiě)入到磁盤(pán)。(這是由于DB2的writeahead日志記錄算法。但是有一個(gè)例外,這將在關(guān)于日志記錄的小節(jié)中論述到。)然而,這些頁(yè)需要在某一時(shí)刻寫(xiě)到磁盤(pán)上,這個(gè)時(shí)刻可能會(huì)在數(shù)據(jù)庫(kù)關(guān)閉時(shí)才會(huì)輪到。

一般來(lái)說(shuō),對(duì)于批量插入,您會(huì)希望積極地進(jìn)行異步頁(yè)清除(asynchronouspagecleaning),這樣在緩沖池中就總有可用于新頁(yè)的空余位置。頁(yè)清除率,或者說(shuō)總?cè)表?yè)率,可能導(dǎo)致計(jì)時(shí)上的很大不同,使得性能比較容易產(chǎn)生誤解。例如,如果使用100,000頁(yè)的緩沖池,并且不存在頁(yè)清除,則批量插入在結(jié)束前不會(huì)有任何新的或更改過(guò)的(“臟的”)頁(yè)寫(xiě)到磁盤(pán)上,但是隨后的操作(例如選擇,甚至乎關(guān)閉數(shù)據(jù)庫(kù))都將被大大推遲,因?yàn)檫@時(shí)有至多100,000個(gè)在插入時(shí)產(chǎn)生的臟頁(yè)要寫(xiě)到磁盤(pán)上。另一方面,如果在同一情況下進(jìn)行了積極的頁(yè)清除,則批量插入過(guò)程可能要花更長(zhǎng)的時(shí)間,但是此后緩沖池中的臟頁(yè)要少一些,從而使得隨后的任務(wù)執(zhí)行起來(lái)性能更佳。至于那些結(jié)果中到底哪個(gè)要更好些,我們并不是總能分得清,但是通常來(lái)說(shuō),將所有臟頁(yè)都存儲(chǔ)在緩沖池中是不可能的,所以為了取得最佳性能,采取有效的頁(yè)清除是有必要的。

為了盡可能好地進(jìn)行頁(yè)清除:

將CHNGPGS_THRESH數(shù)據(jù)庫(kù)配置參數(shù)的值從缺省的60減少到5這么低。這個(gè)參數(shù)決定緩沖池中臟頁(yè)的閾值百分比,當(dāng)臟頁(yè)達(dá)到這個(gè)百分比時(shí),就會(huì)啟動(dòng)頁(yè)清除。

嘗試啟用注冊(cè)表變量DB2_USE_ALTERNATE_PAGE_CLEANING(在DB2V8FixPak4中最新提供)。通過(guò)將這個(gè)變量設(shè)置成ON,可以為頁(yè)清除提供一種比缺省方法(基于CHNGPGS_THRESH和LSN間隙觸發(fā)器)更積極的方法。我沒(méi)有評(píng)測(cè)過(guò)其效果。請(qǐng)參閱FixPak4ReleaseNotes以了解這方面的信息。

確保NUM_IOCLEANERS數(shù)據(jù)庫(kù)配置參數(shù)的值至少等于數(shù)據(jù)庫(kù)中物理存儲(chǔ)設(shè)備的數(shù)量。

至于I/O本身,當(dāng)需要建立索引時(shí),可以通過(guò)使用盡可能大的緩沖池來(lái)將I/O活動(dòng)減至最少。如果不存在索引,則使用較大的緩沖池幫助不大,而只是推遲了I/O。也就是說(shuō),它允許所有新頁(yè)暫時(shí)安放在緩沖池中,但是最終仍需要將這些頁(yè)寫(xiě)到磁盤(pán)上。

當(dāng)發(fā)生將頁(yè)寫(xiě)到磁盤(pán)的I/O時(shí),通過(guò)一些常規(guī)的I/O調(diào)優(yōu)步驟可以加快這一過(guò)程,例如:

將表空間分布在多個(gè)容器(這些容器映射到不同磁盤(pán))。

盡可能使用最快的硬件和存儲(chǔ)管理配置,這包括磁盤(pán)和通道速度、寫(xiě)緩存以及并行寫(xiě)等因素。

避免RAID5(除非是與像Shark這樣有效的存儲(chǔ)設(shè)備一起使用)。#p#

5.鎖

缺省情況下,每一個(gè)插入的行之上都有一個(gè)X鎖,這個(gè)鎖是在該行創(chuàng)建時(shí)就開(kāi)始有的,一直到insert被提交。有兩個(gè)跟insert和鎖相關(guān)的性能問(wèn)題:

◆為獲得和釋放鎖而產(chǎn)生的CPU開(kāi)銷(xiāo)。

◆可能由于鎖沖突而導(dǎo)致的并發(fā)問(wèn)題。

對(duì)于經(jīng)過(guò)良好優(yōu)化的批量插入,由獲得每一行之上的一個(gè)X鎖以及后來(lái)釋放該鎖引起的CPU開(kāi)銷(xiāo)是比較可觀的。對(duì)于每個(gè)新行之上的鎖,惟一可以替代的是表鎖(DB2中沒(méi)有頁(yè)鎖)。當(dāng)使用表鎖時(shí),耗時(shí)減少了3%。有3種情況可以導(dǎo)致表鎖的使用,在討論表鎖的缺點(diǎn)之前,我們先用一點(diǎn)時(shí)間看看這3種情況:

運(yùn)行ALTERTABLELOCKSIZETABLE。這將導(dǎo)致DB2為隨后使用該表的所有SQL語(yǔ)句使用一個(gè)表鎖,直到locksize參數(shù)改回到ROW。

運(yùn)行LOCKTABLEINEXCLUSIVEMODE。這將導(dǎo)致表上立即上了一個(gè)X鎖。注意,在下一次提交(或回滾)的時(shí)候,這個(gè)表將被釋放,因此,如果您要運(yùn)行一個(gè)測(cè)試,測(cè)試中每N行提交一次,那么就需要在每次提交之后重復(fù)執(zhí)行LOCKTABLE。

使用缺省鎖,但是讓LOCKLIST和MAXLOCKS數(shù)據(jù)庫(kù)配置參數(shù)的值比較小。當(dāng)獲得少量的行鎖時(shí),行鎖就會(huì)自動(dòng)地逐漸升級(jí)為表鎖。

當(dāng)然,所有這些的缺點(diǎn)就在于并發(fā)的影響:如果表上有一個(gè)X鎖,那么其他應(yīng)用程序除非使用了隔離級(jí)別UR(未提交的讀),否則都不能訪(fǎng)問(wèn)該表。如果知道獨(dú)占訪(fǎng)問(wèn)不會(huì)導(dǎo)致問(wèn)題,那么就應(yīng)該盡量使用表鎖。但是,即使您堅(jiān)持使用行鎖,也應(yīng)記住,在批量插入期間,表中可能存在數(shù)千個(gè)有X鎖的新行,所以就可能與其他使用該表的應(yīng)用程序產(chǎn)生沖突。通過(guò)一些方法可以將這些沖突減至最少:

確保鎖的升級(jí)不會(huì)無(wú)故發(fā)生。您可能需要加大LOCKLIST和/或MAXLOCKS的值,以允許插入應(yīng)用程序有足夠的鎖。

對(duì)于其他的應(yīng)用程序,使用隔離級(jí)別UR。

對(duì)于V8FixPak4,或許也可以通過(guò)DB2_EVALUNCOMMITTED注冊(cè)表變量來(lái)減少鎖沖突:如果將該變量設(shè)置為YES,那么在很多情況下,只能獲得那些符合某個(gè)謂詞的行上的鎖,而并不是獲得被檢查的所有行上的鎖。

發(fā)出一個(gè)COMMIT命令以釋放鎖,因此如果更頻繁地提交的話(huà)就足以減輕鎖沖突的負(fù)擔(dān)。

注意

在V7中,存在涉及insert和鍵鎖的并發(fā)問(wèn)題,但是在V8中,由于提供了type-2索引,這些問(wèn)題實(shí)際上已經(jīng)不見(jiàn)了。如果要遷移到V8中來(lái),那么應(yīng)該確保使用帶CONVERT關(guān)鍵字的REORGINDEXES命令,以便將索引從type-1轉(zhuǎn)換為type-2。

在V7中,插入過(guò)程中可能使用W或NW鎖,但是在V8中只有在使用了type-1索引或者隔離級(jí)別為RR的情況下才會(huì)出現(xiàn)這兩種鎖。因此,應(yīng)盡可能避免這兩種情況。

一條insert所據(jù)有的鎖(通常是一個(gè)X鎖)通常不會(huì)受隔離級(jí)別的影響。例如,使用隔離級(jí)別UR不會(huì)阻止從插入的行上獲得鎖。然而,如果使用了INSERT...SELECT,則隔離級(jí)別將影響從SELECT獲得的鎖。#p#

6.日志記錄

缺省情況下,每條insert都會(huì)被記錄下來(lái),以用于恢復(fù)。日志記錄首先被寫(xiě)到內(nèi)存中的日志緩沖池,然后再寫(xiě)到日志文件,通常是在日志緩沖池已滿(mǎn)或者發(fā)生了一次提交時(shí)寫(xiě)到日志文件的。對(duì)批量插入的日志記錄的優(yōu)化實(shí)際上就是最小化日志記錄寫(xiě)的次數(shù),以及使寫(xiě)的速度盡可能快。

這里首先考慮的是日志緩沖池的大小,這由數(shù)據(jù)庫(kù)配置參數(shù)LOGBUFSZ來(lái)控制。該參數(shù)缺省值為8頁(yè)或32K,這與大多數(shù)批量插入所需的理想日志緩沖池大小相比要小些。舉個(gè)例子,對(duì)于一個(gè)批量插入,假設(shè)對(duì)于每一行的日志內(nèi)容有200字節(jié),則在插入了160行之后,日志緩沖池就將被填滿(mǎn)。如果要插入1000行,因?yàn)槿罩揪彌_池將被填滿(mǎn)幾次,再加上提交,所以大概有6次日志寫(xiě)。如果將LOGBUFSZ的值增加到64頁(yè)(256K)或者更大,緩沖池就不會(huì)被填滿(mǎn),這樣的話(huà)對(duì)于該批量插入就只有一次日志寫(xiě)(在提交時(shí))。通過(guò)使用更大的LOGBUFSZ可以獲得大約13%的性能提升。較大日志緩沖池的不利之處是,緊急事故恢復(fù)所花的時(shí)間可能要稍微長(zhǎng)一點(diǎn)。

減少日志寫(xiě)的另一種可能性是對(duì)新行要插入到的那個(gè)表使用“ALTERTABLEACTIVATENOTLOGGEDINITIALLY”(NLI)。如果這樣做了,那么在該工作單元內(nèi)不會(huì)記錄任何insert操作,但是這里存在兩個(gè)與NLI有關(guān)的重要問(wèn)題:

如果有一條語(yǔ)句失敗,那么這個(gè)表將被標(biāo)記為不可訪(fǎng)問(wèn)的,并且需要被刪除掉。這與其他恢復(fù)問(wèn)題(請(qǐng)參閱SQLReference關(guān)于CreateTable的討論)一起使得NLI在很多情況下不能成為可行的方法。

在工作單元最后進(jìn)行的提交,必須等到在此工作單元內(nèi)涉及的所有臟頁(yè)都被寫(xiě)到磁盤(pán)之后才能完成。這意味著這種提交要占用大量的時(shí)間。如果沒(méi)有積極地進(jìn)行頁(yè)清除,那么在使用NLI的情況下,Insert加上提交所耗費(fèi)的總時(shí)間要更長(zhǎng)一些。將NLI與積極的頁(yè)清除一起使用的時(shí)候,可以大大減少耗時(shí)。如果使用NLI,就要瞪大眼睛盯緊提交操作所耗費(fèi)的時(shí)間。

至于提高日志寫(xiě)的速度,有下面一些可能性:

將日志與新行所要插入到的表分別放在不同的磁盤(pán)上。

在操作系統(tǒng)層將日志分放到多個(gè)磁盤(pán)。

考慮為日志使用原始設(shè)備(rawdevice),但是要注意,這樣管理起來(lái)要更困難些。

避免使用RAID5,因?yàn)樗贿m合于寫(xiě)密集型(write-intensive)活動(dòng)。

7.提交

提交迫使將日志記錄寫(xiě)到磁盤(pán)上,以保證提交的插入肯定會(huì)存在于數(shù)據(jù)庫(kù)中,并且釋放新行上的鎖。這些都是有價(jià)值的活動(dòng),但是因?yàn)镃ommit總是要牽涉到同步I/O(對(duì)于日志),而insert則不會(huì),所以Commit的開(kāi)銷(xiāo)很容易高于insert的開(kāi)銷(xiāo)。因此,在進(jìn)行批量插入時(shí),每一行都提交一次的做法對(duì)于性能來(lái)說(shuō)是很糟糕的,所以應(yīng)確保不使用自動(dòng)提交(對(duì)于CLI和CLP來(lái)說(shuō)缺省情況正是如此)。建議大約每1000行提交一次:當(dāng)每1000行而不是一兩行提交一次時(shí),性能可以提高大概10倍。不過(guò),一次提交多于1000行只能節(jié)省少量的時(shí)間,但是一旦出現(xiàn)失敗,恢復(fù)起來(lái)所花的時(shí)間要更多。

對(duì)上述方法的一種修正:如果MINCOMMIT數(shù)據(jù)庫(kù)配置參數(shù)的值大于1(缺省值),則DB2就不必對(duì)每次commit都進(jìn)行一次同步I/O,而是等待,并試圖與一組事件一起共享日志I/O。對(duì)于某些環(huán)境來(lái)講,這樣做是有好處,但是對(duì)于批量插入常常沒(méi)有作用,甚至有負(fù)作用,因此,如果要執(zhí)行的關(guān)鍵任務(wù)是批量插入,就應(yīng)該讓MINCOMMIT的值保持為1。

可以選擇性地進(jìn)行改進(jìn)的地方

對(duì)于一次insert,有幾種類(lèi)型的處理將自動(dòng)發(fā)生。如果您的主要目標(biāo)只是減少插入時(shí)間,那么最簡(jiǎn)單的方法是避免所有這些處理的開(kāi)銷(xiāo),但是如果從總體上考慮的話(huà),這樣做未必值得。讓我們依次進(jìn)行討論。

索引維護(hù)

對(duì)于插入的每一行,必須添加一個(gè)條目到表上的每個(gè)索引中(包括任何主鍵索引)。這一過(guò)程主要有兩方面的代價(jià):

遍歷每個(gè)索引樹(shù),在樹(shù)的每一層搜索一個(gè)頁(yè),以確定新條目必須存儲(chǔ)在哪里(索引條目總是按鍵順序存儲(chǔ)的),這一過(guò)程所引起的CPU開(kāi)銷(xiāo);

將所有搜索到的頁(yè)讀入緩沖池,并最終將每個(gè)更新后的頁(yè)寫(xiě)到磁盤(pán)上的I/O開(kāi)銷(xiāo)。

更壞的場(chǎng)景是,在索引維護(hù)期間有大量的隨機(jī)I/O。假設(shè)要插入10,000行,在索引的緩沖池中有5000頁(yè),并且要插入的各行的鍵值隨機(jī)分布在整個(gè)鍵范圍內(nèi)。那么,有10,000個(gè)這么多的葉子頁(yè)(可能還有些非葉子頁(yè))需要進(jìn)入緩沖池,以便對(duì)它們進(jìn)行搜索和/或更新,對(duì)于一個(gè)給定的葉子頁(yè),它預(yù)先已經(jīng)在緩沖池中的概率只有10%。對(duì)于每次的insert,需要讀磁盤(pán)的概率如此之高,使得這種場(chǎng)景往往性能很差。

對(duì)于逐行插入,將新行添加到已有的索引中比起創(chuàng)建一個(gè)新索引來(lái)代價(jià)要高得多。如果是插入到一個(gè)空表,應(yīng)該總是在進(jìn)行了列插入之后創(chuàng)建索引。(注意,如果使用了load,則應(yīng)該預(yù)先創(chuàng)建索引。)如果要插入到一個(gè)已經(jīng)填充過(guò)的表,那么在列插入之前刪除索引,并在列插入之后重新創(chuàng)建索引,這種方法可能是最快的,但是只有在要插入相當(dāng)多的行--大概大于表的10-20%的時(shí)候,才能這么說(shuō)。如果為索引表空間使用較大的緩沖池,并且盡可能地將不同insert排序,以便鍵值是排好序的,而不是隨機(jī)的,就可以幫助加快索引維護(hù)。

【編輯推薦】

  1. 使用DB2必須了解的幾個(gè)知識(shí)點(diǎn)
  2. 淺談IBM DB2的數(shù)據(jù)庫(kù)備份與恢復(fù)
  3. DB2數(shù)據(jù)庫(kù)性能優(yōu)化技巧詳解
責(zé)任編輯:佚名 來(lái)源: 網(wǎng)絡(luò)轉(zhuǎn)載
相關(guān)推薦

2009-04-16 15:38:18

DB2IMPORT性能

2010-08-31 15:08:14

DB2INSERT優(yōu)化

2011-05-17 09:32:25

DB2

2010-07-29 15:34:37

IBM DB2

2010-08-05 15:17:43

DB2提高IMPORT

2011-03-16 14:16:05

DB2查詢(xún)

2011-03-21 09:51:04

DB2性能優(yōu)化

2010-08-06 13:45:11

DB2提高IMPORT

2010-07-28 14:07:51

DB2數(shù)據(jù)庫(kù)

2010-08-02 13:05:01

DB2應(yīng)用

2010-07-27 13:46:08

DB2提高IMPORT

2010-07-29 10:19:18

提高DB2 IMPOR

2010-08-18 09:42:11

DB2性能調(diào)優(yōu)

2010-09-06 15:00:40

DB2 9 XML

2010-08-18 09:26:56

DB2性能調(diào)優(yōu)

2010-08-03 09:59:30

DB2數(shù)據(jù)庫(kù)

2010-08-09 15:59:42

2022-10-27 08:00:00

數(shù)據(jù)庫(kù)分片數(shù)據(jù)庫(kù)系統(tǒng)分層分區(qū)

2010-08-17 17:29:06

DB2性能優(yōu)化

2009-01-03 14:43:55

ibmdwaIXI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)