Oracle性能優(yōu)化之SQL優(yōu)化【上】
(1) 選擇最有效率的表名順序 (只在基于規(guī)則的優(yōu)化器 (Oracle 有兩種優(yōu)化器:RBO 基于規(guī)則的優(yōu)化器和 CBO 基于成本的優(yōu)化器) 中有效):
ORACLE 的解析器按照從右到左的順序處理 FROM 子句中的表名,F(xiàn)ROM 子句中寫在***的表 (基礎(chǔ)表 driving table) 將被***處理,在 FROM 子句中包含多個表的情況下, 你必須選擇記錄條數(shù)最少的表作為基礎(chǔ)表。如果有 3 個以上的表連接查詢, 那就需要選擇交叉表 (intersection table) 作為基礎(chǔ)表, 交叉表是指那個被其他表所引用的表。
(2) WHERE 子句中的連接順序.:
ORACLE 采用自下而上的順序解析 WHERE 子句,根據(jù)這個原理,表之間的連接必須寫在其他 WHERE 條件之前,那些可以過濾掉***數(shù)量記錄的條件必須寫在 WHERE 子句的末尾。
(3) SELECT 子句中避免使用 ‘ * ‘:
ORACLE 在解析的過程中, 會將’*’ 依次轉(zhuǎn)換成所有的列名, 這個工作是通過查詢數(shù)據(jù)字典完成的,這意味著將耗費更多的時間。
(4) 減少訪問數(shù)據(jù)庫的次數(shù):
ORACLE 在內(nèi)部執(zhí)行了許多工作: 解析 SQL 語句,估算索引的利用率,綁定變量,讀數(shù)據(jù)塊等;
(5) 在 SQL*Plus , SQL*Forms 和 Pro*C 中重新設(shè)置 ARRAYSIZE 參數(shù),可以增加每次數(shù)據(jù)庫訪問的檢索數(shù)據(jù)量, 建議值為 200。
(6) 使用 DECODE 函數(shù)來減少處理時間:
使用 DECODE 函數(shù)可以避免重復(fù)掃描相同記錄或重復(fù)連接相同的表。
(7) 整合簡單, 無關(guān)聯(lián)的數(shù)據(jù)庫訪問:
如果你有幾個簡單的數(shù)據(jù)庫查詢語句, 你可以把它們整合到一個查詢中 (即使它們之間沒有關(guān)系)
(8) 刪除重復(fù)記錄:
***效的刪除重復(fù)記錄方法 (因為使用了 ROWID) 例子:
DELETE FROM EMP E WHERE E.ROWID > (SELECT MIN(X.ROWID)
FROM EMP X WHERE X.EMP_NO = E.EMP_NO);
(9) 用 TRUNCATE 替代 DELETE:
當(dāng)刪除表中的記錄時,在通常情況下,回滾段 (rollback segments) 用來存放可以被恢復(fù)的信息。 如果你沒有 COMMIT 事務(wù), ORACLE 會將數(shù)據(jù)恢復(fù)到刪除之前的狀態(tài) (準(zhǔn)確地說是恢復(fù)到執(zhí)行刪除命令之前的狀況) 而當(dāng)運用 TRUNCATE 時, 回滾段不再存放任何可被恢復(fù)的信息。 當(dāng)命令運行后,數(shù)據(jù)不能被恢復(fù)。 因此很少的資源被調(diào)用,執(zhí)行時間也會很短. (譯者按: TRUNCATE 只在刪除全表適用, TRUNCATE 是 DDL 不是 DML)
(10) 盡量多使用 COMMIT:
只要有可能,在程序中盡量多使用 COMMIT,這樣程序的性能得到提高,需求也會因為 COMMIT 所釋放的資源而減少:
COMMIT 所釋放的資源:
a. 回滾段上用于恢復(fù)數(shù)據(jù)的信息
b. 被程序語句獲得的鎖
c. redo log buffer 中的空間
d. ORACLE 為管理上述 3 種資源中的內(nèi)部花費
(11) 用 Where 子句替換 HAVING 子句:
避免使用 HAVING 子句, HAVING 只會在檢索出所有記錄之后才對結(jié)果集進行過濾。這個處理需要排序,總計等操作。如果能通過 WHERE 子句限制記錄的數(shù)目,那就能減少這方面的開銷。(非 oracle 中)on、where、having 這三個都可以加條件的子句中,on 是***執(zhí)行,where 次之,having ***,因為 on 是先把不符合條件的記錄過濾后才進行統(tǒng)計,它就可以減少中間運算要處理的數(shù)據(jù),按理說應(yīng)該速度是最快的,where 也應(yīng)該比 having 快點的,因為它過濾數(shù)據(jù)后才進行 sum,在兩個表聯(lián)接時才用 on 的,所以在一個表的時候,就剩下 where 跟 having 比較了。在這單表查詢統(tǒng)計的情況下,如果要過濾的條件沒有涉及到要計算字段,那它們的結(jié)果是一樣的,只是 where 可以使用 rushmore 技術(shù),而 having 就不能,在速度上后者要慢如果要涉及到計算的字段,就表示在沒計算之前,這個字段的值是不確定的,根據(jù)上篇寫的工作流程,where 的作用時間是在計算之前就完成的,而 having 就是在計算后才起作用的,所以在這種情況下,兩者的結(jié)果會不同。在多表聯(lián)接查詢時,on 比 where 更早起作用。系統(tǒng)首先根據(jù)各個表之間的聯(lián)接條件,把多個表合成一個臨時表后,再由 where 進行過濾,然后再計算,計算完后再由 having 進行過濾。由此可見,要想過濾條件起到正確的作用,首先要明白這個條件應(yīng)該在什么時候起作用,然后再決定放在那里
(12) 減少對表的查詢:
在含有子查詢的 SQL 語句中, 要特別注意減少對表的查詢。 例子:
SELECT TAB_NAME FROM TABLES WHERE (TAB_NAME,DB_VER) = ( SELECT
TAB_NAME,DB_VER FROM TAB_COLUMNS WHERE VERSION = 604)
(13) 通過內(nèi)部函數(shù)提高 SQL 效率.:
復(fù)雜的 SQL 往往犧牲了執(zhí)行效率。 能夠掌握上面的運用函數(shù)解決問題的方法在實際工作中是非常有意義的
(14) 使用表的別名 (Alias):
當(dāng)在 SQL 語句中連接多個表時, 請使用表的別名并把別名前綴于每個 Column 上。這樣一來, 就可以減少解析的時間并減少那些由 Column 歧義引起的語法錯誤。
(15) 用 EXISTS 替代 IN、用 NOT EXISTS 替代 NOT IN:
在許多基于基礎(chǔ)表的查詢中, 為了滿足一個條件,往往需要對另一個表進行聯(lián)接. 在這種情況下,使用 EXISTS(或 NOT EXISTS) 通常將提高查詢的效率。 在子查詢中,NOT IN 子句將執(zhí)行一個內(nèi)部的排序和合并。 無論在哪種情況下,NOT IN 都是***效的 (因為它對子查詢中的表執(zhí)行了一個全表遍歷)。 為了避免使用 NOT IN,我們可以把它改寫成外連接 (Outer Joins) 或 NOT EXISTS.
例子:
(高效)SELECT * FROM EMP (基礎(chǔ)表) WHERE EMPNO > 0 AND EXISTS (SELECT ‘X’ FROM DEPT WHERE DEPT.DEPTNO = EMP.DEPTNO AND LOC = ‘MELB’)
(低效)SELECT * FROM EMP (基礎(chǔ)表) WHERE EMPNO > 0 AND DEPTNO IN(SELECT DEPTNO FROM DEPT WHERE LOC = ‘MELB’)
(16) 識別’低效執(zhí)行’的 SQL 語句:
雖然目前各種關(guān)于 SQL 優(yōu)化的圖形化工具層出不窮, 但是寫出自己的 SQL 工具來解決問題始終是一個***的方法:
SELECT EXECUTIONS , DISK_READS, BUFFER_GETS,
ROUND((BUFFER_GETS-DISK_READS)/BUFFER_GETS,2) Hit_radio,
ROUND(DISK_READS/EXECUTIONS,2) Reads_per_run,
SQL_TEXT
FROM V$SQLAREA
WHERE EXECUTIONS>0
AND BUFFER_GETS > 0
AND (BUFFER_GETS-DISK_READS)/BUFFER_GETS < 0.8
ORDER BY 4 DESC;
(17) 用索引提高效率:
索引是表的一個概念部分, 用來提高檢索數(shù)據(jù)的效率,ORACLE 使用了一個復(fù)雜的自平衡 B-tree 結(jié)構(gòu)。 通常, 通過索引查詢數(shù)據(jù)比全表掃描要快。 當(dāng) ORACLE 找出執(zhí)行查詢和 Update 語句的***路徑時, ORACLE 優(yōu)化器將使用索引。 同樣在聯(lián)結(jié)多個表時使用索引也可以提高效率。 另一個使用索引的好處是,它提供了主鍵 (primary key) 的唯一性驗證。那些 LONG 或 LONG RAW 數(shù)據(jù)類型,你可以索引幾乎所有的列。通常, 在大型表中使用索引特別有效。 當(dāng)然,你也會發(fā)現(xiàn), 在掃描小表時,使用索引同樣能提高效率。 雖然使用索引能得到查詢效率的提高, 但是我們也必須注意到它的代價。 索引需要空間來存儲, 也需要定期維護,每當(dāng)有記錄在表中增減或索引列被修改時, 索引本身也會被修改, 這意味著每條記錄的 INSERT , DELETE , UPDATE 將為此多付出 4 , 5 次的磁盤 I/O 。 因為索引需要額外的存儲空間和處理, 那些不必要的索引反而會使查詢反應(yīng)時間變慢。定期的重構(gòu)索引是有必要的:
ALTER INDEX REBUILD