Oracle不共享體系結(jié)構(gòu)下并行處理的缺點
在Oracle不共享體系的結(jié)構(gòu)下并行處理像分布式數(shù)據(jù)庫的運作是一樣的。我們都知道每個節(jié)點都以其獨占方式來擁有其數(shù)據(jù)的分區(qū)。沒有其它任何節(jié)點可以訪問此數(shù)據(jù),而使節(jié)點成為單一的訪問點和故障點。
此方法具有一些基本缺點,無法解決今天高端環(huán)境對可伸縮性和高可用性要求:
(1)、首先,不共享方法在用于共享一切的SMP硬件時并不是最佳的。為了獲得并行處理的益處而要求對數(shù)據(jù)進(jìn)行物理分區(qū),在共享一切的SMP系統(tǒng)中很明顯是一種人工的、過時的要求。因為在SMP系統(tǒng)中每個處理器都可以對所有數(shù)據(jù)進(jìn)行直接的、等同的訪問。
(2)、其次,在不共享方法中使用嚴(yán)格的基于分區(qū)的并行處理策略,通常會導(dǎo)致不正常的資源利用。例如以下兩種情況:在沒有必要訪問表的所有分區(qū)時;或當(dāng)單一節(jié)點所擁有的更大的未分區(qū)表是操作的一部分時。在這些情況下,限制分區(qū)內(nèi)并行處理的緊密所有權(quán)模式,無法利用所有可用的處理能力,因而不能提供最佳的處理能力使用方案。
(3)、第三,由于具有對節(jié)點對應(yīng)物理數(shù)據(jù)分區(qū)的關(guān)系,不共享系統(tǒng)在適應(yīng)變化的業(yè)務(wù)需求方面一點都不靈活。當(dāng)業(yè)務(wù)增長時,無法方便地以增量方式擴充系統(tǒng)來適應(yīng)增長的業(yè)務(wù)需求??梢陨壦鞋F(xiàn)有的節(jié)點,保持它們對稱并避免數(shù)據(jù)重新分區(qū)。
在大多數(shù)情形下,升級所有節(jié)點費用太高;必須添加新節(jié)點并重組(進(jìn)行物理重新分區(qū))現(xiàn)有數(shù)據(jù)庫。一個不需要進(jìn)行任何重組的方案總是比必須重組的方案要更好,即使可以利用到最復(fù)雜的重組工具。
(4)、最后,由于使用嚴(yán)格的受限制的訪問模式,不共享系統(tǒng)無法完全利用群集系統(tǒng)為保證系統(tǒng)高可靠性所提供的潛在的容錯能力。
毫無疑問,基于使用靜態(tài)數(shù)據(jù)分布的Oracle不共享體系結(jié)構(gòu),大量的并行處理可以在實驗室條件下并行化和擴展。然而,在每個現(xiàn)實環(huán)境中,必須正確地解決上面談到的問題才能滿足今天高端關(guān)鍵任務(wù)要求。
Oracle數(shù)據(jù)庫并行處理技術(shù)之執(zhí)行時的動態(tài)并行——共享一切
使用Oracle 的動態(tài)并行處理框架,可以共享所有數(shù)據(jù)。并行化和將工作分成更小的單元的決策,并不受限于數(shù)據(jù)庫設(shè)置(創(chuàng)建)時所做的任何預(yù)先確定的靜態(tài)數(shù)據(jù)分布。
由于能夠為每個語句構(gòu)造不受限制的、優(yōu)化的數(shù)據(jù)子集,執(zhí)行時動態(tài)并行可以提供與不共享體系結(jié)構(gòu)等同的或甚至更好的可伸縮性。
每個查詢在訪問、連接和處理數(shù)據(jù)的不同部分時都有它自己的特征。因此,每個SQL語句在被解析時都要進(jìn)行優(yōu)化和并行化處理。數(shù)據(jù)更改時,如果有更加優(yōu)化的并行執(zhí)行計劃可用,或者系統(tǒng)中新添加了一個節(jié)點,那么Oracle可以自動適應(yīng)新的情況。這樣可為并行化任何種類的操作提供最高程度的靈活性:
(1)、在語句執(zhí)行前,對于每個查詢要求,會動態(tài)地優(yōu)化并行訪問的物理數(shù)據(jù)子集。
(2)、對于每個查詢,都會優(yōu)化其并行度。與不共享環(huán)境不同,不存在必需的最小并行度來調(diào)用所有節(jié)點訪問所有數(shù)據(jù),這是訪問所有數(shù)據(jù)的基礎(chǔ)要求。
(3)、操作可以根據(jù)當(dāng)前工作負(fù)載、特征和查詢的重要性,使用一個、一些或全部Real Application Cluster 節(jié)點并行運行。
只要語句得到優(yōu)化和并行化,就可以知道所有后續(xù)的并行子任務(wù)。原始進(jìn)程變?yōu)椴樵儏f(xié)調(diào)器;并行處理服務(wù)器(PX 服務(wù)器)從一個或多個節(jié)點上的并行處理服務(wù)器的公用緩沖池得到分配,并開始并行執(zhí)行該操作。
與不共享體系結(jié)構(gòu)相似,共享一切體系結(jié)構(gòu)中的每個并行處理服務(wù)器在其個人數(shù)據(jù)子集上獨立工作。數(shù)據(jù)或功能在并行進(jìn)程之間的傳送機制也與上述的Oracle不共享體系結(jié)構(gòu)相似或者相同。確定請求的并行計劃之后,每個并行處理服務(wù)器都知道其數(shù)據(jù)集和任務(wù),而進(jìn)程間通信就像在不共享環(huán)境中一樣很少。
然而,與Oracle不共享體系結(jié)構(gòu)不同,每個并行處理的SQL 語句不需要考慮任何物理數(shù)據(jù)庫布局限制就可以進(jìn)行優(yōu)化。這使得每個并行處理可以構(gòu)造最佳的數(shù)據(jù)子集,從而提供與純不共享體系結(jié)構(gòu)相比同等的,甚至在大多數(shù)情形下更好的可伸縮性和性能。只要有益,并行操作的后續(xù)步驟就會由一個并行處理服務(wù)器進(jìn)行組合和處理,從而減少數(shù)據(jù)傳送或功能傳送的需求。
【編輯推薦】