本文首先簡單介紹和數(shù)據(jù)庫復制有關(guān)的基本概念,然后探討Oracle8數(shù)據(jù)復制技術(shù)中的幾個重要模型,最后介紹Oracle8的數(shù)據(jù)復制管理器以及如何利用它來配置和維護復制環(huán)境。
在文章的開頭,我想首先簡單談一下復制的基本概念,也就是什么是復制?復制簡單地說就是在由兩個或者多個數(shù)據(jù)庫系統(tǒng)構(gòu)成的一個分布式數(shù)據(jù)庫環(huán)境中拷貝數(shù)據(jù)的過程。Oracle高級復制,也稱為對稱復制,第一次是在Oracle 7.1.6版本中出現(xiàn)的,在這之前的Oracle版本中,Oracle數(shù)據(jù)復制方法僅有只讀快照形式的基本復制一種方法。隨著Oracle版本的每一次升級,數(shù)據(jù)復制的功能、管理以及速度等方面都得到了很大的改進和完善。目前,由于對分布式數(shù)據(jù)環(huán)境需求的不斷增長,越來越多的應用提出了數(shù)據(jù)復制的需求。
一、基本概念
1.分布式數(shù)據(jù)庫技術(shù)
分布式數(shù)據(jù)庫技術(shù)是目前我們經(jīng)常提及的分布式計算的一個重要組成部分,該技術(shù)允許數(shù)據(jù)在多個服務器端共享。采用分布式數(shù)據(jù)庫技術(shù),一個本地服務器可以存取不同物理地點的遠程服務器上的數(shù)據(jù);也可以使所有的服務器均可以持有數(shù)據(jù)的拷貝/復制,這樣分布式系統(tǒng)中的所有服務器均可進行本地存取。
設(shè)計一個分布式計算解決方案首先需要考慮的問題就是應用的完整性、復雜性、性能和可用性以及響應時間等,同時還需要考慮的是對于不同的應用需求是采用實時存取遠程數(shù)據(jù)還是采用延遲存取遠程數(shù)據(jù)。這對于數(shù)據(jù)復制來講就是采取實時更新復制方案還是延遲數(shù)據(jù)復制方案。
2.同步和異步的概念
同步分發(fā)數(shù)據(jù)庫技術(shù)是一種實時遠程存取和實時更新數(shù)據(jù)的技術(shù)。這種技術(shù)可以保證應用的完整性降低了應用的復雜性,但是如果系統(tǒng)存在網(wǎng)絡(luò)存取速度很慢這樣的問題,相應響應時間就會很慢。
異步分發(fā)數(shù)據(jù)庫技術(shù)是一種延遲遠程存取和延遲傳播對數(shù)據(jù)更新的技術(shù)。這種技術(shù)具有很高的可用性和很短的響應時間。相比同步分發(fā)數(shù)據(jù)庫技術(shù)就顯得復雜一些,為了確保應用的完整性需要仔細考慮和設(shè)計。
對于實際的商業(yè)問題,必須權(quán)衡這兩種技術(shù)的利弊最終選擇最佳的解決方案,有些問題選用同步技術(shù)比較適合,也有一些問題采用異步技術(shù)是比較好的解決方案,還有一些問題必須綜合這兩種技術(shù)。
3.復制的概念
復制,顧名思義就是將數(shù)據(jù)庫中的數(shù)據(jù)拷貝到不同物理地點的數(shù)據(jù)庫中以支持分布式應用,它是整個分布式計算解決方案的一個重要組成部分。上面介紹了同步和異步的概念,這里針對復制也存在同步復制和異步復制的問題。
同步復制,復制數(shù)據(jù)在任何時間在任何復制節(jié)點均保持一致。如果復制環(huán)境中的任何一個節(jié)點的復制數(shù)據(jù)發(fā)生了更新操作,這種變化會立刻反映到其他所有的復制節(jié)點。這種技術(shù)適用于那些對于實時性要求較高的商業(yè)應用中。
異步復制,所有復制節(jié)點的數(shù)據(jù)在一定時間內(nèi)是不同步的。如果復制環(huán)境中的其中的一個節(jié)點的復制數(shù)據(jù)發(fā)生了更新操作,這種改變將在不同的事務中被傳播和應用到其他所有復制節(jié)點。這些不同的事務間可以間隔幾秒,幾分種,幾小時,也可以是幾天之后。復制節(jié)點之間的數(shù)據(jù)臨時是不同步的,但傳播最終將保證所有復制節(jié)點間的數(shù)據(jù)一致。
4.更新沖突
在異步復制環(huán)境中,對于所有應用最關(guān)鍵的就是要確保數(shù)據(jù)的一致性。我們來看下面這種情況會有什么后果發(fā)生呢?在同一時間對同一個表的同一行數(shù)據(jù)的同一列在兩個不同的地點作更新。這種情況就會發(fā)生稱之為更新沖突的錯誤。為保證數(shù)據(jù)的一致性,更新沖突必須被檢測到并且處理以確保在不同地點的數(shù)據(jù)元素保持同樣的值。更新沖突可以通過限制"所有權(quán)" 到單一節(jié)點或者將更新某個特定數(shù)據(jù)元素的權(quán)利限制到某一具體節(jié)點的方法來避免。
二、Oracle 8數(shù)據(jù)復制應用模型(usage models)
為確保實際應用數(shù)據(jù)的一致性,必須在異步復制應用模型中考慮沖突避免或者沖突檢測和消除的方法。例如,對于一個實際商業(yè)應用,首先必須在邏輯上了解該商業(yè)應用采取的沖突避免方法和在某個節(jié)點有那些數(shù)據(jù)以及這些數(shù)據(jù)中那些是可更新的,而那些又是不可更新的。在下面的這一部分中,我們首先將詳細討論兩種常用的沖突避免方法:主站點所有權(quán)模型和動態(tài)所有權(quán)模型。然后,討論共享所有權(quán)模型以及這種模型引起的沖突檢測和處理問題,最后,討論針對Fail-over的復制配置,這種復制方案同時考慮了沖突避免和沖突檢測與消除兩種情況。
1.主站點所有權(quán)
主站點所有權(quán),異步復制數(shù)據(jù)被一個單一節(jié)點"所有",這些要復制的數(shù)據(jù)僅能被該節(jié)點更新,其他節(jié)點向擁有該數(shù)據(jù)的主節(jié)點訂閱(subscribe)數(shù)據(jù),這意味著他們在本地系統(tǒng)上只能夠存取這些復制數(shù)據(jù)的只讀拷貝。下面是一些這樣的例子。
?。?)決策支持系統(tǒng)(DSS)的聯(lián)機事務處理數(shù)據(jù)的卸載。來自一個或者多個OLTP系統(tǒng)的數(shù)據(jù)可以被卸載到一個獨立的局部DSS中,用于只讀分析。
(2)中央信息的分發(fā)。產(chǎn)品信息,如價格列表等在總部節(jié)點上維護,然后將這些信息復制到遠程銷售辦事處的只讀產(chǎn)品目錄系統(tǒng)中。
?。?)遠程信息的集中。許多遠程節(jié)點上的產(chǎn)品目錄數(shù)據(jù)復制到總部節(jié)點,這里總部節(jié)點只需要有數(shù)據(jù)只讀的權(quán)限。
一個主節(jié)點擁有一個表的完全所有權(quán),而其他節(jié)點只能訂閱這個表的只讀拷貝。也可以是多個主節(jié)點擁有同一個表的截然不同子集或者劃分,而另一些節(jié)點則訂閱這些子集或者劃分的只讀拷貝。如,一個分布的產(chǎn)品目錄系統(tǒng)可以讓不同的銷售辦事處擁有一個表的屬于自己的一個"水平"部分,如在客戶(CUSTOMERS)表, 訂單(ORDERS)表和目錄(ITEMS)這些表中含有每個銷售辦事處為之服務的客戶和產(chǎn)品信息。中心總部節(jié)點可以通過訂閱每個辦事處擁有的數(shù)據(jù)來保持一個完整的所有產(chǎn)品和客戶信息的只讀拷貝。
2.動態(tài)所有權(quán)
動態(tài)所有權(quán),異步更新將復制數(shù)據(jù)從一個節(jié)點移到另一個節(jié)點,而在該過程中,必須保證在同一時刻只有一個特定的節(jié)點可以對數(shù)據(jù)進行更新。一個典型實際應用就是"海關(guān)訂單處理系統(tǒng)",訂單處理的典型步驟是,報關(guān)→同意→裝運→開單→收單→入帳等。應用模型可以執(zhí)行其中的任何步驟,但必須保證各個不同模塊的同一個數(shù)據(jù)應該在一個綜合數(shù)據(jù)庫中。在該系統(tǒng)中,當且僅當訂單的狀態(tài)表明前一個步驟已經(jīng)完成時,下一個應用模塊才可以執(zhí)行更新訂單數(shù)據(jù)的操作。例如,"裝運"應用模塊僅能在"報關(guān)"并且得到"同意"后才能被執(zhí)行。
通過使用動態(tài)所有權(quán)復制模型,可以將一個系統(tǒng)分布在多個節(jié)點和數(shù)據(jù)庫上,也就是說應用模型可以建立在不同的系統(tǒng)上。我們還是來看上面的例子,"報關(guān)"和"批準"這兩部分可以運行在一個系統(tǒng)上,"裝運"在另一個系統(tǒng)上,"開單"和"收單"等又可在一個系統(tǒng)上。在這個分布式系統(tǒng)中,數(shù)據(jù)可以被復制到不同的節(jié)點上,這些節(jié)點對復制的數(shù)據(jù)只要具有只讀的權(quán)限即可。如,利用復制,"報關(guān)"節(jié)點可以監(jiān)視已經(jīng)報關(guān)的訂單處理過程。
前面討論的主節(jié)點所有權(quán)和動態(tài)所有權(quán)復制模型具有一個共同的特征:在任何一個給定的時間點,只允許一個節(jié)點有更新數(shù)據(jù)的權(quán)利,而其余節(jié)點對于復制的數(shù)據(jù)拷貝僅有只讀權(quán)限。然而,還存在這樣的情況,允許多個節(jié)點可以更新同一個數(shù)據(jù),在極端情況下可以是在同一時刻,這就是所說的共享所有權(quán)。
3.共享所有權(quán)
共享所有權(quán)使用異步復制,這對于主節(jié)點和動態(tài)所有權(quán)模型來講存在一些限制。在共享所有權(quán)情況下,整個系統(tǒng)可以存在暫時的不一致,同時必須使用沖突檢測和消除。共享所有權(quán)模型相對于前面兩種模型具有一些新的特點。
例如,對于前面我們討論的那個采用具有水平劃分主節(jié)點復制方案來的分布式"訂單處理系統(tǒng)"的例子。采用共享所有權(quán)模型,每個銷售辦事處都有庫表中不同的水平劃分,該庫表含有每一個辦事處為之服務的一些訂單信息和與消費者有關(guān)的顧客信息。每一個銷售辦事處只輸入與自己有關(guān)的顧客訂單情況,而不管其余顧客信息。
然而,在實際商業(yè)應用中,這個模型不是最佳的選擇。例如,這種情況,一個零售集團在一個大城市中可以有好幾個商場。顧客可能經(jīng)常去離他們住的最近的那個商場,但是偶爾也可能到其他商場去購物。這時,如果多家商場執(zhí)行更新同一個顧客和其訂單數(shù)據(jù)的信息,更新沖突就會發(fā)生。所以在這種情況下必須要采用沖突檢測和消除方案。
Oracle8高級復制支持同時既考慮沖突避免又考慮沖突檢測和消除的復制模型。Oracle8高級復制之所以又稱為對稱復制,其原因之一就是支持對稱復制模型,也就是可以在任何地方更新,即所有的復制節(jié)點都可以進行更新處理。為了避免沖突,一種方法就是將應用設(shè)計為將更新限制在一些特定的節(jié)點。對于共享所有權(quán),Oracle 8提供了自動沖突檢測和消除方案。
4.備用數(shù)據(jù)庫(Fail-Over )
異步復制通過將一個主系統(tǒng)數(shù)據(jù)復制到另一系統(tǒng),可以起到對主系統(tǒng)的崩潰提供保護的作用,這也就是所說的fail-over系統(tǒng),如果主系統(tǒng)出現(xiàn)問題,業(yè)務依舊可以通過復制數(shù)據(jù)庫進行。
Oracle 8高級復制支持這種fail-over配置。同時,Oracle也針對fail-over提供了另外兩個可選的解決方案:Oracle并行服務器和備用數(shù)據(jù)庫配置。用戶可以根據(jù)吞吐量、可用性、事務損失的可能性和其他一些如數(shù)據(jù)一致性、方法的局限性等參考指標來權(quán)衡選擇合適的fail-over方案。
三、Oracle 高級復制配置
Oracle 8高級復制即可支持基于整個表的復制也可支持基于部分表的復制兩種復制方案。這兩種復制方案主要是通過Oracle的兩種復制機制來完成的,即多主復制和可更新快照復制,同時還可以將這兩種復制機制結(jié)合起來以滿足不斷變化的業(yè)務需求。
1.多主復制
多主復制方案支持全表在各個主節(jié)點間的對稱復制,允許所有主節(jié)點對主表都有更新操作的權(quán)利。任何一個主節(jié)點上的復制表的更新都會被傳播并被直接應用到其他所有主表。一個主節(jié)點出現(xiàn)問題,不會對其他主節(jié)點之間變化的傳播造成影響。
多主復制采用一種稱為"延遲遠程過程調(diào)用(deferred remote procedure calls RPCs)"的機制作為主要的傳播和應用變化的機制。各節(jié)點之間變化的傳播,既可以以基于事件的方式立即傳播,也可以在某個特定的時間點,如在網(wǎng)絡(luò)空閑時(如晚上)傳播。在傳播變化時,如果其中的一個遠端系統(tǒng)沒有準備好,傳播變化的延遲遠程過程調(diào)用(RPCs)就會保存在其本地隊列中,等到系統(tǒng)準備好以后再執(zhí)行。
2.可更新快照
Oracle 將最早Oracle 7上的只讀快照機制擴展為一種允許快照可更新的對稱復制機制??煺崭碌膫鞑シ绞胶腿绾螒玫娇煺罩鞴?jié)點采用了和多主復制一樣的延遲遠程過程調(diào)用機制。
對于快照的定義,既可以是包含一個主表的完全拷貝,也可以是為滿足基于值的選擇標準的主表中行的子集??煺赵谥鞴?jié)點的刷新是按照一定的時間間隔或用戶單獨請求進行的。最后一次刷新后主表的任何變化也同樣被傳播并應用到快照。多個快照的刷新是在一個一致的事務中完成的,這就確保了數(shù)據(jù)和引用的完整性。
3.混合配置
可以將多主復制和可更新快照復制結(jié)合在一起,構(gòu)成一種新的混合配置,這種配置可以完成對全表或者子表的復制。例如下面這種應用就是一個典型的混合配置方案,一個系統(tǒng)具有兩個位于不同地理區(qū)域的中心節(jié)點,這兩個不同的地理區(qū)域下面還有一些分支機構(gòu),兩個中心節(jié)點可以彼此看做是自己的備份節(jié)點。采用多主復制方法在兩個中心站點之間復制數(shù)據(jù),同時采用只讀或者可更新快照復制方法在每個區(qū)域范圍中的主節(jié)點之間復制全表或者子表。這種配置的一個顯著好處就是當其中的一個中心節(jié)點發(fā)生問題時,這些快照的主節(jié)點可以被重新定義到另一個運行良好的中心節(jié)點,從而提高了系統(tǒng)的可靠性。
4.其他復制機制
Oracle除了前面討論的三種復制機制以外,還提供了另外兩種復制機制:過程級復制和同步復制。
?。?)過程級復制
這種復制方案主要應用在存在大量數(shù)據(jù)更新以及采取批處理方式操作數(shù)據(jù)時需要復制數(shù)據(jù)的情況。例如,下面這個應用,一個以年為單位管理客戶訂單的公司,對于老的訂單數(shù)據(jù)不再需要在線保存,而需要卸載到某存儲介質(zhì)中。這時,如果在多個節(jié)點間復制每一獨立的行級變化效率將是非常低的。對于這種情況,可以直接在每個復制節(jié)點執(zhí)行一個過程來直接進行這種更新操作。Oralce8高級復制提供的分布式模式管理功能(將在下面詳細討論)可以非常方便地在多個節(jié)點上設(shè)置和維護過程級復制的遠程過程。
?。?)同步復制
一個采用同步復制方案的表發(fā)生變化時,Oracle會確保這種變化能夠成功地作用在本地表和其他節(jié)點的復制表,如果失敗則整個事務會被成功回滾。同步復制在網(wǎng)絡(luò)的穩(wěn)定性比較高的情況下是可行的,可以保證復制節(jié)點之間的復制數(shù)據(jù)一直保持同步。
四、Oracle 8管理工具
很顯然,有效的管理工具對于成功的分布式應用是非常關(guān)鍵的,如果沒有能力去操作它,再專業(yè)的復制功能也不能發(fā)揮很好的作用。Oracle 8高級復制提供了幾個功能強大的管理工具,諸如復制目錄,分布式模式管理以及其他的一些Oracle 復制管理工具。
1.復制目錄
復制目錄是一個包含定義復制環(huán)境原數(shù)據(jù)的一個單一綜合庫。復制目錄本身也被復制到多個節(jié)點以確保高可用性和授權(quán)用戶可以簡單地實現(xiàn)本地存取管理。
復制目錄定義了被復制的數(shù)據(jù)庫對象,復制的節(jié)點以及用于復制的機制。數(shù)據(jù)庫對象有需要復制的庫表和其他一些相關(guān)的對象,如索引,視圖,過程,觸發(fā)器和同義詞等等。這些原數(shù)據(jù)是開放的,用戶可以通過標準SQL語句進行檢索和查詢。
2.分布式模式管理
Oracle 8高級復制的分布式模式管理功能允許在一個控制點就可進行復制環(huán)境的定義和改變。對復制環(huán)境的任何改變,都將自動復制并且應用這些數(shù)據(jù)定義語言(DDL)命令到其他復制環(huán)境節(jié)點,同時也利用數(shù)據(jù)庫觸發(fā)器和復制相關(guān)過程自動生成復制所需要的一些支持對象。
分布式模式管理在一個被稱為主定義節(jié)點的地方進行控制。它自動將DDL推向其他所有主節(jié)點并且也允許快照節(jié)點"拉"回并且執(zhí)行這些DDL命令。由于主定義節(jié)點使用并且維護著整個復制目錄,該復制目錄本身也被復制到其他節(jié)點,所以該主定義節(jié)點一旦出現(xiàn)問題,就必須用其他節(jié)點來代替。分布式模式管理可以通過一個圖形用戶界面管理工具(GUI)來配置。
3.Oracle復制管理器
Oracle復制管理器是Oracle提供的一個圖形界面的復制管理工具,通過該工具可以配置,定時和通過一個節(jié)點來管理整個的復制環(huán)境。該管理工具可以單獨運行也可以在Oracle企業(yè)管理器中通過一個applet來激活。
采用Oracle復制管理器,用于復制的對象組可以通過一些鼠標操作非常簡單地定義。復制組可以包含表和其他相關(guān)的對象,如觸發(fā)器,存儲過程,索引,視圖,同義詞以及序列等。Oracle除了可以復制每個復制組的全部拷貝以外,還可以選擇復制數(shù)據(jù)的子集。復制組的配置可以在任何時候修改,這種變化將自動應用到其他所有的復制節(jié)點。
一旦定義了對象組,可以通過Oracle復制管理器,簡單進行拖拉操作,就可自動部署復制組到一個新的節(jié)點。這些快照節(jié)點既可以是只讀的也可以是可更新的。復制節(jié)點配置完成以后,用戶可以配置定時以使復制環(huán)境中的變化傳播到其他節(jié)點,當然也可以選擇采用同步復制。
4.選擇沖突解決方案
如果選擇采用一種可以在任何地方更新的復制方案,Oracle復制管理器提供了幾個內(nèi)建的沖突解決方案,諸如"最近時間戳"和"站點優(yōu)先"等來解決潛在的沖突。對于不同的表可以選擇不同的方法,甚至可以對一個表中的不同列選擇不同的沖突消除方案。用戶對于一些特殊的商業(yè)需求也可以創(chuàng)建自己的沖突解決方案。
5.實時管理
通過Oracle的復制管理器,復制環(huán)境中任何地方發(fā)生的錯誤均可以非??焖俸秃唵蔚胤蛛x出來并且改正。通過一個單一的節(jié)點,用戶就可以看到每個節(jié)點的延遲事務隊列,也可以重新定時或者強制立即執(zhí)行事務。另外,用戶也可以利用Oracle企業(yè)管理器的事件管理功能來對復制環(huán)境進行監(jiān)視,該事件管理器提供了對多個站點間的復制狀態(tài)的主動監(jiān)視功能,另外還提供了可以定義自動改正的選項等。
結(jié)論
和Oracle的其他功能不同,Oracle的高級復制不是即插即用的,用戶必須深刻理解它們是如何工作的以及各種復制方案的優(yōu)缺點。深刻理解復制的基本概念可以幫助你設(shè)計一個可靠的復制環(huán)境。