久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

異地容災(zāi)系統(tǒng)方案設(shè)計(jì)與分析

 冬日暖陽2024 2021-03-18

目 錄

第 1 章 容災(zāi)技術(shù)規(guī)范

1.1 容災(zāi)的總體規(guī)劃

1.1.1 技術(shù)指標(biāo) RPO,、RTO

1.1.2 國(guó)際標(biāo)準(zhǔn) SHARE 78

1.1.2.1 Tier0

1.1.2.2 Tier1

1.1.2.3 Tier2

1.1.2.4 Tier3

1.1.2.5 Tier4

1.1.2.6 Tier5

1.1.2.7 Tier6

1.1.3 界定災(zāi)備系統(tǒng)的適用范圍

1.1.4 界定災(zāi)備建設(shè)的目標(biāo)

1.1.5 界定災(zāi)備系統(tǒng)的總體架構(gòu)

第 2 章 主流容災(zāi)技術(shù)說明

2.1 數(shù)據(jù)備份

2.2 實(shí)時(shí)數(shù)據(jù)保護(hù)

2.2.1 數(shù)據(jù)鏡像(Mirroring)

2.2.2 數(shù)據(jù)復(fù)制(Replication)

2.2.2.1 軟件復(fù)制

2.2.2.2 硬件復(fù)制

2.2.2.3 數(shù)據(jù)庫(kù)復(fù)制

2.2.2.4 Datacore SDS

2.3 應(yīng)用系統(tǒng)恢復(fù)

2.4 網(wǎng)絡(luò)系統(tǒng)恢復(fù)

2.5 容災(zāi)切換過程 

2.6 消防演習(xí)

第 3 章 主流容災(zāi)技術(shù)分析與對(duì)比

3.1 數(shù)據(jù)備份

3.2 實(shí)時(shí)數(shù)據(jù)保護(hù)

3.2.1 數(shù)據(jù)鏡像(Mirroring)

3.2.1.1 硬件鏡像

3.2.1.2 軟件鏡像

3.2.1.3 軟件智能存儲(chǔ)鏡像

3.2.1.4 鏡像技術(shù)在容災(zāi)中的利用

3.2.2 數(shù)據(jù)復(fù)制(Replication)

3.2.2.1 軟件復(fù)制(卷復(fù)制)

3.2.2.2 硬件復(fù)制

3.2.2.3 基于軟件控制器的復(fù)制

3.2.2.4 數(shù)據(jù)庫(kù)復(fù)制

3.3 應(yīng)用系統(tǒng)恢復(fù)

3.4 網(wǎng)絡(luò)系統(tǒng)恢復(fù)

第 4 章 容災(zāi)系統(tǒng)設(shè)計(jì)步驟

4.1 第一步,深化數(shù)據(jù)備份系統(tǒng)

4.2 第二步,,存儲(chǔ),、應(yīng)用整合

4.2.1 存儲(chǔ)整合

4.2.2 應(yīng)用整合

4.3 第三步,實(shí)現(xiàn)遠(yuǎn)程實(shí)時(shí)數(shù)據(jù)卷保護(hù)

4.4 第四步,,建立遠(yuǎn)程切換消防演習(xí)機(jī)制

4.5 第五步,,建立遠(yuǎn)程切換機(jī)制

第 5 章 數(shù)據(jù)容災(zāi)的性能分析

5.1 同步數(shù)據(jù)容災(zāi)的性能分析

5.1.1 帶寬

5.1.2 距離

5.1.3 中間鏈路設(shè)備和協(xié)議轉(zhuǎn)換的時(shí)延

5.2 異步數(shù)據(jù)容災(zāi)的性能分析

第 1 章 容災(zāi)技術(shù)規(guī)范

作為風(fēng)險(xiǎn)防范系統(tǒng),災(zāi)備系統(tǒng)建設(shè)本身在總體規(guī)劃,、方案選擇和投產(chǎn)實(shí)施后的管理運(yùn)行,,以及真正面對(duì)災(zāi)難時(shí)的切換操作等方面也存在著潛在的風(fēng)險(xiǎn)。

計(jì)算機(jī)信息系統(tǒng)實(shí)現(xiàn)數(shù)據(jù)大集,、應(yīng)用大集中后,,系統(tǒng)的運(yùn)行安全成為風(fēng)險(xiǎn)控制的焦點(diǎn),。目前,已經(jīng)有多系統(tǒng)開始或準(zhǔn)備進(jìn)行災(zāi)備系統(tǒng)的建設(shè),,災(zāi)備系統(tǒng)建設(shè)的目標(biāo)是減災(zāi)容災(zāi),, 使計(jì)算機(jī)信息系統(tǒng)和數(shù)據(jù)能夠最大限度地防范和化解各種意外和災(zāi)害所帶來的風(fēng)險(xiǎn)。然而,,與大多數(shù)工程一樣,,災(zāi)備系統(tǒng)建設(shè)本身在總體規(guī)劃、方案選擇和投產(chǎn)實(shí)施后的管理運(yùn)行,,以及真正面對(duì)災(zāi)難時(shí)的切換操作等方面也存在著潛在的風(fēng)險(xiǎn),。

可以說,風(fēng)險(xiǎn)防范系統(tǒng)本身也存在風(fēng)險(xiǎn)點(diǎn),,需要小心應(yīng)對(duì),。

災(zāi)備系統(tǒng)建設(shè)中所涉及的潛在風(fēng)險(xiǎn)大致可分為技術(shù)風(fēng)險(xiǎn)、管理風(fēng)險(xiǎn)和投資風(fēng)險(xiǎn),,其中尤以技術(shù)選擇風(fēng)險(xiǎn)最大,,技術(shù)方案選擇優(yōu)越,可以規(guī)避一定的管理風(fēng)險(xiǎn)和投資風(fēng)險(xiǎn),。而這三者也存在內(nèi)在的相互關(guān)聯(lián),,不同災(zāi)備級(jí)別對(duì)應(yīng)的建設(shè)投資規(guī)模、所采用的技術(shù)以及實(shí)施和管理的復(fù)雜度也不同,,應(yīng)考慮保護(hù)計(jì)算機(jī)系統(tǒng)的原有投資并提高災(zāi)備系統(tǒng)建設(shè)投資的利用率,。

1.1 容災(zāi)的總體規(guī)劃

真正的容災(zāi)是數(shù)據(jù)被不間斷的一致性訪問!

在災(zāi)難備份的世界里,,是有等級(jí)觀念的,,級(jí)別不同,災(zāi)備系統(tǒng)所采用的技術(shù)和達(dá)到的功能是不同的,,在系統(tǒng)建設(shè)資金投入方面的差距也很巨大,。所以,對(duì)用戶來說,,明確災(zāi)備系統(tǒng)建設(shè)的總體規(guī)劃十分必要。

1.1.1 技術(shù)指標(biāo) RPO,、RTO

衡量容災(zāi)技術(shù)的兩個(gè)技術(shù)指標(biāo) RPO,、RTO 

RPO(Recovery Point Objective): 以數(shù)據(jù)為出發(fā)點(diǎn),主要指的是業(yè)務(wù)系統(tǒng)所能容忍的數(shù)據(jù)丟失量,。及在發(fā)生災(zāi)難,,容災(zāi)系統(tǒng)接替原生產(chǎn)系統(tǒng)運(yùn)行時(shí),容災(zāi)系統(tǒng)與原生產(chǎn)中心不一致的數(shù)據(jù)量,。RPO 是反映恢復(fù)數(shù)據(jù)完整性的指標(biāo),,在同步數(shù)據(jù)復(fù)制方式 下,,RPO 等于數(shù)據(jù)傳輸時(shí)延的時(shí)間;在異步數(shù)據(jù)復(fù)制方式下,,RPO 基本為異步傳輸數(shù)據(jù)排隊(duì)的時(shí)間,。在實(shí)際應(yīng)用中,考慮到數(shù)據(jù)傳輸因素,,業(yè)務(wù)數(shù)據(jù)庫(kù)與容災(zāi)備份數(shù)據(jù)庫(kù)的一致性(SCN)是不相同的,,RPO 表示業(yè)務(wù)數(shù)據(jù)與容災(zāi)備份數(shù)據(jù)的 SCN 的時(shí)間差。 發(fā)生災(zāi)難后,,啟動(dòng)容災(zāi)系統(tǒng)完成數(shù)據(jù)恢復(fù),,RPO 就是新恢復(fù)業(yè)務(wù)系統(tǒng)的數(shù)據(jù)損失量。

RTO(Recovery Time Objective):以應(yīng)用為出發(fā)點(diǎn),,即應(yīng)用的恢復(fù)時(shí)間目標(biāo),,主要指的是所能容忍的應(yīng)用停止服務(wù)的最長(zhǎng)時(shí)間, 也就是從災(zāi)難發(fā)生到業(yè)務(wù)系統(tǒng)恢復(fù)服務(wù)功能所需要的最短時(shí)間周期,。是反映業(yè)務(wù)恢復(fù)及時(shí)性的指標(biāo),,表示業(yè)務(wù)從中斷到恢復(fù)正常所需的時(shí)間。RTO 值越小,,代表容災(zāi)系統(tǒng)的數(shù)據(jù)恢復(fù)能力越強(qiáng),。各種容災(zāi)解決方案的 RTO 有較大差別,基于光通道技術(shù)的同步數(shù)據(jù)復(fù)制,,配合異地備用的業(yè)務(wù)系統(tǒng)和跨業(yè)務(wù)中心與備份中心的高可用管理,,這種容災(zāi)解決方案具有最小的 RTO。容災(zāi)系統(tǒng)為獲得最小的 RTO,,需要投入大量資金,。

不同容災(zāi)方案的 RTO 和 RPO 是不相同的。

1.1.2 國(guó)際標(biāo)準(zhǔn) SHARE 78

要建設(shè)容災(zāi)系統(tǒng),,就必須提出相應(yīng)的設(shè)計(jì)指標(biāo),,以此作為衡量和選擇容災(zāi)解決方案的參數(shù)。目前,,國(guó)際上通用的容災(zāi)系統(tǒng)的評(píng)審標(biāo)準(zhǔn)為 SHARE 78,,主要包括以下內(nèi)容。 

●備份/恢復(fù)的范圍 

●災(zāi)難恢復(fù)計(jì)劃的狀態(tài) 

●業(yè)務(wù)中心與容災(zāi)中心之間的距離 

●業(yè)務(wù)中心與容災(zāi)中心之間如何連接 

●數(shù)據(jù)是怎樣在兩個(gè)中心之間傳送的 

●允許有多少數(shù)據(jù)丟失 

●保證更新的數(shù)據(jù)在容災(zāi)中心被更新 

●容災(zāi)中心可以開始容災(zāi)進(jìn)程的能力 

SHARE 78 是建立容災(zāi)系統(tǒng)的一種評(píng)審標(biāo)準(zhǔn),。建立容災(zāi)系統(tǒng)的最終目的,,是為了在災(zāi)難發(fā)生后能夠以最快速度恢復(fù)數(shù)據(jù)服務(wù), 主要體現(xiàn)在 RTO Objective)和 RPO 上,。 SHARE 78, M028 報(bào)告中定義的災(zāi)備的七個(gè)級(jí)別和與其對(duì)應(yīng)的數(shù)據(jù)丟失量與恢復(fù)時(shí)間情況詳見下表:

圖片

1.1.2.1 Tier 0

Tier 0 - 無異地?cái)?shù)據(jù)備份(No off-site Data) 

Tier 0 被定義為沒有信息存儲(chǔ)的需求,,沒有建立備份硬件平臺(tái)的需求,也沒有發(fā)展應(yīng)急計(jì)劃的需求,,數(shù)據(jù)僅在本地進(jìn)行備份恢復(fù),, 沒有數(shù)據(jù)送往異地,。這種方式是最為低成本的災(zāi)難備份解決方案, 但事實(shí)上這種災(zāi)難備份并沒有真正災(zāi)難備份的能力,,因?yàn)樗臄?shù)據(jù)并沒有被送往遠(yuǎn)離本地的地方,,而數(shù)據(jù)的恢復(fù)也僅是利用本地的記錄。

1.1.2.2 Tier 1

Tier 1- PTAM 車輛轉(zhuǎn)送方式( Pickup Truck Access Method) 

作為 Tier 1 的災(zāi)難備份方案需要設(shè)計(jì)一個(gè)應(yīng)急方案,,能夠備份所需要的信息并將它存儲(chǔ)在異地,,然后根據(jù)災(zāi)難備份的具體需求,有選擇地建立備份平臺(tái),, 但事先并不提供數(shù)據(jù)處理的硬件平臺(tái),。 

PTAM 是一種用于許多中心備份的標(biāo)準(zhǔn)方式, 數(shù)據(jù)在完成寫操作之后,, 將會(huì)被送到遠(yuǎn)離本地的地方,,同時(shí)具備有數(shù)據(jù)恢復(fù)的程序。在災(zāi)難發(fā)生后,,一整套系統(tǒng)和應(yīng)用安裝動(dòng)作需要在一臺(tái)未啟動(dòng)的計(jì)算機(jī)上重新完成,。 系統(tǒng)和數(shù)據(jù)將被恢復(fù)并重新與網(wǎng)絡(luò)相連。這種災(zāi)難備份方案相對(duì)來說成本較低(僅僅需要傳輸工具的消耗以及存儲(chǔ)設(shè)備的消耗),。 但同時(shí)有難于管理的問題,,即很難知道什么樣的數(shù)據(jù)在什么樣的地方。一旦系統(tǒng)可以工作,,標(biāo)準(zhǔn)的做法是首先恢復(fù)關(guān)鍵應(yīng)用,,其余的應(yīng)用根據(jù)需要恢復(fù)。這樣的情況下,,恢復(fù)是可能的,,但需要一定的時(shí)間,同時(shí)依賴于什么時(shí)候硬件平臺(tái)能夠被提供準(zhǔn)備好,。

1.1.2.3 Tier 2

Tier 2 - PTAM 卡車轉(zhuǎn)送方式+熱備份中心 (PTAM+Hot Site) 

Tier 2 相當(dāng)于是 Tier 1 再加上具有熱備份能力中心的災(zāi)難備份,。熱備份中心擁有足夠的硬件和網(wǎng)絡(luò)設(shè)備去支持關(guān)鍵應(yīng)用的安裝需求。對(duì)于十分關(guān)鍵的應(yīng)用,,在災(zāi)難發(fā)生的同時(shí),,必須在異地有正運(yùn)行著的硬件平臺(tái)提供支持。這種災(zāi)難備份的方式依賴于用 PTAM 的方法去將日常數(shù)據(jù)放在異地存儲(chǔ),,當(dāng)災(zāi)難發(fā)生的時(shí)候,,數(shù)據(jù)再被移動(dòng)到一個(gè)熱備份的中心。雖然移動(dòng)數(shù)據(jù)到一個(gè)熱備份中心增加了成本,,但卻明顯降低了災(zāi)難備份的時(shí)間。

1.1.2.4 Tier 3

Tier 3 - 電子傳送(Electronic Vaulting)

Tier 3 是在 Tier 2 的基礎(chǔ)上用電子鏈路取代了車輛進(jìn)行數(shù)據(jù)傳送的災(zāi)難備份,。接收方的硬件平臺(tái)必須與生產(chǎn)中心物理地相分離,,在災(zāi)難發(fā)生后,,存儲(chǔ)的數(shù)據(jù)用于災(zāi)難備份。由于熱備份中心要保持持續(xù)運(yùn)行,,因此增加了成本,。但確實(shí)是消除了運(yùn)送工具的需要,提高了災(zāi)難備份的速度,。

1.1.2.5 Tier 4

Tier 4 - 活動(dòng)狀態(tài)的備份中心 (Active Secondary Site) 

Tier 4 這種災(zāi)難備份要求兩個(gè)中心同時(shí)處于活動(dòng)狀態(tài)并管理彼此的備份數(shù)據(jù),,允許備份行動(dòng)在任何一個(gè)方向發(fā)生。 接收方硬件平臺(tái)必須保證與另一方平臺(tái)物理地相分離,,在這種情況下,,工作負(fù)載可以在兩個(gè)中心之間被分擔(dān),兩個(gè)中心之間之間彼此備份,。在兩個(gè)中心之間,,彼此的在線關(guān)鍵數(shù)據(jù)的拷貝不停地相互傳送著。在災(zāi)難發(fā)生時(shí),,需要的關(guān)鍵數(shù)據(jù)通過網(wǎng)絡(luò)可迅速恢復(fù),,通過網(wǎng)絡(luò)的切換,關(guān)鍵應(yīng)用的恢復(fù)時(shí)間也可降低到了小時(shí)級(jí),。

1.1.2.6 Tier 5

Tier 5 - 兩中心兩階段確認(rèn) (Two-Site Two-Phase Commit) 

Tier 5 是在 Tier 4 的基礎(chǔ)上在鏡像狀態(tài)上管理著被選擇的數(shù)據(jù) (根據(jù)單一 commit 范圍,,在本地和遠(yuǎn)程數(shù)據(jù)庫(kù)中同時(shí)更新著數(shù)據(jù)),也就是說,,在更新請(qǐng)求被認(rèn)為是滿意之前,,Tier 5 需要生產(chǎn)中心與備份中心的數(shù)據(jù)都被更新。我們可以想象這樣一種情景,,數(shù)據(jù)在兩個(gè)中心之間相互映像,,由遠(yuǎn)程 two-phase commit 來同步,因?yàn)殛P(guān)鍵應(yīng)用使用了雙重在線存儲(chǔ),,所以在災(zāi)難發(fā)生時(shí),,僅僅傳送中的數(shù)據(jù)被丟失,恢復(fù)的時(shí)間被降低到了小時(shí)級(jí),。

1.1.2.7 Tier 6

Tier 6 - 零數(shù)據(jù)丟失 (Zero Data Loss) Tier 6 可以實(shí)現(xiàn)零數(shù)據(jù)丟失率,,同時(shí)保證數(shù)據(jù)立即自動(dòng)地被傳輸?shù)絺浞葜行摹?Tier 6 被認(rèn)為是災(zāi)難備份的最高的級(jí)別,在本地和遠(yuǎn)程的所有數(shù)據(jù)被更新的同時(shí),,利用了雙重在線存儲(chǔ)和完全的網(wǎng)絡(luò)切換能力,。Tier 6 是災(zāi)難備份中最昂貴的方式,也是速度最快的恢復(fù)方式,,恢復(fù)的時(shí)間被降低到了分鐘級(jí),。對(duì)于 Tier 6 的災(zāi)難備份解決方案,可以應(yīng)用兩種遠(yuǎn)程拷貝技術(shù)來實(shí)現(xiàn),即 PPRC 同步遠(yuǎn)程拷貝和 XRC 異步遠(yuǎn)程拷貝,。

因此,,企業(yè)需要根據(jù)其計(jì)算機(jī)處理系統(tǒng)中數(shù)據(jù)的重要性,以及需要恢復(fù)的速度和程度,,來進(jìn)行災(zāi)備系統(tǒng)建設(shè)的整體考慮和不同災(zāi)難對(duì)業(yè)務(wù)沖擊的分析,,并最終確定災(zāi)備系統(tǒng)建設(shè)的總體規(guī)劃。 

災(zāi)備系統(tǒng)建設(shè)的總體規(guī)劃應(yīng)包括以下幾個(gè)方面:

1.1.3 界定災(zāi)備系統(tǒng)的適用范圍

分析不同的應(yīng)用系統(tǒng),,確定災(zāi)備系統(tǒng)是一個(gè)覆蓋整個(gè)計(jì)算機(jī)系統(tǒng)的工程,,根據(jù)業(yè)務(wù)的重要性, 對(duì)不同的系統(tǒng)采用不同級(jí)別的容災(zāi)方案,,如針對(duì)關(guān)鍵的業(yè)務(wù)應(yīng)用子系統(tǒng),,實(shí)施高級(jí)別的容災(zāi)工程;對(duì)低級(jí)別的業(yè)務(wù)系統(tǒng),,實(shí)施低級(jí)別的容災(zāi)工程,。總之要建立一個(gè)綜合性的整體災(zāi)備建設(shè)工程,。

1.1.4 界定災(zāi)備建設(shè)的目標(biāo)

生產(chǎn)系統(tǒng)在單位時(shí)間內(nèi)的數(shù)據(jù)處理能力或 IO 流量確定的情況下,,RPO 實(shí)際上成 為一個(gè)反映災(zāi)備恢復(fù)過程中的數(shù)據(jù)丟失量的指標(biāo)。而 RTO 則是指從災(zāi)難發(fā)生到備份系 統(tǒng)可以接管原有生產(chǎn)系統(tǒng)所需要花費(fèi)的時(shí)間,,這不僅要考慮數(shù)據(jù)的恢復(fù)時(shí)間,,還應(yīng)該考慮恢復(fù)后數(shù)據(jù)的完整性、一致性的修復(fù)和確認(rèn),、備份中心計(jì)算機(jī)處理系統(tǒng)的啟動(dòng)和備份中心的網(wǎng)絡(luò)切換等全部時(shí)間,。總體規(guī)劃中應(yīng)為災(zāi)備系統(tǒng)設(shè)定明確的 RPO 和 RTO 指標(biāo),。

但是設(shè)計(jì)容災(zāi)系統(tǒng)不能只看 RTO 和 RPO,, 對(duì)于不同的業(yè)務(wù)系統(tǒng)和用戶特殊的要求,其它一些指標(biāo)有可能成為選擇容災(zāi)解決方案的主要因素,。例如,,某些地區(qū)為了防范一些特定自然災(zāi)害的風(fēng)險(xiǎn),要求容災(zāi)備份中心與業(yè)務(wù)中心保持足夠的距離,,在這種情況下,,容災(zāi)備份中心與業(yè)務(wù)中心的距離要求就是容災(zāi)系統(tǒng)的重要指標(biāo)。

通信網(wǎng)絡(luò)是容災(zāi)系統(tǒng)的組成部分,,通信線路的質(zhì)量也是容災(zāi)系統(tǒng)的性能指標(biāo)之一,,其中包括網(wǎng)絡(luò)的數(shù)據(jù)傳輸帶寬、網(wǎng)絡(luò)傳輸通道的冗余和網(wǎng)絡(luò)服務(wù)商的服務(wù)水平(網(wǎng)絡(luò)年中斷率),。如果容災(zāi)系統(tǒng)使用的通信網(wǎng)絡(luò)是確定的,,為了比較不同容災(zāi)解決方案,, 可以用單位存儲(chǔ)容量的數(shù)據(jù)庫(kù)在同一通信網(wǎng)絡(luò)上的數(shù)據(jù)完全恢復(fù)時(shí)間作為一項(xiàng)設(shè)計(jì)指標(biāo)。

大部分業(yè)務(wù)系統(tǒng)都是數(shù)據(jù)庫(kù)應(yīng)用結(jié)構(gòu),,但業(yè)務(wù)系統(tǒng)容災(zāi)并不等于是數(shù)據(jù)庫(kù)容災(zāi),, 還包括訪問數(shù)據(jù)庫(kù)的應(yīng)用程序和相關(guān)配置信息。實(shí)現(xiàn)數(shù)據(jù)庫(kù)容災(zāi)是容災(zāi)的基礎(chǔ),,在保障數(shù)據(jù)庫(kù)數(shù)據(jù)一致的前提下,還要實(shí)現(xiàn)應(yīng)用程序和配置信息的一致性,;實(shí)現(xiàn)應(yīng)用系統(tǒng)的高可用性,、應(yīng)用程序在容災(zāi)中心與生產(chǎn)中心接管和切回的過程,因此,,還要考慮應(yīng)用的模式是 C/S,、B/S,兩層,、三層,、多層次的應(yīng)用結(jié)構(gòu)等等。

1.1.5 界定災(zāi)備系統(tǒng)的總體架構(gòu)

根據(jù)實(shí)際需求,、現(xiàn)有技術(shù),、所在地域、計(jì)劃防范的災(zāi)難種類和預(yù)算投入的資金量等實(shí)際情況,,確定災(zāi)備系統(tǒng)預(yù)期達(dá)到的級(jí)別,,并以此來確定災(zāi)備系統(tǒng)與生產(chǎn)運(yùn)行系統(tǒng)在地理位置上的距離(同城還是異地或兩者兼?zhèn)洌竟?jié)點(diǎn)),備份數(shù)據(jù)存儲(chǔ)所在的介質(zhì)(磁盤還是磁帶或兩者兼?zhèn)洌?,備份?shù)據(jù)在生產(chǎn)中心與備份中心傳輸?shù)姆绞剑?就涉及到了具體的計(jì)算機(jī)存儲(chǔ)與網(wǎng)絡(luò)技術(shù)),,以及備份中心計(jì)算機(jī)系統(tǒng)的處理能力和網(wǎng)絡(luò)接管所需的具體架構(gòu) (是否與生產(chǎn)中心采用完全同等數(shù)量、容量和性能的計(jì)算機(jī),、存儲(chǔ)設(shè)備和網(wǎng)絡(luò)體系結(jié)構(gòu)),。

第 2 章 主流容災(zāi)技術(shù)說明

根據(jù) SHARE 78 評(píng)審標(biāo)準(zhǔn),容災(zāi)技術(shù)必需涵蓋了如下內(nèi)容:

2.1 數(shù)據(jù)備份

數(shù)據(jù)備份是系統(tǒng),、數(shù)據(jù)容災(zāi)的基礎(chǔ),,也是低端容災(zāi)的實(shí)現(xiàn),是高端容災(zāi)(實(shí)時(shí)數(shù) 據(jù)保護(hù))的有力保障,。目前備份技術(shù)主要有快照備份,、離線備份、異地存儲(chǔ)備份,。備份系統(tǒng)通過備份策略,,對(duì)計(jì)算機(jī)信息系統(tǒng)的操作系統(tǒng)、文件系統(tǒng),、應(yīng)用程序,、數(shù)據(jù)庫(kù)系統(tǒng)等數(shù)據(jù)集,實(shí)現(xiàn)某一時(shí)間點(diǎn)的完整拷貝,拷貝的數(shù)據(jù)處在非在線狀態(tài),,不能被立刻訪問,,必須通過相應(yīng)操作,如恢復(fù)等方式使用備份數(shù)據(jù)。這也解決了高端容災(zāi)(實(shí)時(shí)數(shù)據(jù)保護(hù))不能解決的問題:人為誤操作,、惡意性操作等,,這類操作,計(jì)算機(jī)系統(tǒng)是不能區(qū)分的,,一旦執(zhí)行,,將造成數(shù)據(jù)中心、災(zāi)備中心同時(shí)修改,;對(duì)于數(shù)據(jù)庫(kù)系統(tǒng),, 在日志方式下,可以通過回滾方式修改,,對(duì)于文件系統(tǒng),、操作系統(tǒng)等其他配置信息是不能回滾的,將造成毀滅性的結(jié)果,。因此在建設(shè)高端容災(zāi)系統(tǒng)的前提,,一定要做好本地系統(tǒng)的備份,這是容災(zāi)技術(shù)的起點(diǎn),。 

2.2 實(shí)時(shí)數(shù)據(jù)保護(hù)

實(shí)時(shí)數(shù)據(jù)保護(hù),,就是在多塊磁盤上、多個(gè)陣列,、多臺(tái)服務(wù)器,、多個(gè)數(shù)據(jù)中心實(shí)時(shí)的保存同一份數(shù)據(jù)的多份存儲(chǔ),目的是為了避免物理故障,,數(shù)據(jù)不會(huì)因?yàn)橐粔K磁盤,、 一個(gè)陣列、一臺(tái)服務(wù)器,、一個(gè)數(shù)據(jù)中心的故障,,而不能訪問。 

注意,,實(shí)時(shí)數(shù)據(jù)保護(hù)需要以數(shù)據(jù)備份作為前提,,它不能防范人為誤操作和惡性操作。

這里我們要強(qiáng)調(diào)容災(zāi)的目的是讓數(shù)據(jù)在災(zāi)難發(fā)生時(shí),,還能被訪問,,通過實(shí)時(shí)數(shù)據(jù)保護(hù),保證數(shù)據(jù)的完整性,;因此實(shí)時(shí)數(shù)據(jù)保護(hù)是容災(zāi)手段,,而不是目的,。 目前實(shí)時(shí)數(shù)據(jù)保護(hù)的技術(shù)主要有兩種:數(shù)據(jù)鏡像和數(shù)據(jù)復(fù)制。

2.2.1 數(shù)據(jù)鏡像(Mirroring)

數(shù)據(jù)鏡像(Mirroring)是冗余的一種類型,,一個(gè)磁盤上的數(shù)據(jù)在另一個(gè)磁盤上存在一個(gè)完全相同的副本即為鏡像,。分軟件鏡像與硬件鏡像,它們的的區(qū)別就在于實(shí)現(xiàn)鏡像所需的 CPU 周期所處的位置,。最終,,都是根據(jù)程序的指令,為硬件(磁盤,,以及磁盤上存儲(chǔ)的數(shù)據(jù))制作一個(gè)鏡像副本,。鏡像可以保證兩份數(shù)據(jù)完全一樣。鏡像軟件有 Symantec Volume Manager,;各硬件廠商都有基于自己陣列的硬件鏡像方式。

2.2.2 數(shù)據(jù)復(fù)制(Replication)

數(shù)據(jù)復(fù)制(Replication)是將一個(gè)原數(shù)據(jù)的及其改動(dòng),,通過后續(xù)機(jī)制拷貝到另外一處,,可以是另一個(gè)磁盤、另一個(gè)陣列,、另一個(gè)服務(wù)器,、另一個(gè)數(shù)據(jù)中心。由于實(shí)現(xiàn)的機(jī)制不同,,又分為同步復(fù)制和異步復(fù)制兩種方式,。同步復(fù)制,能夠確保兩份數(shù)據(jù) 完全一致,,但對(duì)系統(tǒng)的影響較大,,一般不會(huì)采用;異步復(fù)制,,通過后續(xù)機(jī)制,,確保將本地改動(dòng)的數(shù)據(jù)復(fù)制的異地,對(duì)系統(tǒng)的影響較小,,但數(shù)據(jù)同步有延遲,,是目前實(shí)現(xiàn)遠(yuǎn)程數(shù)據(jù)同步的主要方法。 

根據(jù)實(shí)現(xiàn)機(jī)制,,數(shù)據(jù)復(fù)制分為軟件方式和硬件方式,;硬件方式往往又被稱為遠(yuǎn)程鏡像。軟件復(fù)制有 Symantec Volume Replicator,;Datacore 等,;其中 Symantec 是基于卷的復(fù)制,Datacore 是基于 block 的復(fù)制,,類似于硬件的復(fù)制,,純硬件復(fù)制有 HDSTrueCopy,、 EMC SRDF 等。 其中軟件復(fù)制是可以跨硬件平臺(tái),,可以實(shí)現(xiàn)多廠商集成,,一般硬件復(fù)制則是相同品牌之間的磁盤子系統(tǒng)的操作。具有一定的限制性,。

2.2.2.1 軟件復(fù)制

Symantec Volume Replicator(簡(jiǎn)稱 VVR)負(fù)責(zé)遠(yuǎn)程數(shù)據(jù)復(fù)制,。 VVR 復(fù)制基于 Volume 進(jìn)行,。復(fù)制的數(shù)據(jù)可以是數(shù)據(jù)庫(kù)中的數(shù)據(jù)(文件方式或裸設(shè)備方式),,數(shù)據(jù)庫(kù)日志, 復(fù)制的數(shù)據(jù)也可以是各種文件,, 如應(yīng)用和數(shù)據(jù)庫(kù)配置文件,應(yīng)用程序, 庫(kù)文件, 等等,。 復(fù)制的示意圖見下圖,。

圖片

VVR 與 VxVM 完全集成在一起。用 VxVM 管理界面和命令統(tǒng)一配置管理,;由于 VVR 僅僅將 Volume 上每次 I/O 的實(shí)際數(shù)據(jù)實(shí)時(shí)復(fù)制到遠(yuǎn)程節(jié)點(diǎn),,所以在網(wǎng)絡(luò)線路上傳輸?shù)臄?shù)據(jù)量很少,,對(duì)帶寬的需求也很小,,因此也與應(yīng)用無關(guān),,只要是在定義的復(fù)制卷上的任何操作,,都會(huì)被復(fù)制到異地。 Datacore 則是基于軟件的塊設(shè)備復(fù)制,, 處于卷的更底層,, 屬于塊設(shè)備的遠(yuǎn)程復(fù)制,, 與基于卷的復(fù)制不同的是,,他具有應(yīng)用操作系統(tǒng)的獨(dú)立性,,數(shù)據(jù)的遠(yuǎn)程復(fù)制與操作系 統(tǒng)無關(guān),,并且不需要遠(yuǎn)端主機(jī)應(yīng)用系統(tǒng)的運(yùn)行,,支持異步和同步的方式,并且與硬件存儲(chǔ)子系統(tǒng)不同的是,,Datacore 可以實(shí)現(xiàn)異構(gòu)存儲(chǔ)子系統(tǒng)的集中管理,,打破了單一廠商選擇的限制,對(duì)于磁盤子系統(tǒng)的選擇更加靈活,。其復(fù)制示意圖如下:

圖片

通過整合原有存儲(chǔ)子系統(tǒng)以及新購(gòu)的存儲(chǔ)子系統(tǒng),,將數(shù)據(jù)的改動(dòng)記錄在 Datacore 的 SDS 設(shè)備當(dāng)中,采用存儲(chǔ)轉(zhuǎn)發(fā)的傳輸機(jī)制,,利用 cache 的技術(shù)和 buffer 的技術(shù),,記錄數(shù)據(jù)的改變,然后通過傳輸機(jī)制將所有應(yīng)用的數(shù)據(jù)傳輸?shù)綄?duì)端,,該軟件支持一對(duì)多的遠(yuǎn)程復(fù)制。類似于硬件復(fù)制,,但是可以不受品牌限制,。 

2.2.2.2 硬件復(fù)制

以 EMC 的 SRDF 為例,如下圖: 

1.系統(tǒng)定期檢測(cè)磁盤物理數(shù)據(jù)塊的改變狀況,。

圖片

如果發(fā)現(xiàn)有數(shù)據(jù)塊改動(dòng),,將會(huì)被系統(tǒng)記錄,并一次性將改動(dòng)過的數(shù)據(jù)塊考到復(fù)制緩存,,這一動(dòng)作被稱為 Switch,。

圖片

拷貝到緩存中的數(shù)據(jù)塊,在下一個(gè) Switch 來臨之前,,被復(fù)制到異地相應(yīng)的陣列緩存中,。

圖片

在下一個(gè) Switch 時(shí),本地?cái)?shù)據(jù)塊被復(fù)制到本地存中,,而異地緩存中上一次被改動(dòng)過的數(shù)據(jù)塊才被復(fù)制到容災(zāi)系統(tǒng)中,。

圖片

根據(jù)實(shí)應(yīng)用范圍,,數(shù)據(jù)復(fù)制分為應(yīng)用復(fù)制、數(shù)據(jù)庫(kù)復(fù)制,、卷復(fù)制,、控制器復(fù)制。 

應(yīng)用復(fù)制,,是指通過應(yīng)用系統(tǒng)直接向原生產(chǎn)中心和容災(zāi)中心同時(shí)發(fā)交易,,生產(chǎn)中心和容災(zāi)中心都處理成功,該筆交易才算成功,;只要有一邊應(yīng)用處理失敗,,該筆交易就算失敗。由于交易的延遲性較大,、健壯性較差,,應(yīng)用復(fù)制一般不會(huì)考慮。

圖片

2.2.2.3 數(shù)據(jù)庫(kù)復(fù)制

數(shù)據(jù)庫(kù)復(fù)制,,如 Oracle 的 Data Guard,、Quest SharePlex、DSG RealSync 等,, 通過分析數(shù)據(jù)庫(kù) Redo Log 和 Archive Log 實(shí)現(xiàn)日志的復(fù)制,,將分析結(jié)果直接或轉(zhuǎn)化為 SQL 語句傳到容災(zāi)中心,在容災(zāi)中通過心 Aply 數(shù)據(jù)庫(kù)日志或?qū)⑷罩巨D(zhuǎn)化的 SQL 語句重做,,來保證數(shù)據(jù)庫(kù)數(shù)據(jù)的一致性,。數(shù)據(jù)庫(kù)復(fù)制實(shí)際上是應(yīng)用復(fù)制的數(shù)據(jù)庫(kù)實(shí)現(xiàn), 復(fù)制方式通過異步完成,。 卷復(fù)制如上 Symantec Volume Replicator,。 控制器復(fù)制,如上 EMC 的復(fù)制過程,。

2.2.2.4 DatacoreSDS

實(shí)際上還有一種新的復(fù)制方式,, 稱為基于 SAN 網(wǎng)絡(luò)的卷復(fù)制, 如 Datacore 的 SDS,。 它是通過特殊的運(yùn)行于操作系統(tǒng)上的 SDS SAN 控制器,,實(shí)際是將低端的無智能存儲(chǔ)變?yōu)楦叨说闹悄艽鎯?chǔ),使得他們得以建立基于智能 SAN 控制器的卷,,通過這種與主機(jī)應(yīng)用無關(guān),,但與 SDS 控制器直接相關(guān)的卷實(shí)現(xiàn)復(fù)制。 Datacore 是較早的研發(fā)廠商,,還有 IBM 的 SVC 和 HDS 的 USP 系列也是采用此種技術(shù),。

2.3 應(yīng)用系統(tǒng)恢復(fù)

正如前所述,數(shù)據(jù)復(fù)制是容災(zāi)的手段,不是目的,,容災(zāi)的目的是數(shù)據(jù)的訪問,。因此應(yīng)用的恢復(fù)和以下的網(wǎng)絡(luò)的恢復(fù)也是容災(zāi)的關(guān)鍵。 

應(yīng)用系統(tǒng)恢復(fù),,這和系統(tǒng)的應(yīng)用模式直接相關(guān),。需要考慮應(yīng)用系統(tǒng)的應(yīng)用架構(gòu)。 是 Client/Server 架構(gòu),,還是 Broswer/Server 架構(gòu),;是 2 層架構(gòu)、還是 3 層架構(gòu),、 還是多層架構(gòu),。兩層架構(gòu),表示容災(zāi)中心的應(yīng)用只要啟動(dòng)數(shù)據(jù)庫(kù)就可以服務(wù)了,。如果是三層架構(gòu),, 就意味著應(yīng)用系統(tǒng)除數(shù)據(jù)庫(kù)以外,還有網(wǎng)絡(luò)服務(wù)程序,, 如中間件 Tuxedo,、 CICS、WebLogic,、WebSphere,、9iAS、SAP 等等,。在容災(zāi)應(yīng)用切換時(shí),,能夠手工或自動(dòng)化的將這些服務(wù)一一啟動(dòng)。

2.4 網(wǎng)絡(luò)系統(tǒng)恢復(fù)

在災(zāi)難發(fā)生后,,應(yīng)用切換到災(zāi)備中心了,,本地的應(yīng)用前端需要重新訪問容災(zāi)節(jié)點(diǎn)的服務(wù),帶來另外一個(gè)問題,,網(wǎng)絡(luò)如何切換,?是建立新的網(wǎng)絡(luò),還是使用動(dòng)態(tài)路由,,還是有其它辦法,?實(shí)際上最簡(jiǎn)單的辦法,,就是通過外部 DNS 服務(wù)器,,改變服務(wù)器名和 IP 的映射關(guān)系,將原服務(wù)器名映射到新的 IP 地址上,,就可以利用容災(zāi)網(wǎng)絡(luò),,實(shí)現(xiàn)前端對(duì)容災(zāi)中心服務(wù)器數(shù)據(jù)的訪問。

2.5 容災(zāi)切換過程

就是在災(zāi)難發(fā)生后,數(shù)據(jù)庫(kù)切換,、應(yīng)用重新啟動(dòng),、網(wǎng)絡(luò)實(shí)現(xiàn)切換等等,容災(zāi)中心接管原生產(chǎn)中心的整個(gè)過程;同時(shí)還包含了在原數(shù)據(jù)中心修復(fù)后,,數(shù)據(jù)庫(kù),、應(yīng)用、網(wǎng)絡(luò)需要重新切會(huì)來的整個(gè)過程,。這些過程,,可以通過手工切換、也可以通過自動(dòng)化過程完成,。

2.6 消防演習(xí)

大部分的容災(zāi)方案,,在項(xiàng)目實(shí)施后,很難有機(jī)會(huì)來實(shí)現(xiàn)預(yù)演,,因?yàn)閷?duì)于大部分方案來說,,這種預(yù)演活動(dòng),需要耗費(fèi)大量的人力財(cái)力,。

但是消防預(yù)演是必不可少的,,它是實(shí)時(shí)測(cè)試目前的容災(zāi)方案的漏洞,保證容災(zāi)方案在災(zāi)難發(fā)生時(shí),,能夠真正生效,。

第 3 章 主流容災(zāi)技術(shù)分析與對(duì)比

沒有一種技術(shù)可以解決所有IT 問題,因此,,也沒有一個(gè)解決方案是完美無缺的,,依據(jù)現(xiàn)狀、技術(shù)要求,、和未來的拓展,,我們?cè)诖擞懻摰氖亲詈线m容災(zāi)技術(shù)的解決方案。

3.1 數(shù)據(jù)備份

SHARE 78 評(píng)審標(biāo)準(zhǔn)中,,Tier 0,、Tier 1、Tier2 級(jí)別容災(zāi)要解決的問題,。 

如前面所闡述的,,數(shù)據(jù)備份是容災(zāi)系統(tǒng)的起點(diǎn),是最低端的容災(zāi)方案,。不是說有了高端的實(shí)時(shí)容災(zāi)方案,,就可以不要備份系統(tǒng)了,因?yàn)閷?shí)時(shí)容災(zāi)不能解決惡性操作,、 誤操作等故障,,而備份系統(tǒng)可以解決,。 

在此我們要討論的是,如何利用現(xiàn)有的備份系統(tǒng),,是容災(zāi)方案更加完備,。備份軟件必須具備跨平臺(tái)能力, 對(duì)目前所有的操作系統(tǒng) AIX、 Solaris,、 HP-Unix,、 Windows、數(shù)據(jù)庫(kù) Oracle,、SQL Server,、DB2、SybaseASE 等,,備份軟件除了要可以很好的備份相關(guān)的文件系統(tǒng)數(shù)據(jù),、數(shù)據(jù)庫(kù)系統(tǒng)數(shù)據(jù)外,同時(shí)必須要滿足系統(tǒng)的裸機(jī)快速恢復(fù)功能,,減少系統(tǒng)重建時(shí)間,,可以對(duì) AIX、Solaris,、HP-Unix,、Windows、Linux 操作系統(tǒng)實(shí)現(xiàn)備份,,備份這些操作系統(tǒng)的相關(guān)補(bǔ)丁,、外設(shè)驅(qū)動(dòng)程序、相關(guān)的文件系統(tǒng) 配置信息,、相關(guān)的卷配置信息,、內(nèi)核參數(shù)等。在災(zāi)難修復(fù)時(shí),,可以通過恢復(fù)的方式快速恢復(fù)相關(guān)操作系統(tǒng),。實(shí)際經(jīng)驗(yàn),操作系統(tǒng)安裝,、打補(bǔ)丁,,安裝相關(guān)驅(qū)動(dòng)程序、恢復(fù) 內(nèi)核參數(shù),、恢復(fù)文件系統(tǒng)配置,、恢復(fù)卷管理系統(tǒng)配置等整個(gè)過程,可以縮短在 1 小時(shí) 內(nèi)完成,, 并且降低了人為錯(cuò)誤操作過程,。 這樣大大提高了原生產(chǎn)中心容災(zāi)恢復(fù)的能力。 

目前市場(chǎng)上的備份產(chǎn)品,,Veritas 是市場(chǎng)占有率最高,,功能相對(duì)較全的產(chǎn)品,其他備份產(chǎn)品,,或沒有類似與 BMR 的模塊,;或是不能支持 AIX、Solaris,、HP-Unix,、 Windows、Linux 全部操作系統(tǒng),,這些用戶可以根據(jù)實(shí)際情況來選擇,。 

備份軟件還必須對(duì)遠(yuǎn)程磁帶具有管理功能,可以實(shí)現(xiàn)對(duì)備份數(shù)據(jù)的自動(dòng)拷貝,,并實(shí)現(xiàn)異地存放和管理,。-Share 78 中 Tier 1 、Tier 2 級(jí)別容災(zāi),。

3.2 實(shí)時(shí)數(shù)據(jù)保護(hù)

SHARE 78 評(píng)審標(biāo)準(zhǔn)中,,Tier 3 級(jí)別容災(zāi)。

3.2.1 數(shù)據(jù)鏡像(Mirroring)

數(shù)據(jù)鏡像分軟件鏡像與硬件鏡像,。

3.2.1.1 硬件鏡像

通過硬件級(jí)別的 Raid-1 實(shí)現(xiàn),,其實(shí)現(xiàn)過程簡(jiǎn)單,但要求嚴(yán)格,。只能基于同一廠商,、同一陣列、同樣容量大小的兩塊磁盤來實(shí)現(xiàn),?;旧嫌布拇疟P子系統(tǒng)供應(yīng)商都提供能夠?qū)崿F(xiàn)此種功能的設(shè)備,但一般價(jià)格較高,,投入大,,并且只能限定在同一廠商品牌。 

3.2.1.2 軟件鏡像

軟件鏡像可以實(shí)現(xiàn)邏輯卷級(jí)鏡像,,對(duì)存儲(chǔ)空間要求較低,,只要有空間且至少兩塊磁盤就行。不要求同一廠商,、同一陣列,、同樣容量大小的兩塊磁盤,軟件鏡像能夠?qū)崿F(xiàn)跨廠商,、跨陣列的鏡像,,在磁盤空間不均時(shí),能夠?qū)崿F(xiàn) 1 塊磁盤對(duì)多塊磁盤,、N 塊磁盤對(duì) M 塊磁盤的鏡像,。軟件鏡像的產(chǎn)品有 Symantec 的 Storage foundation,,這種軟件通常安裝在主機(jī)上,通過主機(jī)的線程對(duì)鏡像進(jìn)行控制,。 

3.2.1.3 軟件智能存儲(chǔ)鏡像

目前新興的虛擬存儲(chǔ)技術(shù),,使得讓原來非智能的存儲(chǔ)可以實(shí)現(xiàn)智能化,改變 了原來只有高端存儲(chǔ)才具有的智能功能的局面,,這種智能的控制器軟件可以實(shí)現(xiàn)存儲(chǔ)間的鏡像和存儲(chǔ)內(nèi)部的硬盤鏡像,,同時(shí),此種軟件的可以實(shí)現(xiàn)跨廠商的磁盤子系統(tǒng)設(shè)備的鏡像,。 

3.2.1.4 鏡像技術(shù)在容災(zāi)中的利用

在通過 SAN 的支持,,DWDM 的拓展,光纖網(wǎng)絡(luò)可以擴(kuò)展到 100 公里或更遠(yuǎn),,鏡像可以在較遠(yuǎn)的兩個(gè)數(shù)據(jù)中心的磁盤上建立,。但由于鏡像系統(tǒng)是以同步方式實(shí)現(xiàn)的,受到距離,、 光纖協(xié)議,、 和相關(guān)協(xié)議轉(zhuǎn)換的影響, 同步方式會(huì)影響本地服務(wù)器的性能,, 所以,, 一般建議在<20 公里的同城容災(zāi)中使用,在遠(yuǎn)程容災(zāi)中可作為一種加強(qiáng)方案與遠(yuǎn)程容災(zāi)方案整合,,將在我們的詳細(xì)方案中描述,。

常說的基于硬件的遠(yuǎn)程磁盤鏡像,實(shí)際上是遠(yuǎn)程磁盤復(fù)制,,不是真正意義上的鏡像,。我們將在后續(xù)文章描述。

基于 SAN 的鏡像,,在容災(zāi)實(shí)現(xiàn)中,,使用范圍較小,如上說述,,適用于同城容災(zāi),, 但支持所有的類型數(shù)據(jù)同步,包括文件數(shù)據(jù),、數(shù)據(jù)庫(kù)數(shù)據(jù),、裸設(shè)備、應(yīng)用配置文件,、 應(yīng)用程序,、庫(kù)函數(shù)等,因而支持各類應(yīng)用系統(tǒng)容災(zāi),,包括數(shù)據(jù)庫(kù),、中間件,、客戶自己開發(fā)的應(yīng)用,適用于 2 層架構(gòu),、3 層或多層應(yīng)用架構(gòu),。

3.2.2 數(shù)據(jù)復(fù)制(Replication)

數(shù)據(jù)復(fù)制是運(yùn)程容災(zāi)實(shí)現(xiàn)的基礎(chǔ)。

3.2.2.1 軟件復(fù)制(卷復(fù)制)

卷復(fù)制軟件負(fù)責(zé)遠(yuǎn)程數(shù)據(jù)復(fù)制,。復(fù)制基于卷進(jìn)行,將數(shù)據(jù)特別是需要進(jìn)行遠(yuǎn)程復(fù)制的相關(guān)文件系統(tǒng),、數(shù)據(jù)庫(kù),、裸設(shè)備、應(yīng)用程序等,,存放在復(fù)制卷組中,,系統(tǒng)便能自動(dòng)同步本地和異地相應(yīng)的復(fù)制卷組。

卷復(fù)制軟件與卷管理軟件完全集成在一起,。由于卷復(fù)制軟件僅僅將卷上每次 I/O 的操作復(fù)制到遠(yuǎn)程節(jié)點(diǎn),,復(fù)制的信息是卷的日志,所以在網(wǎng)絡(luò)線路上傳輸?shù)臄?shù)據(jù)量很少,,對(duì)帶寬的需求也較小,。

基于卷的日志(SRL:先進(jìn)先出)保正了再極端情況下,如容災(zāi)網(wǎng)絡(luò)中斷,、數(shù)據(jù)復(fù)制不能正常進(jìn)行,,容災(zāi)中心數(shù)據(jù)于生產(chǎn)中心數(shù)據(jù)有延遲,在一切故障排除后,,能夠嚴(yán)格保證所以 I/O 的寫順序,,這類似于數(shù)據(jù)庫(kù)數(shù)據(jù)塊和數(shù)據(jù)庫(kù)日志的關(guān)系,通過帶時(shí)間戳的數(shù)據(jù)塊和順序日志,,保證數(shù)據(jù)的一致性,。

基于軟件的遠(yuǎn)程復(fù)制,在容災(zāi)實(shí)現(xiàn)中,,使用范圍最廣,,支持所有的類型數(shù)據(jù)同步,包括文件數(shù)據(jù),、數(shù)據(jù)庫(kù)數(shù)據(jù),、裸設(shè)備、應(yīng)用配置文件,、應(yīng)用程序,、庫(kù)函數(shù)等,支持各類應(yīng)用系統(tǒng)容災(zāi),,包括數(shù)據(jù)庫(kù),、中間件,、客戶自己開發(fā)的應(yīng)用,適用于 2 層架構(gòu),、3 層或多層應(yīng)用架構(gòu),。

3.2.2.2 硬件復(fù)制

通過基于硬件的遠(yuǎn)程磁盤鏡像實(shí)現(xiàn),其實(shí)現(xiàn)要求嚴(yán)格,。只能基于同一廠商,、同型號(hào)陣列、同樣容量大小的兩個(gè)陣列來實(shí)現(xiàn),。廠商一般建議使用間歇性復(fù)制,。

遠(yuǎn)程磁盤鏡像(復(fù)制),在容災(zāi)實(shí)現(xiàn)中,,支持所有的類型數(shù)據(jù)同步,,包括文件數(shù)據(jù)、數(shù)據(jù)庫(kù)數(shù)據(jù),、裸設(shè)備,、應(yīng)用配置文件、應(yīng)用程序,、庫(kù)函數(shù)等,,支持各類應(yīng)用系統(tǒng)容災(zāi),包括數(shù)據(jù)庫(kù),、中間件,、客戶自己開發(fā)的應(yīng)用,適用于 2 層架構(gòu),、3 層或多層應(yīng) 用架構(gòu),。與應(yīng)用無關(guān),但與磁盤陣列直接相關(guān),。只能基于同一廠商,、同樣容量大小的兩個(gè)陣列來實(shí)現(xiàn)。受光纖線路影響,、復(fù)制數(shù)據(jù)量大,,在使用間歇性復(fù)制時(shí),數(shù)據(jù)延遲大,,磁盤容量要求 4 倍于源數(shù)據(jù),,并且在極端情況下,不能保證數(shù)據(jù)一致性,。

硬件復(fù)制的過程,,在上文已經(jīng)描述。下面我們將描述極端情況。

磁盤復(fù)制在生產(chǎn)中心和容災(zāi)中心復(fù)制的是改動(dòng)過的物理數(shù)據(jù)塊,,而物理數(shù)據(jù)塊的寫是無序的,。為了保證數(shù)據(jù)的一致性,通過帶時(shí)間戳的數(shù)據(jù)塊,,改善了一定的數(shù)據(jù)塊的無序性,,但仍然不能解決。我們看到,,數(shù)據(jù)庫(kù)是通過帶時(shí)間戳的數(shù)據(jù)塊和聯(lián)機(jī)日志 一起來解決,, 如果一個(gè)數(shù)據(jù)文件中的數(shù)據(jù)塊的時(shí)間戳不一致, 數(shù)據(jù)庫(kù)需要日志來修正,, 日志中記錄的是一些有序的數(shù)據(jù)庫(kù)操作,, 通過 Recover 的動(dòng)作, 將不一致的數(shù)據(jù)文件,, 前滾或后滾到某一特定時(shí)間點(diǎn),。帶時(shí)間戳的數(shù)據(jù)文件和有序的日志,,二者缺一不可,, 否則不能保證數(shù)據(jù)的一致性。在磁盤復(fù)制中,,唯獨(dú)少了至關(guān)重要的磁盤寫日志(不可能有),。更有甚,如果這種磁盤塊的無序?qū)?,發(fā)生在數(shù)據(jù)庫(kù)的聯(lián)機(jī)日志上,,那將對(duì)數(shù)據(jù)庫(kù)數(shù)據(jù)的一致性造成破壞。

3.2.2.3 基于軟件控制器的復(fù)制

基于軟件控制器的復(fù)制,,打破了基于硬件的復(fù)制的單廠商設(shè)備的限制,,并且具有更大的靈活性,通過建立虛擬磁盤卷的鏡像關(guān)系,,真正可以建立數(shù)據(jù)的鏡像,,其與軟件復(fù)制的不同之處又在于其對(duì)應(yīng)用的無關(guān)性,這點(diǎn)又與基于硬件的復(fù)制相同,。 

在前面我們提到基于塊設(shè)備復(fù)制的應(yīng)用無關(guān)性,,但是也具有對(duì)數(shù)據(jù)庫(kù)的數(shù)據(jù)一致 性的問題, 所幸的是這種基于軟件控制器的復(fù)制可以具有比基于純硬件復(fù)制更多的定制功能,,可以對(duì)數(shù)據(jù)庫(kù)的數(shù)據(jù)一致性提供支持,,其實(shí)現(xiàn)的方式是在數(shù)據(jù)庫(kù)的運(yùn)行主機(jī)上安裝 agent 或者是編寫腳本的方式實(shí)現(xiàn),并且腳本與軟件控制器相結(jié)合,,從而保證數(shù)據(jù)庫(kù)的數(shù)據(jù)復(fù)制一致性,,防止在極端情況下的數(shù)據(jù)損失。

我們可以認(rèn)為基于軟件控制器的數(shù)據(jù)復(fù)制是一種介于卷復(fù)制和硬件控制器復(fù)制之間的數(shù)據(jù)復(fù)制方式。 并且解決了單一硬件廠商平臺(tái)的限制,, 是未來的主流發(fā)展方向,。 

3.2.2.4 數(shù)據(jù)庫(kù)復(fù)制

數(shù)據(jù)庫(kù)復(fù)制,如 Oracle 的 Data Guard,、Quest SharePlex,、DSG RealSync 等, 通過分析數(shù)據(jù)庫(kù) Redo Log 和 Archive Log 實(shí)現(xiàn)日志的復(fù)制,,將分析結(jié)果直接或轉(zhuǎn)化為 SQL 語句傳到容災(zāi)中心,,在容災(zāi)中通過心 Aply 數(shù)據(jù)庫(kù)日志或?qū)⑷罩巨D(zhuǎn)化的 SQL 語句重做,來保證容災(zāi)中心數(shù)據(jù)與生產(chǎn)中心數(shù)據(jù)一致,。 

數(shù)據(jù)庫(kù)復(fù)制也存在一定的限制,,在簡(jiǎn)單的環(huán)境中,實(shí)現(xiàn)兩個(gè)較小的數(shù)據(jù)庫(kù)數(shù)據(jù)同步,,可以說是一個(gè)簡(jiǎn)化的解決方案,。對(duì)于容災(zāi)環(huán)境,其部分限制如下,。 

數(shù)據(jù)庫(kù)復(fù)制,,是專門針對(duì)相應(yīng)數(shù)據(jù)庫(kù)的,只能實(shí)現(xiàn)單一的數(shù)據(jù)庫(kù)復(fù)制?,F(xiàn)有的數(shù)據(jù)庫(kù)就有 Oracle ,SQL Server,,DB2,Sybase ASE,。在容災(zāi)系統(tǒng)中,,如果使用數(shù)據(jù)庫(kù)復(fù)制方式,管理員將要維護(hù) Oracle 一套,、SQL Server 一套,、DB2 一套、等相互各不相同的數(shù)據(jù)庫(kù)復(fù)制技術(shù),,管理和維護(hù)工作根本不能保證其能夠正常運(yùn)行,。 

下面我們就以 Oracle 為例,雖然有眾多廠商,、技術(shù)方案支持的數(shù)據(jù)庫(kù)復(fù)制,,仍然有不可逾越的技術(shù)障礙。 Oracle 數(shù)據(jù)庫(kù)的容災(zāi)復(fù)制被稱為 Standby Database, 其產(chǎn)生于 Oracle 7.3,,在 Oracle 9i 后,,改稱為 Data Guard。Standby Database 又分為 Physical Standby,, 和 Logical Standby,。Physical Standby 方式是將生產(chǎn)中心產(chǎn)生的數(shù)據(jù)庫(kù) redo log 和 archive log,不停復(fù)制到容災(zāi)中心,不停的 apply log,,來實(shí)現(xiàn)容災(zāi)中心的數(shù)據(jù)庫(kù)與生產(chǎn)中心一致,。Logical Standby,是通過解析 redo log 和 archive log,,產(chǎn)生相關(guān)的 SQL 語句,,把這些語句傳到容災(zāi)中心重做。Quest SharePlex 和 DSG 的 Realsync 類似與 Data Guard 的 Logical Stand by,,復(fù)制 SQL 語句,。 

1.容災(zāi)的目的是使數(shù)據(jù)能夠被正常訪問, 業(yè)務(wù)能夠正常運(yùn)行,。 數(shù)據(jù)庫(kù)復(fù)制技術(shù),, 不是一個(gè)完整的容災(zāi)解決方案,只能有限的復(fù)制數(shù)據(jù)庫(kù)數(shù)據(jù),,不能復(fù)制其他的應(yīng)用程序,, 配置文件, 就是 Oracle 自己的 tnsnames.ora, listner.ora,, initSID.ora, *.ctl 也不能復(fù)制,,一旦這些文件改動(dòng)過,將需要管員人為操作或者需要其他軟件的管理,, 保證容災(zāi)中心與生產(chǎn)中心同步應(yīng)用,、程序,、配置文件同步,。 

2.由于 Data Guard 是通過日志來實(shí)現(xiàn)的,這要求數(shù)據(jù)庫(kù)必須運(yùn)行在歸檔日志模式下,。但我們知道,,并不是所有的數(shù)據(jù)庫(kù)操作都寫日志:oracle 的 DML(Data Manipulation Language)或 DDL(Data Dictionary Language)語句是不能被復(fù)制的,如 create index,、table,,alter table 等等;觸發(fā)器,、存儲(chǔ)過程操作不能被復(fù)制,;系統(tǒng)升級(jí)、patchs 更新不能被復(fù)制,。 

3.與備份軟件的沖突,。如前所述,對(duì)于核心應(yīng)用系統(tǒng),,數(shù)據(jù)備份必不可少,。對(duì)于數(shù)據(jù)庫(kù)的備份,也要求數(shù)據(jù)庫(kù)在歸檔模式下運(yùn)行。備份系統(tǒng)在備份作用發(fā)起時(shí),,需要備份數(shù)據(jù)文件,、control file、歸檔日志,、甚至需要數(shù)據(jù)庫(kù)實(shí)現(xiàn)強(qiáng)制歸檔,,來備份 歸檔日志,備份作業(yè)成功后,,由備份系統(tǒng)自動(dòng)刪除備份過的歸檔日志,,應(yīng)為當(dāng)數(shù)據(jù)庫(kù) 運(yùn)行在歸檔日志模式下時(shí),歸檔日志往往因數(shù)據(jù)庫(kù)繁忙而快速大量產(chǎn)生,,需要備份軟件自動(dòng)清除維護(hù),,否則當(dāng)歸檔日志空間占滿后,聯(lián)機(jī)日志不能歸檔時(shí),,生產(chǎn)數(shù)據(jù)庫(kù)不在運(yùn)作,,則所有應(yīng)用業(yè)務(wù)不能操作,釀成生產(chǎn)事故,。為了不影響生產(chǎn)環(huán)境,,問題一, 在備份作業(yè)發(fā)起,,強(qiáng)制歸檔,;備份完成后,刪除歸檔日志后,,數(shù)據(jù)庫(kù)復(fù)制軟件,,該如 何操作, 將嚴(yán)重造成生產(chǎn)中心和容災(zāi)中心數(shù)據(jù)不一致,。 如果備份作用不刪除歸檔日志,, 系統(tǒng)管理員將不定時(shí)的來維護(hù)歸檔目錄,他必須知道本地歸檔目錄中,,哪一個(gè)歸檔日志已經(jīng)被備份,,通過檢查容災(zāi)中心數(shù)據(jù)庫(kù)中哪一個(gè)歸檔日志已經(jīng)被 apply,這將是一個(gè)惡夢(mèng)一樣的維護(hù)工作,。 

4.極限情況下的危害,。當(dāng)生產(chǎn)中心和容災(zāi)中心的復(fù)制鏈路一定時(shí)期內(nèi)不能恢復(fù)時(shí),同樣需要在生產(chǎn)主機(jī)中保留所有的歸檔日志,,這又需要管理員大量的維護(hù)工作,。

3.3 應(yīng)用系統(tǒng)恢復(fù)

對(duì)于核心的應(yīng)用環(huán)境,在實(shí)現(xiàn)容災(zāi)前,,一般都要求在本地實(shí)現(xiàn)高可用性,,通過集群軟件,,保證應(yīng)用、數(shù)據(jù)訪問在服務(wù)器級(jí)故障,,如網(wǎng)卡,、IP、操作系統(tǒng),、磁盤,、其他相關(guān)應(yīng)用的故障時(shí), 能夠自動(dòng)切換到另外一臺(tái)可用的服務(wù)器上,, 能夠被用戶繼續(xù)訪問,。 容災(zāi)應(yīng)用切換,就是把這種高可用性的應(yīng)用,,拓展到廣域網(wǎng)上,。

也就是說通過 HA 軟件實(shí)現(xiàn)生產(chǎn)中心的高可用、實(shí)現(xiàn)容災(zāi)中心應(yīng)用的自動(dòng)啟動(dòng),、 實(shí)現(xiàn)生產(chǎn)中心在災(zāi)難修復(fù)后應(yīng)用的回切過程,。

目前主流的高可用方案主要有 Symantec VCS、 IBM HACMP,、 HP MC/Service Guard,、 Sun Cluster、Windows CCS 等,。 

3.4 網(wǎng)絡(luò)系統(tǒng)恢復(fù)

在災(zāi)難發(fā)生后,,本地應(yīng)用訪問路徑如何由指向原生產(chǎn)中心改為指向容災(zāi)中心。在災(zāi)難修復(fù)后,,又需要指向原生產(chǎn)中心,。 

我們提到,最簡(jiǎn)單的方法就是更改外部 DNS 服務(wù)器得 IP 映射關(guān)系,。在災(zāi)難發(fā)生前,,IP 映射為生產(chǎn)中心服務(wù)器,;在災(zāi)難發(fā)生后,,IP 由映射為容災(zāi)中心得服務(wù)器;在災(zāi)難修復(fù)后,,IP 又映射為生產(chǎn)中心得服務(wù)器,。

當(dāng)然,,在一些中間件軟件中,支持多服務(wù)器、多 IP 得配置,,那也是可以考慮的。

第 4 章 容災(zāi)系統(tǒng)設(shè)計(jì)步驟

圖片

如上圖,,對(duì)于容災(zāi)系統(tǒng)的建立,,我們建議通過分步實(shí)施,,逐漸建立一套完善的系統(tǒng)容災(zāi)解決方案。 

第一步,,深化數(shù)據(jù)備份系統(tǒng),; 

第二步,存儲(chǔ),、應(yīng)用整合,; 

第三步,實(shí)現(xiàn)遠(yuǎn)程實(shí)時(shí)數(shù)據(jù)保護(hù),; 

第四步,,建立遠(yuǎn)程切換消防演習(xí)機(jī)制; 

第五步,,建立遠(yuǎn)程切換機(jī)制,。

4.1 第一步,深化數(shù)據(jù)備份系統(tǒng)

通過相應(yīng)的備份軟件,,對(duì)目前所有的計(jì)算機(jī)系統(tǒng),,做好完善的數(shù)據(jù)備份,特別是做好操作系統(tǒng)備份,、文件系統(tǒng)備份,、數(shù)據(jù)庫(kù)系統(tǒng)文件備份、數(shù)據(jù)庫(kù)數(shù)據(jù)文件備份,、相關(guān)的核心應(yīng)用程序備份,;建立好完善的備份/恢復(fù)機(jī)制和遠(yuǎn)程磁帶保管機(jī)制。 這也是下一步實(shí)現(xiàn)遠(yuǎn)程數(shù)據(jù)復(fù)制容災(zāi)的基礎(chǔ),,容災(zāi)中心與生產(chǎn)中心的數(shù)據(jù)初始化同步,,都是通過磁帶備份恢復(fù)方式,實(shí)現(xiàn)一個(gè)同步起點(diǎn),。

4.2 第二步,,存儲(chǔ)、應(yīng)用整合

4.2.1 存儲(chǔ)整合

通過相關(guān)的產(chǎn)品選擇,, 將各服務(wù)器的數(shù)據(jù),、或應(yīng)用, 通過基于一定的管理及后續(xù),, 實(shí)現(xiàn)數(shù)據(jù)的快照,、鏡像等技術(shù),遷移到外置基于 SAN 的陣列庫(kù)中,,通過唯一的管理接口,,實(shí)現(xiàn)統(tǒng)一管理,屏蔽不同廠商陣列的差異,。

4.2.2 應(yīng)用整合

通過相應(yīng)的應(yīng)用集群管理軟件,,管理所有的應(yīng)用系統(tǒng)狀態(tài),。對(duì)現(xiàn)有的數(shù)據(jù)庫(kù)系統(tǒng) Oracle、SQL Server,、DB2,、Sybase、中間件等應(yīng)用,,實(shí)現(xiàn)雙機(jī),、多機(jī)或是單機(jī)集群管理。操作系統(tǒng)平臺(tái)相同的,,可以整合在一起,,實(shí)現(xiàn)多機(jī)集群,不同的數(shù)據(jù)庫(kù)實(shí)例,, 只是作為一個(gè) “數(shù)據(jù)庫(kù)服務(wù)組” ,, 運(yùn)行在多機(jī)或雙機(jī)中的某一臺(tái)服務(wù)器上,為中間件,、 其他應(yīng)用建立 “應(yīng)用服務(wù)組” ,, 也納入到集群軟件的管理; 并且動(dòng)過集權(quán)軟件建立 “應(yīng)用服務(wù)組” 與 “數(shù)據(jù)庫(kù)服務(wù)組”或其他 “應(yīng)用服務(wù)組” 的依賴關(guān)系,, 實(shí)現(xiàn)對(duì)應(yīng)用啟動(dòng),、 關(guān)閉的有序管理。 

如果是 Oracle RAC 的應(yīng)用,,則需要集權(quán)軟件支持,,因此在選擇集權(quán)管理軟件時(shí)要納入考慮因素,通過 RAC 的支持使得數(shù)據(jù)庫(kù)的 RAC 應(yīng)用也在集群軟件的管理之下,。

4.3 第三步,,實(shí)現(xiàn)遠(yuǎn)程實(shí)時(shí)數(shù)據(jù)卷保護(hù)

通過第二步的存儲(chǔ)和應(yīng)用整合,使得所有需要容災(zāi)的核心系統(tǒng),,全部納入到一個(gè)統(tǒng)一的管理平臺(tái)之下,,我們將規(guī)劃好應(yīng)用數(shù)據(jù)的存放方式、數(shù)據(jù)文件的存放地點(diǎn),、日志的存放地點(diǎn),,然后統(tǒng)一為這些數(shù)據(jù)指定一定的存儲(chǔ)策略,實(shí)現(xiàn)遠(yuǎn)程數(shù)據(jù)復(fù)制,。

4.4 第四步,,建立遠(yuǎn)程切換消防演習(xí)機(jī)制

在數(shù)據(jù)庫(kù)復(fù)制初始化完成,相關(guān)應(yīng)用復(fù)制完成,,就可以實(shí)現(xiàn)相關(guān)應(yīng)用的消防演習(xí)了。這是保證容災(zāi)系統(tǒng)正常唯一的,、最有效的手段,,整個(gè)過程生產(chǎn)中心應(yīng)用在線,。 

對(duì)數(shù)據(jù)庫(kù)實(shí)現(xiàn)快照; 

啟動(dòng)數(shù)據(jù)庫(kù),; 

啟動(dòng)相關(guān)的應(yīng)用,; 

通過壓力程序或測(cè)試程序驗(yàn)證應(yīng)用。

4.5 第五步,,建立遠(yuǎn)程切換機(jī)制

確定外部 DNS 服務(wù)器對(duì)本地服務(wù)器與容災(zāi)中心服務(wù)器 IP 地址的對(duì)應(yīng)關(guān)系,,確定 GCO 對(duì) DNS 更新的內(nèi)容。

第 5 章 數(shù)據(jù)容災(zāi)的性能分析

5.1 同步數(shù)據(jù)容災(zāi)的性能分析

利用同步傳輸方式建立異地?cái)?shù)據(jù)容災(zāi),,可以保證在本地系統(tǒng)出現(xiàn)災(zāi)難時(shí),,異地存在一份與本地?cái)?shù)據(jù)完全一致的數(shù)據(jù)備份。但利用同步傳輸方式建立這樣一個(gè)系統(tǒng),,必須考慮“性能”這個(gè)因素,。 

采用同步數(shù)據(jù)傳輸方式時(shí),從前面的描述來看,,本地系統(tǒng)必須等到數(shù)據(jù)成功的寫到異地系統(tǒng),,才能進(jìn)行下一個(gè) I/O 操作。一個(gè) I/O 通過遠(yuǎn)程鏈路寫到異地系統(tǒng),,涉及到 3 個(gè)技術(shù)參數(shù):帶寬,、距離和中間設(shè)備及協(xié)議轉(zhuǎn)換的時(shí)延。

5.1.1 帶寬

本地 I/O 的帶寬是 100MB/秒,,在 I/O 流量很大的情況下,,如果與遠(yuǎn)程的 I/O 帶寬 相對(duì)“100MB/秒 == 800Mbit/秒”窄得多的話,如 E1:2Mbit/秒,;E3:45Mbit/秒,, 將會(huì)明顯拖慢生產(chǎn)系統(tǒng)的 I/O,從而影響系統(tǒng)性能,。

5.1.2 距離

光和電波在線路上傳輸?shù)乃俣仁?30 萬公里/秒,,當(dāng)距離很長(zhǎng)時(shí),這種線路上的延時(shí)將會(huì)變得很明顯,。例如:一個(gè)異地容災(zāi)系統(tǒng)的距離是 1000KM,,其數(shù)據(jù)庫(kù)寫盤的數(shù)據(jù)塊大小是 10KB(一次 I/O 的數(shù)據(jù)量),那么:

本地 I/O 時(shí)(100 米距離內(nèi)) :

圖片

此數(shù)字遠(yuǎn)遠(yuǎn)超過光纖通道帶寬本身,,也就是說,,光電在 100 米距離的線路上的延時(shí)對(duì)性能的影響可以忽略不計(jì)。 

異地 I/O 的(1000 公里) :

圖片

此數(shù)據(jù)表明,,在 1000 公里距離上,,允許的最大 I/O 量在不存在帶寬限制時(shí),已經(jīng)遠(yuǎn)遠(yuǎn)低于本地 I/O 的能力,。 

(注:上面分析還未考慮中間設(shè)備及協(xié)議轉(zhuǎn)換的延時(shí)) ,。

5.1.3 中間鏈路設(shè)備和協(xié)議轉(zhuǎn)換的時(shí)延

中間鏈路設(shè)備和協(xié)議轉(zhuǎn)換的方式的不同,,時(shí)延不同,對(duì)性能的影響也不同,。在對(duì)性能影響的分析中,,這個(gè)因數(shù)也應(yīng)計(jì)算在內(nèi)。目前不同異地?cái)?shù)據(jù)復(fù)制技術(shù)所依賴的介質(zhì)和協(xié)議不同,,我們將介質(zhì),、協(xié)議和大概時(shí)延例表如下,這里提供的數(shù)據(jù)只精確到數(shù)量級(jí),,僅供參考,,實(shí)際數(shù)據(jù)應(yīng)該像設(shè)備供應(yīng)上索取。

圖片

下面是一個(gè)線路時(shí)延分析對(duì)照表,,供參考,。

圖片

圖片

在 1000 公里和 100 公里距離上,采用租用線路和 ATM,,允許的最大 I/O 能力 (假定帶寬足夠,,數(shù)據(jù)塊大小以 10KB 為例) :

圖片

在 10 公里距離上, 采用各種傳輸協(xié)議允許的最大 I/O 能力,, 數(shù)據(jù)塊大小以 10KB 為例(假定帶寬足夠) :

圖片

5.2 異步數(shù)據(jù)容災(zāi)的性能分析

從前面的分析來看,, 同步數(shù)據(jù)容災(zāi)一般只能在較短距離內(nèi)部署 (10KM-100KM) ,大于這個(gè)距離,,就沒有實(shí)際應(yīng)用價(jià)值了,。因?yàn)榧词乖?1000KM 距離上,4.5MB 的速率足夠?qū)?shù)據(jù)復(fù)制到異地,,每個(gè) I/O 的響應(yīng)時(shí)間也會(huì)超過 10ms,,這種響應(yīng)速度太慢。 

異步數(shù)據(jù)容災(zāi)主要是針對(duì)“線路帶寬和距離能保證完成數(shù)據(jù)復(fù)制過程,,同時(shí),,希望異地?cái)?shù)據(jù)復(fù)制不影響生產(chǎn)系統(tǒng)的性能” 這樣的要求下提出來的。 考慮異步數(shù)據(jù)容災(zāi),, 應(yīng)該注意到以下幾個(gè)技術(shù)條件和事實(shí),。 

1. 帶寬必須能保證將本地生產(chǎn)數(shù)據(jù)基本上完全復(fù)制到異地容災(zāi)端,還要考慮距離對(duì)傳輸能力的影響,。

按照前面的估算:在 1000 公里范圍內(nèi),,一條帶寬足夠的線路能支持的 I/O 流量最大為(數(shù)據(jù)塊大小 10KM ) :1.4MB×3600 秒×24 小時(shí)=120GB/天

2. 異地容災(zāi)端數(shù)據(jù)雖然落后,但必須保證該數(shù)據(jù)庫(kù)內(nèi)在的數(shù)據(jù)完整性(一致性)、 可用性,,否則,,這種數(shù)據(jù)復(fù)制就沒有應(yīng)用價(jià)值了。 

3. 異地容災(zāi)端數(shù)據(jù)會(huì)比本地生產(chǎn)端數(shù)據(jù)落后一定時(shí)間 ,這個(gè)時(shí)間隨采用的技術(shù), 帶寬,、距離,、數(shù)據(jù)流特點(diǎn)的不同而不同,。 

4. 異步容災(zāi)基本不影響本地系統(tǒng)性能,。

與同步傳輸方式相比,異步傳輸方式對(duì)帶寬和距離的要求低很多,,它只要求在某個(gè)時(shí)間段內(nèi)能將數(shù)據(jù)全部復(fù)制到異地即可,,同時(shí)異步傳輸方式也不會(huì)明顯影響應(yīng)用系 統(tǒng)的性能。其缺點(diǎn)是在本地生產(chǎn)數(shù)據(jù)發(fā)生災(zāi)難時(shí),,異地系統(tǒng)上的數(shù)據(jù)可能是幾分鐘以前的數(shù)據(jù),,即最近幾分鐘內(nèi)的交易會(huì)丟失。(注:一個(gè)經(jīng)過仔細(xì)計(jì)算和規(guī)劃的系統(tǒng),, 才能保證其數(shù)據(jù)丟失只有幾分鐘,。 ) 

通過異步傳輸模式進(jìn)行異地?cái)?shù)據(jù)復(fù)制的技術(shù),包括: 

1. 基于主機(jī)邏輯卷的數(shù)據(jù)復(fù)制方式 

2. 基于磁盤系統(tǒng) I/O 控制器的數(shù)據(jù)復(fù)制方式 

3. 基于軟件控制器的數(shù)據(jù)復(fù)制方式

基于主機(jī)邏輯卷(Volume) ,,由于采用 Log 技術(shù)作技術(shù)保障的數(shù)據(jù)復(fù)制方式,,其數(shù)據(jù)具有較高的完整性保障,而基于磁盤系統(tǒng) I/O 控制器的數(shù)據(jù)復(fù)制方式,,不能滿足前面提到的技術(shù)條件二,,也即不能保證異地容災(zāi)端數(shù)據(jù)(庫(kù))的完整性,所以,,這種方式對(duì)于基于數(shù)據(jù)庫(kù)的應(yīng)用具有一定的局限性,。 基于軟件控制器的復(fù)制由于采用了腳本和控制器的聯(lián)動(dòng),可以支持?jǐn)?shù)據(jù)庫(kù)的文件的一致,,但是必須調(diào)動(dòng)腳本的運(yùn)行時(shí)間,, 在兩個(gè)腳本運(yùn)行時(shí)間之間的數(shù)據(jù)會(huì)存在不一致的可能性。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購(gòu)買等信息,,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,,請(qǐng)點(diǎn)擊一鍵舉報(bào),。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多