本文介紹云盤異步復制容災,幫助您了解其基本能力和價值。
功能概述
云備份服務基于云盤異步復制技術實現跨地域或者跨可用區容災能力,應對不同的業務需求。
該技術是在云盤層通過異步復制實現,無需在受保護的實例上安裝代理。
當主系統發生故障時,業務系統切換到容災系統,有效避免了地域性災害導致的系統故障,保障業務的可用性,滿足業務的RTO、RPO核心指標。
云盤異步復制是一種基于塊存儲數據復制能力實現跨地域或者跨可用區數據保護的功能。更多信息,請參見云盤異步復制功能原理。
相比連續復制型容災(CDR),云盤異步復制技術與其差異如下表格所示:
對比項 | 連續復制型容災 | 云盤異步復制容災 |
主要支持場景 | 適用單虛機容災。適用不介意系統侵入的客戶。 | 適用虛機組一致性容災。適用于不希望有系統侵入的客戶。 |
系統侵入性 | 是 | 否 |
復制實現 | 通過在被保護實例上安裝Agent嵌入OS,實時復制磁盤上寫入的數據并發送到網關,網關將數據傳輸中轉站OSS進行存儲,最終寫入容災站點磁盤。 | 通過塊存儲的云盤異步復制、快照等機制實現數據復制。 |
恢復實現 | 支持多恢復點。 備站創建被保護實例的shadowECS和網關機,從數據中轉站拉取數據并通過shadowECS寫入,然后基于快照機制創建出恢復點。 | 僅支持單恢復點。 通過快照復制到備端生成恢復點。 |
一致性保護組 | 不支持 | 支持 |
容災優勢
無代理
無代理的數據復制技術,零侵入性,OS普適性,以及容災站點計算資源零消耗。
多機一致性
提供多機一致性,可滿足企業應用的嚴格要求。
易理解
從應用出發,您創建保護組后,將某一應用下的所有ECS添加進該保護組,即可開啟復制。您無需關注云盤和ECS的關系,ECS和云盤的對應關系均由云備份服務后臺完成。
基本概念
名詞 | 英文 | 說明 |
站點對 | Site Pair | 在跨地域容災或跨可用區容災時,需要將數據從一個站點復制到另一個站點,因此需要對這兩個站點進行配對,稱為站點對。每個容災站點對可以創建多個保護組。一個站點對中的保護組的容災方向只有正向保護一個方向。例如A保護組容災到B保護組,正向保護是地域1到地域2,C保護組容災到D保護組,正向保護是地域2到地域1,需要創建兩個站點對。保護組只可屬于一個站點對。 一個站點對只可以使用一種復制技術。 |
保護組 |
|
|
保護實例 | Protected Instance | 被保護的ECS實例或未來支持的數據庫等。角色分為主和備。主指當前運行業務的實例,備指當前用作容災使用的實例。 |
生產站點 | Production Site | 用戶生產業務初始運行的可用區或地域。 |
容災站點 | DR Site | 用戶用于生產業務容災的可用區或地域。 |
故障切換 | Failover | 當生產站點發生故障時,切換業務到容災站點的過程。包括兩種類型,計劃(planned failover)和非計劃(unplanned failover),區別在于切換時生產站點ECS是否已經宕機。 |
故障恢復 | Failback | 當生產站點故障恢復時,將業務從容災站點切回到生產站點的過程。 |
正向保護 | Forward | 用于保護組和ECS的狀態。生產站點數據和業務復制到容災站點。 |
反向保護 | Reverse | 用于保護組和ECS的狀態。當故障切換后,容災站點B變為“生產站點”,生產站點A變為“容災站點”。此時重啟保護后,數據復制為起始時的反向,方向為B-->A,稱為反向保護。故障恢復后,A回到生產站點狀態,B回到容災站點狀態,此時啟動復制A-->B,回到正向保護狀態。 |
技術架構
基于CDR和云盤異步復制技術的容災技術架構如下圖所示。
支持的容災場景
容災場景 | 支持類型 |
故障切換 |
|
故障恢復 |
|
使用流程
在云備份服務控制臺,實現對關鍵應用的容災保護,主要步驟包括如下:
步驟一:資源規劃。
進行容災前,您需要提前規劃容災所需的計算、存儲、網絡等資源。例如服務器數量、存儲容量、劃分網絡VPC等。
步驟二:創建容災站點對。
準備好用于容災站點的專有網絡(VPC)和交換機(vSwitch),并配置好網段。測試使用時,您可以使用默認配置來創建VPC和vSwtich,或者考慮將容災站點VPC和交換機的網段配成與生產站點一致。正式容災時,您可以按照實際情況配置網段。
步驟三:設置網絡與安全。
進行資源映射,包括網絡可用區、交換機、安全組。
步驟四:創建保護組。
步驟五:添加保護實例。
添加需要保護的實例。
步驟六:啟動復制。
開始容災保護,即將生產站點數據復制到容災站點。
說明保護組處于增量復制中或者已有恢復點之后,您就可以進行故障演練。具體操作,請參見故障演練。
步驟七:故障切換
數據同步后切換
該故障切換會先停止保護組中被保護的實例,并且等到所有被保護的實例停止后再進行最后一輪數據同步,等待數據同步完成后再啟動切換。這樣可以保證容災端與生產端數據完全一致,無數據丟失。該切換模式適用于計劃內容災演練,業務遷移等場景。
立即切換
該故障切換會嘗試停止保護組中被保護的實例,但不等待所有被保護的實例停止,也不會進行最后一輪數據同步,數據在RPO范圍內有部分丟失。該模式適用于生產站點確實發生短時無法恢復的故障,需立即切換至容災站點的場景。
計費說明
使用云盤異步復制型容災時,會產生以下費用: