災備規劃
云容災服務因免去了災備中心建設、硬件系統采購、運維等復雜的工作,加上資源可彈性擴展、按量付費的特性,這些都降低了規劃工作的難度。您只需花少量的時間進行選型、規劃等就可以輕松使用阿里云作為您的容災服務提供者。本文將從需求分析、RTO和RPO要求、應用的分析、災備設備和網絡環境等方面闡述如何有效地進行災備規劃。
需求分析
數據保護和業務連續性對數據中心的意義重大,關鍵應用的故障或數據丟失會對您的業務造成重大損失。混合云容災服務提供了兩個層次的能力來保護數據,并確保業務連續性。
異地備份
服務器鏡像和數據備份后會直接上傳至阿里云災備庫,實現高可靠的云上異地備份。穩定的異地備份確保關鍵數據在本地數據中心發生火災等極端情況下不丟失,在本地設施修復后恢復至本地。
云上容災
為減少因應用故障導致的業務損失,當數據中心出現嚴重故障無法快速恢復時,混合云容災服務可以高效地在ECS上快速恢復您的應用。
RTO和RPO要求
應用容災有兩個核心的指標:
RPO:指應用發生故障時可以容忍的數據丟失量。數據越重要,RPO就要求越小。RPO越小,往往要求數據備份、復制頻率更高,對生產環境、網絡的壓力也會越大,成本通常也越高。
RTO:指故障發生后,期望從啟動容災恢復操作到應用恢復上線所需要的時間。故障單位時間內對業務造成的損失越大,RTO就要求越短。
RTO和RPO一般由業務部門提出要求,與IT部門共同商議,基于技術可行性、對現有系統影響、成本等多方面綜合考量綜合得出。RTO和RPO標準的高低與基礎設施成本往往有線性關系。
您也可以參考國家和行業標準來制定RTO、RPO目標。GB/T 20988-2007標準是中國國家標準化管理委員會制定的信息系統災難恢復規范。附錄中有某行業RPO/RTO的等級規范示例,如下所示。更多信息,請參見GB/T 20988-2007標準。
混合云容災服務提供了簡單的配置來滿足不同的RPO和RTO要求。例如,連續復制型容災(CDR)可以提供秒級到分鐘級的RPO和RTO。
應用的分析
容災部署前,您需要了解關鍵應用的部署、環境的依賴以及應用的客戶端連接等情況。
應用的部署
部署關鍵應用前,您需要考慮以下三個要素:
該應用包含哪些服務器
服務器之間的網絡連接
服務器內需要做哪些配置
例如,一個簡單的網頁應用包含以下要素:
該應用包含:1個數據庫服務器,1個后端服務器,1個Web前端服務器。
3個服務器處于同一網絡。
后端服務器內有一個配置項指定數據庫服務器IP地址,Web前端服務器有個配置項指明后端服務器IP地址。
識別這些要素之后,可以做如下計劃:
混合云容災服務需要保護這3臺服務器。
阿里云上恢復時,需要將這3臺服務器恢復在同一個VPC內。
整機恢復后,為確保這個應用能夠運行,必須確保恢復時使用與云下相同的IP地址。或者,確保在恢復完成后用自動化腳本修改配置項。
環境的依賴
應用容災是一個需要多部門合作完成的過程,包括應用管理員、機房管理員和網絡管理員等角色的配合實施。一個能夠滿足業務要求的完整的災備方案需要考慮多個方面的細節,主要包括:
應用所依賴的環境,例如Active Directory(AD)、DNS等
應用所需要的網絡配置
很多情況下,應用的運行還有一些重要的環境依賴。例如在Windows環境中,很多應用都依賴AD運行。那么在云上恢復的時候,您云上的 VPC環境必須能夠連接AD服務。當然,DNS服務也是很多環境下的強需求。
以AD為例,通常會有以下兩種情況:
如果您已經在不同的數據中心內部署了多個主從AD服務器,那么您只需要在AD所在的數據中心和云上VPC之間能夠建立高速通道或者 SSLVPN連接即可。
如果您的AD服務器是集中部署在一個數據中心,可能發生同一時間離線的情況,建議您:
用混合云災備一體機保護AD服務器,在云下發生故障時首先恢復這臺AD服務器。
在云上VPC里部署一個從AD服務器,與云下的主AD服務器保持連接。云下發生故障時,使用云上AD。
同樣,DNS服務器也需要進行相應的配置才能滿足災備后的應用環境要求。
應用的客戶端連接
應用恢復后,需要確保客戶端能夠連接恢復出來的應用。通常情況下,您需要:
如果恢復出的應用服務器IP地址與原始的一樣,DNS服務器也成功恢復,那么只需要客戶端與應用有網絡連接即可。您可能需要用SSLVPN或者高速通道來確保客戶端能與云上恢復出的應用有連接,或者恢復出的應用提供公網IP地址讓客戶端接入。
應用恢復的時候不要求必須使用原始IP地址,您也可以修改DNS確保客戶端可以連接新的服務。
如果域名和IP地址都發生變化,您需要修改客戶端。
災備設備和網絡環境
根據應用服務器的數量、數據量、RPO和RTO的標準、以及所依賴環境設施的要求,您可以合理選用災備設備并部署合適的網絡環境。
CDR災備一體機
如果支持虛擬化環境,且需要容災保護的服務器數量少于5臺,建議您進行虛擬化部署。
如果不支持虛擬化環境,或者容災保護的服務器數量在5臺以上,建議使用CDR災備一體機。可選擇的一體機型號如下所示:
型號
支持服務器數量
Apsara DR100
<20
Apsara DR200
<100
網絡環境
以上災備設備要求的網絡環境包括以下兩種:
數據中心到阿里云之間的網絡
由于優化了數據存儲傳輸算法,混合云容災服務并不強制要求本地數據中心與阿里云建立專線連接。但是對于大數據量、嚴格RPO要求的場景,建議您使用專線連接,以確保容災服務能夠達到要求的指標。
應用恢復后,根據客戶端、AD、DNS等與阿里云VPC的連接需求,您可能需要考慮通過SSLVPN、高速通道連接、應用暴露公網IP地址等方式來確保應用的正常使用。
混合云災備一體機到被保護服務器之間的網絡
為了對被保護服務器進行正常備份恢復,需要災備一體機和被保護服務器之間有網絡連接。
備份一體機提供了雙千兆、雙萬兆網卡供選擇,您可以根據備份恢復吞吐要求按需配置。