步驟五:應(yīng)用容災(zāi)
當被保護的服務(wù)器完成阿里云復制服務(wù)(AReS)安裝并重啟后,您就可以對受保護的服務(wù)器啟動、停止容災(zāi)復制、故障切換、容災(zāi)演練等一系列的應(yīng)用容災(zāi)操作。
前提條件
已安裝阿里云復制服務(wù)。更多信息,請參見步驟四:安裝阿里云復制服務(wù)。
操作流程
在容災(zāi)環(huán)境搭建過程中,不需要購買ECS。在應(yīng)用容災(zāi)時自動拉起ECS(由您指定的ECS規(guī)格)實例,該ECS實例規(guī)格費用由ECS收取。容災(zāi)演練恢復出來的ECS實例,也會收取費用。驗證完成后,建議盡快清空演練環(huán)境(自動刪除ECS),以降低費用支出。
通常情況下,應(yīng)用容災(zāi)的流程如下:
啟動復制
啟動容災(zāi)復制,將服務(wù)器復制到云上,并維持實時復制。按如下步驟啟動復制:
單擊切換到連續(xù)復制型容災(zāi)。
在左側(cè)導航欄,選擇 。
在受保護服務(wù)器頁簽,在要啟動容災(zāi)復制服務(wù)器右側(cè)對應(yīng)的操作列表下,選擇 。
在啟動復制頁面,分別選擇恢復點策略、使用SSD、復制網(wǎng)絡(luò)、恢復網(wǎng)絡(luò),以及復制中斷后是否自動重啟。單擊啟動。
說明復制網(wǎng)絡(luò)和恢復網(wǎng)絡(luò)所用的交換機須處于同一個可用區(qū)。
此時,容災(zāi)復制會先后進入啟動復制、全量復制、實時復制中三個階段。
啟動復制:ECS容災(zāi)服務(wù)正在掃描系統(tǒng)數(shù)據(jù),評估總體數(shù)據(jù)量,這一階段通常會持續(xù)幾分鐘。
全量復制:ECS容災(zāi)服務(wù)正在把整臺服務(wù)器的有效數(shù)據(jù)傳輸?shù)桨⒗镌疲@一階段所用時間取決于服務(wù)器數(shù)據(jù)量、網(wǎng)絡(luò)帶寬等因素。控制臺進度條將會展示復制進度。
實時復制中:全量復制完成后,阿里云上已經(jīng)復制了您的全量數(shù)據(jù),然后阿里云復制服務(wù)AReS(Aliyun Replication Service)將會在服務(wù)器上監(jiān)視所有對磁盤的寫操作,并持續(xù)地實時復制到阿里云。
(可選)容災(zāi)演練
按照您指定的具體策略,定期對服務(wù)器進行容災(zāi)演練,確保服務(wù)器能夠在阿里云上正常拉起。
當服務(wù)器進入實時復制狀態(tài),您就可以對服務(wù)器進行容災(zāi)演練操作了。
容災(zāi)演練將被容災(zāi)保護的服務(wù)器在云上拉起并驗證應(yīng)用正確性,是容災(zāi)流程整體中極其重要的一環(huán),其核心意義在于:
方便地驗證被容災(zāi)保護的應(yīng)用可以在云上正常拉起。
確保操作人員熟悉容災(zāi)恢復流程,當主站真正發(fā)生故障時,操作人員可以順暢地進行容災(zāi)切換。
按如下步驟進行容災(zāi)演練:
在受保護服務(wù)器頁簽,單擊要啟動容災(zāi)演練服務(wù)器右側(cè)對應(yīng)的操作列表下的容災(zāi)演練。
在容災(zāi)演練頁面,選擇恢復網(wǎng)絡(luò)、IP地址、使用ECS規(guī)格、硬盤類型、恢復點、彈性公網(wǎng)IP、切換后執(zhí)行腳本。單擊啟動。
說明云備份會自動為每個服務(wù)器保留最近24小時的24個恢復點。
如果不使用ECS規(guī)格,還需要填寫CPU、內(nèi)存信息。
此時,阿里云會在后臺基于用戶選定的時間點將服務(wù)器拉起。后臺容災(zāi)演練過程中,實時數(shù)據(jù)復制不受影響。
幾分鐘后,您會看到容災(zāi)演練完成,單擊容災(zāi)演練信息下的鏈接,驗證數(shù)據(jù)與應(yīng)用。
驗證完成后,單擊該服務(wù)器右側(cè)對應(yīng)的操作列表下的清空演練環(huán)境,此時恢復出來的ECS會被刪除。
說明容災(zāi)演練恢復出來的ECS驗證完成后,建議盡快清空演練環(huán)境,以降低費用支出。
故障切換
當本地自建數(shù)據(jù)中心出現(xiàn)重大故障時,對服務(wù)器進行故障切換,確保在阿里云上正常運行業(yè)務(wù)。而當您的主站發(fā)生重大故障,需要在云上馬上重啟核心業(yè)務(wù)時,則需要進行故障切換操作。
故障切換操作適用于被保護服務(wù)器已經(jīng)出現(xiàn)嚴重故障的情形,進行該操作會停掉實時復制流程。您需要重新啟動復制,并完成一次全量復制才能對被保護服務(wù)器繼續(xù)進行容災(zāi)保護。
按如下步驟進行故障切換:
在受保護服務(wù)器頁簽,在要啟動故障切換的服務(wù)器右側(cè)對應(yīng)的操作列表下,單擊 。
在故障切換對話框,選擇恢復網(wǎng)絡(luò)、IP地址、是否使用ECS規(guī)格、選擇硬盤類型、恢復點、彈性公網(wǎng)IP、切換后執(zhí)行腳本。單擊啟動。
重要當前時間恢復點只能使用一次。
故障切換完成后,單擊故障切換/故障恢復信息下的鏈接,檢查數(shù)據(jù)和應(yīng)用。
如果檢查后發(fā)現(xiàn)當前時間點應(yīng)用運行正常,選擇
。說明在故障切換或者切換恢復點完成,并且已經(jīng)確認被容災(zāi)保護的服務(wù)器恢復出的應(yīng)用已經(jīng)接管了業(yè)務(wù)的情況下,完成故障切換操作是為了清理容災(zāi)復制在云上占用的資源,節(jié)約資源使用。
如果檢查后發(fā)現(xiàn)當前時間點應(yīng)用狀態(tài)不符合要求,例如數(shù)據(jù)庫一致性問題,或者源端被污染的數(shù)據(jù)已經(jīng)被同步到另一個地域,請在確認故障切換前,選擇
。
說明切換恢復點操作與故障切換操作類似,僅需選擇更早的恢復點即可。
故障恢復
本機出現(xiàn)故障后在云上拉起本地業(yè)務(wù),待本地環(huán)境恢復后再將其恢復到本地。具體步驟如下:
在主站點管理頁簽,單擊+添加。
在添加計算平臺頁面,填寫計算平臺名稱,選擇類型,填寫IP地址、用戶名和密碼。單擊創(chuàng)建。
在連續(xù)復制型容災(zāi)的受保護服務(wù)器頁簽,選擇要啟動故障回切的服務(wù)器對應(yīng)的操作欄下的 。
在彈出的反向注冊面板,單擊確認。
此時,服務(wù)器狀態(tài)顯示反向注冊中,隨后進入已反向初始化。
選擇 。
在啟動反向復制面板,選擇計算平臺,單擊編輯選擇復制位置、計算資源、復制存儲及復制網(wǎng)絡(luò),然后選中使用DHCP。單擊啟動。
如果不選中使用DHCP,您還需要手動填寫復制IP地址、復制子網(wǎng)掩碼、復制DNS及復制網(wǎng)關(guān)信息。
此時,服務(wù)器狀態(tài)顯示啟動反向復制,隨后進入反向?qū)崟r復制中。
如果想要停止服務(wù)器的反向復制,選擇
。反向復制將云上數(shù)據(jù)復制到線下環(huán)境,完成后單擊
啟動線下已恢復服務(wù)器。
相關(guān)操作
在受保護服務(wù)器頁簽,單擊設(shè)置可見列,選中所有或部分可見列選項后單擊確認,查看服務(wù)器ID、RPO、服務(wù)器狀態(tài)等信息。
在操作列表下,選擇 ,查看被保護服務(wù)器的支持信息僅涉及容災(zāi)操作中容災(zāi)服務(wù)生成的日志,用于定位和解決問題。收集被保護的服務(wù)器支持信息后,您可以提交工單描述遇到的問題,并在工單中注明容災(zāi)網(wǎng)關(guān)的ID。