跨可用區(AZ)容災,即在同Region不同可用區部署同構的Hologres容災實例,如果生產實例所處的地理位置發生自然災害,或者實例內部出現了故障導致生產實例無法正常對外提供讀寫服務,那么容災實例可以切換為生產實例,從而保障業務連續性。本文為您介紹如何在Hologres配置跨可用區容災。
架構介紹
Hologres跨可用區容災部署架構圖如下:
當同Region(杭州Region)可用區(可用區I)中的Hologres實例無法正常運行時,可通過已配置的容災關系,將其他可用區(可用區J)的Hologres實例切換為生產實例,保障業務正常運行。
使用限制
僅支持Hologres V2.2.28及以上版本的通用型實例配置跨可用區容災,若您的實例版本低于V2.2.28,可聯系Hologres技術支持升級實例。
只讀從實例不支持作為容災實例。
生產實例和容災實例類型、版本必須一致。
若生產實例已開啟Serverless Computing,則不支持配置容災。
生產實例和容災實例必須處于同一地域的不同可用區。例如生產實例在華東1(杭州)可用區H,容災實例在華東1(杭州)可用區J。
生產實例和容災實例必須處于同一個專有網絡(VPC)。
注意事項
容災實例不支持備份恢復。
生產實例和容災實例需要一起升級。
不可以單獨停止生產實例或容災實例。
生產實例會向容災實例同步數據,容災實例的原有數據將被清除。
容災實例切換為主實例后,原本綁定在生產實例上的只讀從實例會進入停機狀態,待生產實例恢復使用后方可啟用。
當前僅支持容災強制切換,即無論生產和容災實例之間數據同步是否有延遲都進行切換。因此,在進行容災切換時,可能會導致RPO(Recovery Point Objective)大于零,出現一定程度的數據丟失。
說明RPO(Recovery Point Objective)即數據恢復點目標,指應用發生故障時預期的數據丟失量。
容災實例將和生產實例共用域名,域名在同一時刻僅指向其中一個實例。因此,同一時刻數據查詢和寫入僅能在生產或容災實例選其一進行。
釋放容災實例后,域名將指向生產實例。
釋放生產實例后:
生產實例上綁定的只讀從實例會被置為待綁定狀態。
容災實例將使用自身域名,容災實例和生產實例之間的數據同步關系會斷開。
配置容災
目前生產實例綁定容災實例需要由Hologres運維人員后臺操作,您可以加入Hologres釘釘交流群進行申請,詳情請參見如何獲取更多的在線支持?。
綁定時,您需要提供以下信息:
信息 | 描述 | 樣例 |
容災名稱 | 自定義名稱。 最大支持32個字符。 | 北京Region容災實例 |
生產實例ID | 主實例的ID。 | hgpostcn-cn-1xxxxx |
容災實例ID | 作為災備實例的ID。 | hgpostcn-cn-2xxxxx |
生產實例綁定容災實例后,您可以在云監控中查看實例間文件同步延遲,詳情請參見查看監控指標。
查看容災信息
綁定完成后,您可在Hologres管理控制臺中查看綁定的容災關系以及容災詳情。
操作步驟如下:
在頂部菜單欄左側,選擇相應的地域。
在左側導航欄單擊容災管理。
在容災管理頁面,單擊目標容災操作列的管理,進入容災詳情頁。
容災詳情頁中為您提供當前容災的基礎信息、生產實例信息、災備實例信息以及網絡信息。
異常切換
使用場景
異常切換是生產實例故障或容災異常情況下進行的主備實例切換操作。當生產實例發生故障且容災實例處于待機狀態時,您可根據實際情況自行判斷是否將容災實例切換成主實例。
重要生產實例故障時,如存在部分數據未同步至容災實例。容災實例異常切換成主實例后,將缺失這部分數據。因此,您在進行異常切換時,請確認容災數據同步的最后時間,務必謹慎操作。
使用步驟
在頂部菜單欄左側,選擇相應的地域。
在左側導航欄單擊容災管理。
在容災管理頁面,單擊目標容災操作列的異常切換。
說明觸發異常切換后,實例立刻開始切換。因此,RPO(Recovery Point Objective)在理論上會大于等于當前同步延遲。
在異常切換對話框中,單擊異常切換。
異常切換時,容災情況顯示為異常切換中,切換完成后,容災情況更新為建立同步鏈路中。
說明切換完成后,容災域名將指向容災實例,您可以使用容災域名進行數據查詢和寫入。
系統會自動建立由容災實例向生產實例同步數據的鏈路。