本文中含有需要您注意的重要提示信息,忽略該信息可能對您的業務造成影響,請務必仔細閱讀。
將邊界路由器VBR(Virtual Border Router)連接至云企業網實例后,您可以通過云企業網的健康檢查功能探測VBR實例關聯的物理專線的連通性。在云企業網和本地數據中心存在冗余路由的場景下,健康檢查探測到物理專線故障后支持自動切換到可用路由,保障流量傳輸不中斷。
背景信息
工作原理
在您為VBR實例配置健康檢查后,阿里云默認每隔2秒從每個健康檢查源IP地址向本地數據中心的健康檢查目標IP地址發送一個ping報文,如果ping報文從被探測物理專線鏈路原路返回,則認為物理專線鏈路正常。如果某條物理專線上連續8個ping報文都無響應或者ping報文從其他路徑被返回,則說明該物理專線鏈路故障。
健康檢查探測到物理專線鏈路故障后并不會向您發送通知,推薦您為物理專線配置報警規則,物理專線觸發報警規則后,系統會向您發送報警通知,方便您及時處理問題。
健康檢查目標IP地址必須保證能正常回應ping的探測,本地數據中心不能對ping探測進行限速或者禁止ping探測。
如果本地數據中心網絡設備配置了控制面板策略CoPP(Control Plane Policing)(如思科設備) 或者本機防攻擊策略(如華為設備)可能會導致健康探測報文被丟棄,造成健康檢查鏈路震蕩,建議本地數據中心網絡設備取消CoPP限速配置。
冗余物理專線說明
對于本地數據中心通過多個物理專線連接至阿里云的場景,推薦您為每個VBR實例配置健康檢查。如果健康檢查探測到物理專線鏈路故障,系統默認會將當前物理專線的流量切換至其他任意一個正常的物理專線進行傳輸。
在您配置健康檢查時,您也可以通過健康檢查的切換路由功能自定義是否允許路由切換。
前提條件
您已經將物理專線關聯的VBR實例連接至云企業網實例。具體操作,請參見創建VBR連接。
步驟一:在云企業網管理控制臺添加健康檢查配置
- 登錄云企業網管理控制臺。
- 在左側導航欄,單擊健康檢查。
在健康檢查頁面,選擇VBR實例所在的地域,然后單擊設置健康檢查。
在設置健康檢查對話框,根據以下信息配置健康檢查,然后單擊確認。
配置
說明
云企業網實例
選擇已連接VBR實例的云企業網實例。
邊界路由器(VBR)
選擇待監控的VBR實例。
源IP
源IP地址可通過以下兩種方式進行配置:
自動生成源IP(推薦):系統自動為您分配100.96.0.0/16網段內的IP地址。
自定義源IP:源IP地址可以是10.0.0.0/8、192.168.0.0/16、172.16.0.0/12三個網段內任意一個沒有被使用的IP地址,但不能與云企業網中要互通的IP地址沖突,也不能和VBR實例的阿里云側、客戶側IP地址沖突。
說明對于自動生成源IP的方式:
在以下地域下,每個地域最多支持為16個VBR實例自動分配源IP地址。
單擊查看地域信息美國(硅谷)、中國(香港)、美國(弗吉尼亞)、華北2(北京)、華東2(上海)、華南1(深圳)、新加坡、華東1(杭州)、華南2(河源)、西南1(成都)、華北3(張家口)、德國(法蘭克福)、馬來西亞(吉隆坡)、英國(倫敦)、華北1(青島)、印度尼西亞(雅加達)、華北5(呼和浩特)、華南3(廣州)、華北6(烏蘭察布)、華東5(南京-本地地域)、日本(東京)
在菲律賓(馬尼拉)、韓國(首爾)、華東6(福州-本地地域)、泰國(曼谷)地域下每個地域最多支持為8個VBR實例自動分配源IP地址。
無論您選擇哪種配置方式,健康檢查配置完成后,云企業網均會向VBR實例傳播一條目標網段為源IP地址,子網掩碼為32位的路由條目。
如果VBR實例和本地數據中心之間運行BGP動態路由協議,則當前路由條目會通過BGP動態路由協議被傳播至本地數據中心。
目標IP
目標IP地址為VBR實例客戶側IP地址。
發包時間間隔(秒)
指定健康檢查發送連續探測報文的時間間隔。單位:秒。
取值范圍:2~3。默認值:2。
探測報文個數(個)
指定健康檢查發送連續探測報文的個數。單位:個。
取值范圍:3~8。默認值:8。
切換路由
是否開啟健康檢查的路由切換功能。
系統默認選擇開啟本功能。健康檢查探測到物理專線鏈路故障時,如果云企業網實例中存在冗余的路由,健康檢查則會立刻觸發路由切換使用可用鏈路。
若您關閉本功能,健康檢查僅執行鏈路探測功能。若健康檢查探測到物理專線鏈路故障,則不會觸發路由切換。
警告若您選擇關閉本功能,請確保您有其他方式保證鏈路的冗余性,否則當物理專線鏈路故障后,會導致網絡中斷。
描述
為健康檢查添加描述信息。
步驟二:在本地數據中心側添加健康檢查配置
您需要在本地數據中心側添加健康檢查相關配置,以確保健康檢查正常工作。
在本地數據中心側添加健康檢查探測報文的回程路由。
重要如果您的VBR實例使用的是邊界路由協議BGP(Border Gateway Protocol)協議,配置健康檢查后阿里云側默認會將健康檢查源地址通過掩碼為32位路由方式宣告給本地數據中心,您無需再在本地數據中心側配置健康檢查探測報文的回程路由。
如果您的VBR實例使用的是靜態路由,您必須在本地數據中心手動配置目標網段為健康檢查源地址,子網掩碼為32位,下一跳指向對應物理專線的路由條目,否則健康檢查探測ping報文無法正常從被探測物理專線原路返回,會導致阿里云誤判物理專線鏈路不可用。
以下為手動添加健康檢查探測報文回程路由的配置示例,僅供參考。具體配置命令,請您咨詢設備廠商。
#配置健康檢查探測報文的回程路由 ip route <健康檢查源IP地址> 255.255.255.255 <目標VBR實例阿里側IP地址>
在本地數據中心側添加健康檢查的配置。
您可以在本地數據中心通過雙向轉發檢測BFD(Bidirectional Forwarding Detection)或者網絡質量分析NQA(Network Quality Analyzer)方式添加健康檢查的配置,以確保本地數據中心側也可以探測到物理專線的連通性。具體配置命令,請咨詢設備廠商。
在本地數據中心側添加健康檢查和路由聯動的配置。
對于本地數據中心通過多個物理專線連接至阿里云的場景,您需要在本地數據中心添加健康檢查和路由聯動的配置,以確保本地數據中心側也可以探測到物理專線的連通性并可以根據健康檢查結果自動實現路由切換。具體配置命令,請咨詢設備廠商。
步驟三:在云監控管理控制臺添加報警規則
配置健康檢查后,推薦您為物理專線添加報警規則,在物理專線觸發報警規則后,系統會向您發送報警通知,方便您及時處理問題。
登錄云監控控制臺。
在左側導航欄,選擇 。
在報警規則頁面,單擊創建報警規則。
在創建報警規則面板,選擇產品為云企業網-邊界路由器,然后配置相關報警規則,單擊確認。
此處僅列舉和本文強相關的配置。關于其余參數的配置,請參見創建報警規則。
單擊添加規則,然后在添加規則描述面板配置以下參數信息,然后單擊確定。
配置
說明
規則名稱
閾值報警規則的名稱。
指標類型
閾值報警規則的指標類型。本文以單指標為例進行配置說明,關于多指標和動態閾值的參數配置說明,請參見創建報警模板。
單指標
多指標
動態閾值
監控指標
選擇需要監控的指標。
延時:阿里云與本地數據中心通信時延情況。
丟包率:阿里云與本地數據中心通信的丟包率。
邊緣路由器流出帶寬:阿里云去往本地數據中心方向使用的帶寬。
邊緣路由器流入帶寬:從本地數據中心去往阿里云方向使用的帶寬。
閾值及報警級別
配置報警規則的報警條件、報警閾值和報警級別。
監控圖表預覽
監控指標的監控圖表預覽效果。
更多操作
操作 | 說明 | 操作步驟 |
編輯健康檢查 | 設置健康檢查后,您可以修改健康檢查的源IP、目標IP、發包時間間隔、探測報文個數的配置。 說明 不支持修改切換路由的配置,如果您需要修改切換路由的配置,需刪除當前健康檢查配置,然后重新添加。 |
|
刪除健康檢查 | 如果不再需要監測物理專線的連通性,您可以刪除健康檢查。 |
|
常見問題
在轉發路由器連接多個VBR實例的場景下,物理專線之間互為冗余是基于什么粒度的?
物理專線之間互為冗余是基于路由條目粒度的。
例如轉發路由器連接了VBR1和VBR2,轉發路由器路由表下存在如下的三條路由條目:
當VBR1的健康檢查失敗時,VBR1下訪問192.168.1.0/24網段的流量會被切換至VBR2下的物理專線進行傳輸。
當VBR2的健康檢查失敗時,VBR2下訪問192.168.1.0/24網段的流量會被切換至VBR1下的物理專線進行傳輸,VBR2下訪問192.168.2.0/24網段的流量不會被切換傳輸路徑。
目標網段 | 下一跳 | 下一跳關聯的網絡實例 |
192.168.1.0/24 | VBR1連接 | VBR1 |
192.168.1.0/24 | VBR2連接 | VBR2 |
192.168.2.0/24 | VBR2連接 | VBR2 |
在轉發路由器連接多個VBR實例的場景下(物理專線之間互為冗余),如果所有VBR實例的健康檢查均失敗,是否會導致流量中斷?
從阿里云去往本地數據中心的流量,阿里云側默認通過最后一個VBR實例下的物理專線進行傳輸。
如果最后一個VBR實例健康檢查失敗,但是物理專線連通性實際是正常的,則會導致阿里云去往本地數據中心流量可用帶寬減少(即只能通過一條物理專線進行傳輸)。
如果最后一個VBR實例健康檢查失敗,物理專線故障,則會導致阿里云去往本地數據中心的流量中斷。
最后一個VBR實例是指健康檢查最后失敗的VBR實例。例如轉發路由器連接了VBR1、VBR2和VBR3,轉發路由器路由表中存在以下3條路由條目,系統先檢測到VBR1和VBR2的健康檢查失敗,最后檢測到VBR3的健康檢查失敗,則VBR3即為最后一個VBR實例,阿里云去往本地數據中的流量均會通過VBR3下的物理專線進行傳輸。
目標網段
下一跳
下一跳關聯的網絡實例
192.168.1.0/24
VBR1連接
VBR1
192.168.1.0/24
VBR2連接
VBR2
192.168.1.0/24
VBR3連接
VBR3
從本地數據中心去往阿里云的流量,請根據您的網絡配置自行評估。
在轉發路由器連接多個VBR實例的場景下(物理專線之間互為冗余),如果所有VBR實例的健康檢查均失敗,是否會發生路由切換?
路由切換的動作取決于物理專線連通性的變化,當健康檢查探測到物理專線由連通變為不通,或者由不通變為連通時才會觸發路由切換。
刪除健康檢查配置,是否會導致路由動蕩或者流量中斷?
如果您在云企業網管理控制臺刪除了健康檢查配置,不會導致路由動蕩。系統會默認當前物理專線正常,并依據路由向當前物理專線轉發流量。
如果當前物理專線實際處于故障狀態,則會導致流量中斷。
如果您在本地數據中心刪除了健康檢查配置,請根據您的網絡配置自行評估。
相關文檔
故障排查:您可以參見本文內容排查物理專線故障。
EnableCenVbrHealthCheck:為VBR實例設置健康檢查或修改VBR實例的健康檢查配置。
DescribeCenVbrHealthCheck:查詢指定地域內VBR實例的健康檢查配置信息。
DisableCenVbrHealthCheck:刪除VBR實例的健康檢查配置。