本文介紹多活實例的容災大屏功能。容災大屏展示的是多活實例的容災架構拓撲,以及邏輯單元和邏輯單元格中各層的監控數據。
前提條件
容災架構拓撲圖使用指南
容災大屏僅展示當前多活實例對應的容災架構。
同城多活容災
登錄多活容災MSHA控制臺。
在左側導航欄,單擊多活實例。
在多活實例頁面,單擊目標實例的實例名稱/ID進入多活實例詳情頁面。
在多活實例詳情頁面,選擇
,然后單擊同城多活容災。在單元右側的下拉列表中選擇不同的單元,切換至不同單元下的容災架構拓撲圖。
在同城多活容災頁簽,查看業務概況和告警事件。
在右側容災拓撲圖的終端用戶區域,單擊查看,查看本單元的域名信息。
說明終端用戶兩側的百分比,代表本單元格的流量比例。各模塊指標含義,請參見附錄。
異地雙活容災
登錄多活容災MSHA控制臺。
在左側導航欄,單擊多活實例。
在多活實例頁面,單擊目標實例的實例名稱/ID進入多活實例詳情頁面。
在多活實例詳情頁面,選擇
,單擊異地雙活容災。在單元右側的下拉列表中選擇不同的單元,切換至不同單元下的容災架構拓撲圖。
在同城多活容災頁簽,查看業務概況和告警事件。
在右側容災拓撲圖的終端用戶區域,單擊查看,查看本業務LDC的域名信息。
在流量比例下方查看本單元的精準路由/范圍路由信息,單擊查看,查看本單元的子域名信息。
說明終端用戶上方展示了當前業務LDC中的同步鏈路總數和同步鏈路異常百分比。
終端用戶兩側的百分比,表示本單元的流量比例。
各模塊指標含義,請參見附錄。
異地應用雙活容災
登錄多活容災MSHA控制臺。
在左側導航欄,單擊多活實例。
在多活實例頁面,單擊目標實例的實例名稱/ID進入多活實例詳情頁面。
在多活實例詳情頁面,選擇
,單擊異地應用雙活容災。在單元右側的下拉列表中選擇不同的單元,切換至不同單元下的容災架構拓撲圖。
在同城多活容災頁簽,查看業務概況和告警事件。
在右側容災拓撲圖的終端用戶區域,單擊查看,查看本業務LDC的域名信息。
在流量比例下方查看本單元的精準路由/范圍路由信息,單擊查看,查看本單元的子域名信息。
說明終端用戶上方展示了當前業務LDC中的同步鏈路總數和同步鏈路異常百分比。
終端用戶兩側的百分比,表示本單元的流量比例。
各模塊指標含義,請參見附錄。
附錄
瞬時監控值
容災拓撲圖上,各個模塊展示的數值,代表監控指標當前時刻的瞬時值。
模塊 | 監控指標名稱 | 監控指標含義 | 所屬架構 |
接入層/MSFE或MSE | QPS | 接入層集群請求的次數/秒鐘,即QPS=并發數/平均響應時間。 |
|
RT | 接入層集群的平均響應時間,即處理請求快慢。 | ||
錯誤率 | 接入層集群請求的錯誤率,錯誤率=請求錯誤數/請求總數。 | ||
應用實例 | 該單元實例總數 | 應用節點頁面中,本單元的應用數量。 |
|
SDK&Agent切面錯誤率 | SDK切面執行錯誤的比例,錯誤率=切面執行錯誤數/切面執行總數。 | ||
SDK&Agent調用錯誤率 | 使用SDK的用戶調用執行錯誤的比例,錯誤率=切面執行錯誤數/切面執行總數。 | ||
服務層 | 消費者調用總QPM | 消費者用戶請求的次數/分鐘,即QPM=(并發數/平均響應時間)×60。 |
|
提供者調用總QPM | 提供者用戶請求的次數/分鐘,即QPM=(并發數/平均響應時間)×60。 | ||
消費者切面總QPM | 消費者SDK切面調用的次數/分鐘,即QPM=(并發數/平均響應時間)×60。 | ||
提供者切面總QPM | 提供者SDK切面調用的次數/分鐘,即QPM=(并發數/平均響應時間)×60。 | ||
服務同步次數 | 注冊中心同步服務的同步次數/分鐘。 |
| |
服務同步錯誤數 | 注冊中心同步服務的同步錯誤次數/分鐘。 | ||
消息層 | 消費者調用總QPM | 消費者用戶請求的次數/分鐘,即QPM=(并發數/平均響應時間)×60。 |
|
提供者調用總QPM | 提供者用戶請求的次數/分鐘,即QPM=(并發數/平均響應時間)×60。 | ||
消費者切面總QPM | 消費者SDK切面調用的次數/分鐘,即QPM=(并發數/平均響應時間)×60。 | ||
提供者切面總QPM | 提供者SDK切面調用的次數/分鐘,即QPM=(并發數/平均響應時間)×60。 | ||
數據層 | QPS | 數據層請求的次數/秒鐘,即QPS=并發數/平均響應時間。 |
|
禁寫數 | 數據庫切流態禁寫數/分鐘。 | ||
SQL異常率 | SQL執行錯誤率,錯誤率=SQL執行錯誤數/SQL執行總數。 |
監控圖表
在容災大屏頁面,單擊容災拓撲圖各個模塊右上角的監控詳情,查看各層的監控圖表。
模塊 | 監控指標名稱 | 監控指標含義 | 所屬架構 |
接入層/MSFE或MSE | 應用回源QPS | 接入層集群的請求次數/秒鐘,即QPS=本單元的請求次數/秒鐘+對端單元糾偏到本單元的請求次數/秒鐘。 |
重要 業務LDC下的單元數量必須為2。 |
接入層負載QPS | 接入層集群請求的數量/秒鐘,即QPS=并發數/平均響應時間。 |
| |
RT(ms) | 接入層集群的平均響應時間,即處理請求快慢。 | ||
錯誤率(%) | 接入層集群請求的錯誤率,錯誤率=請求錯誤數/請求總數。 | ||
應用實例 | SDK&Agent切面調用內核錯誤數 | SDK切面執行錯誤的次數/分鐘。 |
|
SDK&Agent用戶調用內核錯誤率 | 使用SDK的用戶調用執行錯誤的次數/分鐘。 | ||
服務層 | 微服務Consumer用戶調用次數/每分鐘 | 消費者用戶請求的次數/分鐘,即(并發數/平均響應時間)×60。 |
|
微服務Consumer用戶調用平均RT(ms)/每分鐘 | 消費者用戶請求的平均響應時間/分鐘。 | ||
微服務Provider用戶調用次數/每分鐘 | 提供者用戶請求的次數/分鐘,即(并發數/平均響應時間)×60。 | ||
微服務Provider用戶調用平均RT(ms)/每分鐘 | 提供者用戶請求的平均響應時間/分鐘。 | ||
微服務Consumer切面調用次數/每分鐘 | 消費者SDK切面調用的次數/分鐘,即(并發數/平均響應時間)×60。 | ||
微服務Consumer切面調用平均RT(ms)/每分鐘 | 消費者SDK切面調用的平均響應時間/分鐘。 | ||
微服務Provider切面調用次數/每分鐘 | 提供者SDK切面調用的次數/分鐘,即(并發數/平均響應時間)×60。 | ||
微服務Provider切面調用平均RT(ms)/每分鐘 | 提供者SDK切面調用的平均響應時間/分鐘。 | ||
注冊中心元數據缺少MSHA單元標的Provider數量/每分鐘 | 缺少MSHA單元標的提供者數量/分鐘。 | ||
服務同步次數/分鐘 | 注冊中心同步服務的同步次數/分鐘。 |
| |
服務同步錯誤數/分鐘 | 注冊中心同步服務的同步錯誤次數/分鐘。 | ||
服務同步平均RT(ms)/分鐘 | 注冊中心同步服務的同步任務的平均響應時間/分鐘。 | ||
消息層 | 消息Pub用戶調用次數 | 提供者用戶請求的次數/分鐘,即(并發數/平均響應時間)×60。 |
|
消息Pub用戶調用平均RT(ms) | 提供者用戶請求的平均響應時間/分鐘。 | ||
消息Sub用戶調用次數 | 消費者用戶請求的次數/分鐘,即(并發數/平均響應時間)×60。 | ||
消息Sub用戶調用平均RT(ms) | 消費者用戶請求的平均響應時間/分鐘。 | ||
消息Pub切面調用次數 | 提供者SDK切面調用的次數/分鐘,即(并發數/平均響應時間)×60。 | ||
消息Pub切面調用平均RT(ms) | 提供者SDK切面調用的平均響應時間/分鐘。 | ||
消息Sub切面調用次數 | 消費者SDK切面調用的次數/分鐘,即(并發數/平均響應時間)×60。 | ||
消息Sub切面調用平均RT(ms) | 消費者SDK切面調用的平均響應時間/分鐘。 | ||
數據層-Redis | Redis命令執行切面調用次數/每分鐘 | Redis請求的切面調用次數/分鐘,即(并發數/平均響應時間)×60。 |
|
Redis命令執行切面調用平均RT(ms)/每分鐘 | Redis請求的切面調用平均響應時間/分鐘。 | ||
Redis命令執行切流態禁寫數/每分鐘 | Redis請求切流態觸發禁寫的次數/分鐘。 | ||
數據層-Jdbc | 數據庫JDBC用戶調用次數/分鐘 | 經過SDK的用戶JDBC請求的次數/分鐘,即(并發數/平均響應時間)×60。 |
|
數據庫JDBC用戶調用平均RT(ms)/分鐘 | 經過SDK的用戶JDBC請求的平均響應時間/分鐘。 | ||
數據庫JDBC切面調用次數/分鐘 | JDBC請求的切面調用次數/分鐘,即(并發數/平均響應時間)×60。 | ||
數據庫JDBC切面調用平均RT(ms)/分鐘 | JDBC請求的切面調用平均響應時間/分鐘。 | ||
數據庫JDBC日常態錯誤流量禁寫數/分鐘 | JDBC請求日常態觸發禁寫的次數/分鐘。 | ||
數據庫JDBC切流態禁寫數/分鐘 | JDBC請求切流態觸發禁寫的次數/分鐘。 |