MSE云原生網關基于應用實時監控服務ARMS提供了應用監控報警功能,可在滿足報警條件時通過郵件、短信、釘釘等渠道實時報警,幫助您主動發現異常。在告警管理模塊中,您可以管理賬號下自定義監控報警規則,并查詢告警事件和告警通知的歷史記錄。
前提條件
背景信息
告警控件本質是數據集的數據展示方式,所以在創建告警控件的同時,會創建一個數據集來存儲告警控件的底層數據。
新建告警大約在10分鐘內生效,報警判斷會存在1 ~ 3分鐘的延時。
創建告警規則
登錄MSE網關管理控制臺,并在頂部菜單欄選擇地域。
在左側導航欄,選擇云原生網關 > 告警管理 > 告警規則管理。
在云原生網關告警頁面,單擊創建云原生網關告警策略管理。
在創建云原生網關告警策略管理頁面,配置告警相關參數,完成后單擊完成。
參數
描述
告警名稱
填寫告警規則名稱。
Gateway
選擇網關。
告警分組
選擇告警指標的分組。
告警指標
選擇告警指標,不同告警分組所支持的告警指標也不同,請根據實際需求進行選擇。
告警條件
設置觸發告警的條件,例如:當網關每秒請求量同比昨日降低20%時,發送告警。
篩選條件
默認無篩選,無需設置。
持續時間
設置產生告警事件的時間。
告警等級
設置告警的等級。告警嚴重程度從默認、P4、P3、P2、P1逐級上升。
告警內容
設置觸發該告警時,所顯示的告警內容。您可以使用Go template語法在告警內容中自定義告警參數變量,例如:
告警集群的ID:{{$label.envoy_clusterid}} 設置的告警閾值:{{$labels.metrics_params_value}} 觸發告警的實際值:{{ printf "%.2f" $value }}
同時,告警內容也會根據告警指標自動進行調整。
告警通知
選擇告警通知為極簡模式或普通模式。
快速指定通知策略
當告警通知選擇為普通模式時,ARMS告警中心會根據配置的通知策略對產生的告警事件進行分派、處理并發送通知。
高級設置
單擊圖標,設置告警規則標簽和注釋。
告警檢查周期
指定告警檢查周期。
標簽
單擊創建標簽,設置告警規則的標簽,設置的標簽可用作分派規則的選項。
注釋
單擊創建注釋,設置鍵為message,設置值為{{變量名}}告警信息。設置完成后的格式為:
message:{{$labels.pod_name}}重啟}}告警信息
,例如:message:{{$labels.pod_name}}重啟
。
后續操作
在云原生網關告警列表頁面,在操作列中按需對目標報警規則采取以下操作。
如需編輯告警規則,請單擊編輯,并在編輯云原生網關告警策略管理頁面修改告警規則,然后單擊保存。
如需啟用或停止告警規則,請單擊啟動或停止,并在提示對話框中單擊確認。
如需刪除報警規則,請單擊刪除,并提示對話框中單擊確認。
如需查看告警歷史,請單擊告警事件歷史,在事件列表頁面查看到歷史告警信息。
可選:如果您想要批量管理多條告警規則,可選中多條告警規則,然后執行以下操作。
如需批量啟動多條告警規則,請單擊批量操作>批量啟動告警規則,并在提示對話框中單擊確認。
如需批量停止多條告警規則,請單擊批量操作>批量停止告警規則,并在提示對話框中單擊確認。
如需批量刪除多條告警規則,請單擊批量操作>批量刪除告警規則,并在提示對話框中單擊確認。
如需批量設置標簽,請單擊批量操作>批量設置標簽,并在提示對話框中單擊確定。