MSE提供應用監控告警功能,可在滿足告警條件時通過郵件、短信、釘釘等渠道實時告警,幫助您主動發現異常。本文介紹如何創建和管理告警規則。
前提條件
背景信息
報警控件本質是數據集的數據展示方式,所以在創建報警控件的同時,會創建一個數據集來存儲報警控件的底層數據。
新建報警大約在10分鐘內生效,報警判斷會存在1分鐘~3分鐘的延時。
創建告警規則
登錄MSE注冊配置中心管理控制臺,并在頂部菜單欄選擇地域。
在左側導航欄,選擇注冊配置中心 > 告警管理 > 告警規則管理。
在MSE告警列表頁面,單擊創建MSE告警規則。
在創建MSE告警規則頁面,配置告警相關配置項,然后單擊保存。
配置項
描述
告警名稱
填寫告警規則名稱。
MSE實例
選擇集群。集群名稱后的
()
里顯示該集群的注冊配置中心類型,目前僅支持Nacos和ZooKeeper。告警分組
選擇告警指標的分組。
告警指標
選擇告警指標。不同告警分組所支持的告警指標也不同,請根據實際需求選擇。
告警條件
設置觸發告警的條件。例如,當服務數大于100時,發送告警。
篩選條件
默認無篩選,無需設置。
持續時間
設置持續時間。
告警等級
設置告警的等級。告警嚴重程度從默認、P4、P3、P2、P1逐級上升。
告警內容
設置觸發該告警時,所顯示的告警內容。您可以使用Go template語法在告警內容中自定義告警參數變量,例如:
告警集群的ID:{{$label.service_cluster_id}} 告警的集群節點:{{$label.kubernetes_pod_name}} 設置的閾值:{{$labels.metrics_params_value}} 觸發告警的實際值:{{ printf "%.2f" $value }}
同時,告警內容也會根據告警指標自動調整。
告警通知
選擇告警通知并進行相應的配置。可以選擇極簡模式或普通模式。
快速指定通知策略
選擇告警通知為普通模式時需要配置此項。
當告警觸發時,ARMS告警中心會根據配置的通知策略對產生的告警事件進行分派、處理并發送通知。
您可以單擊新建通知策略進行快速創建,也可以先在通知策略頁面創建自定義通知策略,然后在這里選擇已創建的通知策略。具體操作,請參見通知策略。
高級設置
告警檢查周期
設置告警檢查周期,默認值為1(單位:分鐘)。
數據完整后再檢查
選擇是否在數據完整后再檢查。
標簽
單擊創建標簽,設置告警規則的標簽,設置的標簽可用作分派規則的選項。
注釋
單擊創建注釋,設置鍵為message,設置值為{{變量名}}告警信息。設置完成后的格式為:
message:{{$labels.pod_name}}重啟告警信息
,例如message:{{$labels.pod_name}}重啟
。
后續操作
您在監控中創建的告警規則均會顯示在MSE告警列表頁面。
在MSE告警列表頁面,您可以在操作列中按需對目標報警規則采取以下操作。
如需編輯告警規則,請單擊編輯,并在編輯MSE告警規則頁面中修改告警規則,然后單擊完成。
如需啟用或停止告警規則,請單擊啟動或停止,并在提示對話框中,單擊確認。
如需刪除報警規則,請單擊刪除,并在提示對話框中單擊確認。
如需查看告警歷史,請單擊告警事件歷史,在事件列表頁面中查看到歷史告警信息。
可選:如果您想要批量管理多條告警規則,可選中多條告警規則,后按需單擊批量操作 > 批量啟動告警規則/批量停止告警規則/批量刪除告警規則/批量設置標簽,并在對話框單擊確認。