通過設置通知策略,您可以制定針對告警事件的分派條件。當分派條件被觸發時,系統會以您指定的通知方式向處理人發送告警信息,以提醒處理人采取必要的問題解決措施。
前提條件
創建聯系人,具體操作,請參見創建聯系人。
新建通知策略
登錄Prometheus控制臺,在左側導航欄選擇 。
在通知策略頁面單擊新建通知策略。
在新建通知策略頁面設置通知策略名稱。
在匹配規則區域設置告警事件的匹配規則。
重要靜默策略優先于通知策略,即已被靜默策略匹配到的告警事件將會被靜默,無法再進行通知策略的事件匹配。創建靜默策略的操作,請參見靜默策略。
選擇數據來源。
指定來源:通知策略會針對指定來源(集成)的告警事件進行匹配規則過濾并發送通知。
無預設來源:通知策略會針對所有告警事件進行匹配規則過濾并發送通知。
設置匹配規則表達式,您可以自定義標簽或選擇已有的標簽。
已有的標簽包括:
告警規則表達式指標中攜帶的標簽。可觀測監控 Prometheus 版告警規則創建標簽的操作,請參見Prometheus告警規則。
ARMS系統自帶的默認標簽,默認標簽說明如下。
分類
標簽
說明
常用字段
alertname
告警名稱。
clustername
集群名稱。
severity
告警等級:
P1
P2
P3
P4
默認
namespace
命名空間。
pod_name
系統預置字段
_aliyun_arms_integration_name
集成名稱,ARMS默認上報的告警集成名稱為ARMS-DEFAULT。
_aliyun_arms_involvedObject_id
告警對象ID。
_aliyun_arms_involvedObject_name
告警對象名稱。
_aliyun_arms_region_id
地域ID。
_aliyun_arms_alert_rule_id
告警規則ID。
_aliyun_arms_alert_type
告警規則類型:
101:Prometheus告警
5:應用監控告警
4:前端監控告警
說明如果需同時滿足多個匹配規則才告警,則單擊添加條件編輯第二條匹配規則條件。
如果需滿足任意一個匹配告警事件規則就告警,則單擊添加規則編輯第二條匹配規則。
單擊下一步。
在事件分組區域,設置告警事件是否需要分組,然后單擊下一步。
不需要分組:所有告警事件會以一條告警信息發送給處理人。
設置分組字段:字段內容相同的告警事件會匯總到同一告警發送通知。
在通知對象區域,設置以下參數。
單擊+添加通知對象選擇通知對象。
通知對象類型:
聯系人:選擇具體聯系人后還需選擇使用電話、短信或郵件的通知方式。
聯系人組:選擇具體聯系人組后還需選擇使用電話、短信或郵件的通知方式。
排班:選擇具體排班后還需選擇使用電話、短信或郵件的通知方式。
釘釘/飛書/企微:通過釘釘、飛書或企業微信發送告警通知。
通用Webhook:通過Webhook發送告警通知。
選擇告警恢復后是否發送恢復通知。
發送恢復通知:當告警下面全部事件都恢復時,告警狀態是否自動恢復為已解決。當告警恢復時,系統將會發送通知給告警處理人。
設置通知模板,更多信息,請參見配置通知模板和Webhook模板。
設置通知時段,告警會在設置的通知時段內發送告警通知。
可選:選擇告警需要推送到的工單系統。集成工單系統的操作,請參見通知集成。
單擊下一步。
在重復/升級/恢復策略區域,設置告警是否需要重復通知、使用升級策略或開啟手動恢復。然后單擊下一步。
不需要升級策略,告警未恢復狀態下只發送一次。
重復通知:設置重復頻率。當告警未恢復時,告警會以設置的重復頻率循環發送告警信息直至告警恢復。
升級策略:選擇升級策略,告警未恢復狀態下,告警通知將會根據升級策略發送通知給其他通知對象。
手動恢復:如果開啟手動恢復,當告警事件在告警集成中設置的自動恢復時間內都沒有再觸發,告警不會自動恢復,必須人工干預調整狀態。
在行動集成區域,設置告警是否開啟行動集成自動執行。
如果開啟行動集成自動執行,告警發生時將根據設定的時機自動化執行指定的行動集成,您需要選擇告警觸發和恢復時的行動集成。
設置完成后,單擊保存。
管理通知策略
通知策略新建完成后會顯示在通知策略頁面中,您可以在通知策略頁面執行以下操作:
編輯通知策略:單擊通知策略名稱或右側操作列的編輯,修改通知策略后單擊保存。
啟用或停用通知策略:在通知策略右側狀態列打開或關閉狀態開關。
刪除通知策略:單擊通知策略右側操作列的刪除,在彈出的對話框中單擊確認。
復制并生成一個相同的通知策略:單擊通知策略右側操作列的復制。