如何配置流轉(zhuǎn)規(guī)則
本文檔主要介紹如何配置流轉(zhuǎn)規(guī)則。
新增流轉(zhuǎn)規(guī)則添加
前提條件:需要配置流轉(zhuǎn)規(guī)則的監(jiān)控源已成功接入集成并設(shè)置好業(yè)務(wù)需要的監(jiān)控項(xiàng)。
登錄運(yùn)維事件中心。
在左側(cè)導(dǎo)航欄選擇
。單擊新增規(guī)則。
在新增規(guī)則頁面:
配置觸發(fā)條件:設(shè)置規(guī)則名稱、觸發(fā)規(guī)則(規(guī)則條件需要選擇監(jiān)控源、key)、服務(wù)名稱。
配置規(guī)則觸發(fā)報(bào)警的收斂規(guī)則,觸發(fā)事件的收斂規(guī)則和通知/分派規(guī)則。
配置觸發(fā)條件
設(shè)置規(guī)則名稱:自定義流轉(zhuǎn)規(guī)則名稱簡單描述規(guī)則的作用,最大輸入不超過64個(gè)字符,流轉(zhuǎn)規(guī)則名稱不可重復(fù)。
選擇當(dāng)前流轉(zhuǎn)規(guī)則關(guān)聯(lián)服務(wù)(添加服務(wù)可參見新增服務(wù))。
配置觸發(fā)規(guī)則
觸發(fā)類型:觸發(fā)類型需要用戶根據(jù)告警嚴(yán)重程度主觀選擇觸發(fā)類型。
配置子規(guī)則:同一流轉(zhuǎn)規(guī)則可以配置1-5條子規(guī)則,所有子規(guī)則的數(shù)據(jù)源,取自同一監(jiān)控源,當(dāng)監(jiān)控源滿足所有或任一子規(guī)則時(shí),該流轉(zhuǎn)規(guī)則才會被觸發(fā)。
報(bào)警字段:選擇key包含/不包含哪些值;等于/不等于哪些值作為報(bào)警條件。
監(jiān)控源:只能選擇已集成的監(jiān)控源,不同子規(guī)則可以選擇同一個(gè)監(jiān)控源。
配置降噪規(guī)則:配置多子規(guī)則時(shí)需要配置時(shí)間窗口實(shí)現(xiàn)報(bào)警的降噪,規(guī)則條件底部會有“設(shè)置時(shí)間”窗口,最大時(shí)間限制為1440分鐘,時(shí)間單位僅支持分鐘。
告警來源:觸發(fā)事件&報(bào)警&故障
以下規(guī)則僅適用監(jiān)控源為:Prometheus/京東云云監(jiān)控/阿里云云監(jiān)控等,除業(yè)務(wù)監(jiān)控外的所有其他監(jiān)控源。
在新增規(guī)則頁面,選擇觸發(fā)規(guī)則的類型;選擇僅觸發(fā)報(bào)警需要配置報(bào)警觸發(fā)規(guī)則、優(yōu)先級和默認(rèn)通知對象;選擇觸發(fā)事件需配置事件觸發(fā)規(guī)則、優(yōu)先級、影響程度和默認(rèn)分派對象;選擇觸發(fā)故障需要配置故障影響服務(wù)、故障等級覆蓋。配置完成之后單擊提交即可。
僅觸發(fā)報(bào)警:
確定報(bào)警觸發(fā)規(guī)則:設(shè)置觸發(fā)的持續(xù)時(shí)長和次數(shù)對報(bào)警進(jìn)行收斂降噪;如,某個(gè)規(guī)則在持續(xù)5分鐘內(nèi)觸發(fā)3次才會觸發(fā)報(bào)警,只要將時(shí)長和次數(shù)分別設(shè)置為5分鐘和3次即可。
報(bào)警優(yōu)先級:選擇報(bào)警等級 P1-P4。P1為最高優(yōu)先級,P4最低。
默認(rèn)通知對象:流轉(zhuǎn)規(guī)則滿足觸發(fā)條件后默認(rèn)的通知傳達(dá)對象,支持分派到服務(wù)組和個(gè)人。
默認(rèn)通知渠道:流轉(zhuǎn)規(guī)則滿足觸發(fā)條件默認(rèn)通知分派對象的通知方式,若選擇的默認(rèn)分配對象是到服務(wù)組,通知渠道選擇范圍:群通知、短信、電話、郵件、移動應(yīng)用個(gè)人通知,可多選。若選擇的默認(rèn)分配對象是到個(gè)人,通知渠道選擇范圍:短信、電話、郵件、移動應(yīng)用個(gè)人通知。
觸發(fā)事件:
確定事件觸發(fā)規(guī)則:設(shè)置觸發(fā)的持續(xù)時(shí)長和次數(shù)對事件進(jìn)行收斂降噪;如,某個(gè)規(guī)則在持續(xù)5分鐘內(nèi)觸發(fā)3次才會觸發(fā)事件,只要將時(shí)長和次數(shù)分別設(shè)置為5分鐘和3次即可。
事件優(yōu)先級:選擇事件等級,P1為最高優(yōu)先級,P4最低。
影響程度:選擇事件影響程度高或低。
默認(rèn)分配對象:流轉(zhuǎn)規(guī)則滿足觸發(fā)條件后默認(rèn)的分派對象,支持分派到服務(wù)組和個(gè)人。
配置通知渠道:流轉(zhuǎn)規(guī)則滿足觸發(fā)條件默認(rèn)通知分派對象的通知方式,若選擇的默認(rèn)分配對象是到服務(wù)組,通知渠道選擇范圍:群通知、短信、電話、郵件、移動應(yīng)用個(gè)人通知,可多選。若選擇的默認(rèn)分配對象是到個(gè)人,通知渠道選擇范圍:短信、電話、郵件、移動應(yīng)用個(gè)人通知。
啟動故障應(yīng)急
確定故障觸發(fā)規(guī)則:設(shè)置觸發(fā)的持續(xù)時(shí)長和次數(shù)對故障進(jìn)行收斂降噪;如,某個(gè)規(guī)則在持續(xù)5分鐘內(nèi)觸發(fā)3次才會觸發(fā)故障,只需將時(shí)長和次數(shù)分別設(shè)置為5分鐘和3次即可。
影響服務(wù):設(shè)置故障的影響面;故障觸發(fā)后,對其同樣存在影響的關(guān)聯(lián)服務(wù)。
故障等級:選擇故障等級P1-P4。P1為最高優(yōu)先級,P4最低。
默認(rèn)通知對象:流轉(zhuǎn)規(guī)則滿足觸發(fā)條件后默認(rèn)的通知傳達(dá)對象,支持分派到服務(wù)組和個(gè)人。
默認(rèn)通知渠道:流轉(zhuǎn)規(guī)則滿足觸發(fā)條件默認(rèn)通知分派對象的通知方式,若選擇的默認(rèn)分配對象是到服務(wù)組,通知渠道選擇范圍:群通知、短信、電話、郵件、移動應(yīng)用個(gè)人通知,可多選。若選擇的默認(rèn)分配對象是到個(gè)人,通知渠道選擇范圍:短信、電話、郵件、移動應(yīng)用個(gè)人通知。
升級規(guī)則:可配置故障自動升級規(guī)則。當(dāng)故障持續(xù)時(shí)長達(dá)到一定長度,立即觸發(fā)自動升級策略。如P3故障持續(xù)60分鐘未解決后,自動升級至P2。故障升級僅支持逐級上升,不可跨級上升。
業(yè)務(wù)監(jiān)控來源:觸發(fā)事件&報(bào)警&故障
以下規(guī)則僅適用于業(yè)務(wù)監(jiān)控的監(jiān)控源。且進(jìn)行流轉(zhuǎn)規(guī)則配置時(shí),會按當(dāng)前關(guān)聯(lián)服務(wù)進(jìn)行告警數(shù)據(jù)過濾,因此務(wù)必保證流轉(zhuǎn)規(guī)則的關(guān)聯(lián)服務(wù)和業(yè)務(wù)監(jiān)控的關(guān)聯(lián)服務(wù)保持一致。
運(yùn)維事件中心在業(yè)務(wù)監(jiān)控經(jīng)過數(shù)據(jù)清洗、分析和告警命中,輸出標(biāo)準(zhǔn)數(shù)據(jù)格式,吐到流轉(zhuǎn)規(guī)則,供用戶進(jìn)行自定義配置事件、故障定級。
業(yè)務(wù)監(jiān)控告警數(shù)據(jù)包含:監(jiān)控項(xiàng)ID,監(jiān)控項(xiàng)名稱,告警等級,告警明細(xì)等。
監(jiān)控項(xiàng)ID:當(dāng)前告警信息來源的監(jiān)控項(xiàng)ID,用于追溯指標(biāo)的監(jiān)控?cái)?shù)據(jù)。
監(jiān)控項(xiàng)名稱:監(jiān)控項(xiàng)名稱,可用于按監(jiān)控項(xiàng)建立事件/故障流轉(zhuǎn)規(guī)則。
告警等級:提醒、警告、嚴(yán)重、致命??捎糜诤褪录?故障等級從P4-P1一一對應(yīng)。
告警明細(xì):告警的指標(biāo),告警觸發(fā)條件和當(dāng)前指標(biāo)數(shù)值。
告警觸發(fā)時(shí)間:業(yè)務(wù)監(jiān)控觸發(fā)告警的時(shí)間。
在進(jìn)行業(yè)務(wù)監(jiān)控源的流轉(zhuǎn)規(guī)則配置時(shí),alarmId為必填字段,alarmLevel建議(不強(qiáng)制)按等級(提醒、警告、嚴(yán)重、致命)和事件或故障的等級一一對應(yīng)。便于后續(xù)的通告消息可追溯監(jiān)控項(xiàng)及監(jiān)控指標(biāo)。
編輯流轉(zhuǎn)規(guī)則
已設(shè)置的流轉(zhuǎn)規(guī)則可以在流轉(zhuǎn)規(guī)則頁面操作列單擊編輯進(jìn)行修改,流轉(zhuǎn)規(guī)則名稱不可重復(fù)。
啟用禁用流轉(zhuǎn)規(guī)則
在流轉(zhuǎn)規(guī)則頁面操作列單擊啟用/禁用,啟用后,滿足流轉(zhuǎn)規(guī)則條件的會觸發(fā)對應(yīng)的報(bào)警或事件;禁用后,收到的原始報(bào)警數(shù)據(jù)不會觸發(fā)事件或報(bào)警。
刪除流轉(zhuǎn)規(guī)則
操作入口:在流轉(zhuǎn)規(guī)則頁面操作列單擊刪除,刪除后,不再觸發(fā)事件和報(bào)警。
刪除條件:禁用狀態(tài)下無法刪除流轉(zhuǎn)規(guī)則。