設置告警
日志服務已內(nèi)置CloudLens for CLB告警監(jiān)控規(guī)則,您只需添加對應的告警規(guī)則即可實時監(jiān)控CLB實例,并可通過釘釘?shù)惹澜邮盏礁婢ㄖ?。本文介紹設置告警的相關操作。
背景信息
CloudLens for CLB預設了基線告警、同環(huán)比告警、智能告警等告警監(jiān)控規(guī)則,包含QPS、延遲、錯誤率、流量等,并支持短信、釘釘、郵件、語音、自定義Webhook等通知方式,您可以根據(jù)實際應用場景選擇開啟不同的告警。每種類型的告警特點如下:
基線告警:超過或低于某個基準線即觸發(fā)告警,例如錯誤率高于1%觸發(fā)告警。
同環(huán)比告警:當前的值相比歷史某一時間點的變化率,例如流量相比昨天降低10%觸發(fā)告警。
智能告警:CloudLens for CLB預設了AIOps巡檢策略,在發(fā)現(xiàn)QPS、延遲等異常的時候會自動記錄異常事件,您可以直接設置發(fā)現(xiàn)某個異常時觸發(fā)告警。
操作步驟
- 登錄日志服務控制臺。
在日志應用區(qū)域的云產(chǎn)品Lens頁簽中,單擊CloudLens for CLB。
在左側(cè)導航欄中,單擊異常檢測。
在告警規(guī)則頁簽中,單擊新建告警右側(cè)的。
單擊從模板新建。
在告警監(jiān)控規(guī)則面板中,配置如下參數(shù),單擊確定。
參數(shù)
說明
規(guī)則名稱
告警監(jiān)控規(guī)則的名稱。
檢查頻率
日志服務根據(jù)您配置的頻率對查詢和分析結(jié)果進行檢查。
每小時:每小時檢查一次查詢和分析結(jié)果。
每天:在每天的某個固定時間點檢查一次查詢和分析結(jié)果。
每周:在周幾的某個固定時間點檢查一次查詢和分析結(jié)果。
固定間隔:按照固定間隔檢查查詢和分析結(jié)果。
Cron:通過Cron表達式指定時間間隔,按照指定的時間間隔檢查查詢和分析結(jié)果。
說明Cron表達式在日志服務的告警規(guī)則里最小精度為分鐘,格式為24小時制。例如:
0/5 * * * *
從0分鐘開始,每隔5分鐘檢查一次0 0/1 * * *
從0點0分開始,每隔1小時檢查一次0 18 * * *
每天18點0分檢查一次0 0 1 * *
每月1日0點0分檢查一次
Cron表達式語法,可參見Cron定時任務。
查詢統(tǒng)計
單擊輸入框,在查詢統(tǒng)計對話框中,設置查詢和分析語句。
關聯(lián)報表頁簽:選擇監(jiān)控儀表盤。
高級配置頁簽:
在類型列表選擇:
日志庫:用于存儲日志,相關的查詢分析配置請參見查詢和分析日志。
指標庫:用于存儲時序數(shù)據(jù),相關的查詢分析配置請參見查詢和分析時序數(shù)據(jù)。
資源數(shù)據(jù):用于配置特定告警監(jiān)控規(guī)則所關聯(lián)的外部數(shù)據(jù)。更多信息,請參見創(chuàng)建資源數(shù)據(jù)。
選擇類型為日志庫或指標庫,且設置了查詢和分析語句時,您可以選擇是否開啟獨享SQL。更多信息,請參見開啟SQL獨享版。
自動:默認不使用獨享SQL。當遇到查詢并發(fā)限制或者查詢結(jié)果不精確時,自動嘗試使用獨享SQL再次查詢。
啟用:始終使用獨享SQL進行查詢和分析。
關閉:關閉獨享SQL。
配置多個查詢統(tǒng)計時,您可以指定集合操作關聯(lián)多個查詢結(jié)果。更多信息,請參見設置查詢統(tǒng)計語句。
分組評估
日志服務支持對查詢和分析結(jié)果進行分組。更多信息,請參見設置分組評估。
標簽自定義:日志服務根據(jù)您配置的字段對查詢和分析結(jié)果進行分組。分組后,每個組單獨評估觸發(fā)條件。在每個檢查周期內(nèi),查詢和分析結(jié)果滿足觸發(fā)條件時,各個分組各自產(chǎn)生一條告警。
支持設置多個字段。
不分組:在每個檢查周期內(nèi),滿足觸發(fā)條件時,只產(chǎn)生一條告警。
標簽自動:當您在查詢統(tǒng)計中選擇指標庫(即監(jiān)控時序數(shù)據(jù)的查詢和分析結(jié)果)時 ,日志服務支持標簽自動分組。
分組后,每個組單獨評估觸發(fā)條件。在每個檢查周期內(nèi),查詢和分析結(jié)果滿足觸發(fā)條件時,各個分組各自產(chǎn)生一條告警。
觸發(fā)條件
配置觸發(fā)條件及嚴重度。
觸發(fā)條件
有數(shù)據(jù):當查詢和分析結(jié)果中存在數(shù)據(jù)時,觸發(fā)告警。
有特定條數(shù)據(jù):當查詢和分析結(jié)果中存在N條數(shù)據(jù)時,觸發(fā)告警。
有數(shù)據(jù)匹配:當查詢和分析結(jié)果中存在數(shù)據(jù)滿足告警表達式時,觸發(fā)告警。
有特定條數(shù)據(jù)匹配:當查詢和分析結(jié)果中存在N條數(shù)據(jù)滿足告警表達式時,觸發(fā)告警。
嚴重度
主要用于告警降噪控制和告警通知控制,即您在創(chuàng)建告警策略或行動策略時,可添加關于告警嚴重度的判斷條件。更多信息,請參見設置告警嚴重度。
簡單配置:直接選擇告警嚴重度,則表示通過該規(guī)則產(chǎn)生的告警都為同一嚴重度。
分條件配置:單擊添加,分條件設置告警嚴重度。
告警條件表達式的相關語法,請參見告警條件表達式語法。
添加標簽
日志服務允許您給產(chǎn)生的告警添加標識性屬性,鍵值對格式。主要用于告警降噪控制和告警通知控制,即您在創(chuàng)建告警策略或行動策略時,可添加關于標簽的判斷條件。更多信息,請參見添加標簽和標注。
添加標注
日志服務允許您給產(chǎn)生的告警添加非標識性屬性,鍵值對格式。主要用于告警降噪控制和告警通知控制,即您在創(chuàng)建告警策略或行動策略時,可添加關于標注的判斷條件。更多信息,請參見添加標簽和標注。
您還可以打開自動添加標注開關,系統(tǒng)自動在告警中添加__count__等信息。更多信息,請參見自動標注。
恢復通知
打開恢復通知開關后,告警恢復時觸發(fā)一條恢復告警。例如您創(chuàng)建了一個告警監(jiān)控規(guī)則,用于監(jiān)控各個主機的CPU指標,當CPU使用率超過95%時觸發(fā)告警,主機CPU使用率下降為正常值(低于等于95%)后發(fā)送一條恢復通知。更多信息,請參見設置恢復通知。
高級配置>連續(xù)觸發(fā)閾值
連續(xù)多少次執(zhí)行檢查評估都滿足觸發(fā)條件時,才會觸發(fā)一次告警。不滿足觸發(fā)條件時不計入統(tǒng)計。
高級配置>無數(shù)據(jù)告警
打開無數(shù)據(jù)告警開關后,如果查詢和分析的結(jié)果(有多個時,進行集合操作后的結(jié)果)為無數(shù)據(jù)的次數(shù)超過連續(xù)觸發(fā)閾值,則產(chǎn)生一條告警。更多信息,請參見無數(shù)據(jù)告警。
輸出目標
輸出目標用于配置告警事件的輸出位置,可以配置一個或多個輸出目標。
事件庫:將告警事件寫入到EventStore。
云監(jiān)控事件中心:將告警事件寫入到云監(jiān)控系統(tǒng)事件中心,通過云監(jiān)控對告警進行管理和通知。
SLS通知:將告警事件輸出到SLS的通知服務,通過告警策略、行動策略等對告警進行管理和通知。
輸出目標-事件庫
開啟:打開事件庫開啟開關后,告警將寫入到EventStore中。
地域:告警寫入的EventStore所屬地域。
Project:告警寫入的EventStore所屬項目。
事件庫:告警寫入的EventStore。
授權(quán)方式:
默認角色:單擊前往授權(quán),根據(jù)界面提示完成授權(quán),并扮演阿里云系統(tǒng)角色AliyunLogETLRole將告警寫入目標EventStore。具體操作,請參見默認角色授權(quán)。
自定義角色:扮演自定義角色將告警寫入目標EventStore,填寫角色ARN。具體操作,請參見自定義角色授權(quán)。
輸出目標-云監(jiān)控事件中心
開啟:打開云監(jiān)控事件中心開啟開關后,告警將發(fā)送到云監(jiān)控事件中心。更多信息,請參見查看系統(tǒng)事件。
輸出目標-SLS通知
開啟:打開SLS通知開關后,告警將發(fā)送到SLS通知服務進行后續(xù)的管理和通知。
告警策略
極簡模式
日志服務默認使用SLS內(nèi)置動態(tài)告警策略(sls.builtin.dynamic)進行告警管理。
只需配置行動組。
您配置行動組后,日志服務自動為您創(chuàng)建一個名為
規(guī)則名稱-行動策略
的行動策略。由該告警監(jiān)控規(guī)則觸發(fā)的所有告警都通過該行動策略發(fā)送通知。如何配置,請參見通知渠道說明。重要您可以在行動策略管理頁面,修改該行動策略。具體操作,請參見創(chuàng)建行動策略。如果您在修改行動策略時添加了判斷條件,則此處的告警策略將自動變更為普通模式。
普通模式
日志服務默認使用SLS內(nèi)置動態(tài)告警策略(sls.builtin.dynamic)進行告警管理。
選擇內(nèi)置的或自定義的行動策略進行告警通知。如何創(chuàng)建行動策略,請參見創(chuàng)建行動策略。
重復等待:在重復等待時間內(nèi),重復的告警只觸發(fā)一次行動策略,即只發(fā)送一次告警通知。
高級模式
選擇內(nèi)置的或自定義的告警策略進行告警管理。如何創(chuàng)建告警策略,請參見創(chuàng)建告警策略。
選擇內(nèi)置的或自定義的行動策略進行告警通知。如何創(chuàng)建行動策略,請參見創(chuàng)建行動策略。還可以開啟或關閉自定義行動策略。更多信息,請參見動態(tài)行動策略機制。
重復等待:在重復等待時間內(nèi),重復的告警只觸發(fā)一次行動策略,即只發(fā)送一次告警通知。
相關文檔
管理告警規(guī)則請參見管理告警監(jiān)控規(guī)則。