舊版告警與新版告警區(qū)別
新版本告警在升級原有功能的基礎(chǔ)上,擴(kuò)展了告警監(jiān)控、告警管理、通知管理的能力。本文介紹新版與舊版在架構(gòu)、功能和配置上的區(qū)別。
架構(gòu)升級
新版告警在告警規(guī)則監(jiān)控?cái)?shù)據(jù)、觸發(fā)告警后,通過告警策略進(jìn)行降噪、通過行動策略進(jìn)行渠道分派管理。并支持額外的告警事件管理和告警升級。
舊版告警工作流程
新版告警工作流程
功能升級
功能升級體現(xiàn)在原有告警功能的增強(qiáng)和新增功能。
現(xiàn)有功能的升級
功能點(diǎn)
舊版
新版
日志監(jiān)控
結(jié)果存在就觸發(fā)告警。
提供結(jié)果存在就觸發(fā)告警的選項(xiàng)。
固定任意條件滿足就觸發(fā)告警。
增加結(jié)果中滿足特定條數(shù)時才觸發(fā)告警的功能。
時序監(jiān)控
結(jié)果存在就觸發(fā)告警,查詢和分析語法編寫略繁瑣,固定任意條件滿足就觸發(fā)告警。
直接提供存在即觸發(fā)告警的選項(xiàng),增加結(jié)果中特定條數(shù)滿足時才觸發(fā)告警的功能。
結(jié)果存在就觸發(fā)告警。
提供結(jié)果存在就觸發(fā)告警的選項(xiàng)。
固定任意條件滿足就觸發(fā)告警。
增加結(jié)果中滿足特定條數(shù)時才觸發(fā)告警的功能。
不支持組合查詢。
增加支持組合查詢。
報表關(guān)聯(lián)
強(qiáng)制關(guān)聯(lián)至少一個報表。
不再強(qiáng)制要求關(guān)聯(lián)報表。
多庫關(guān)聯(lián)監(jiān)控
組合查詢時,僅支持笛卡爾積、不合并兩種操作。
組合查詢時,支持各種集合操作(笛卡爾積、不合并、拼接、左聯(lián)、右聯(lián)、全聯(lián)合、左斥和右斥等)。
同一告警去重
時間窗口內(nèi),忽略來自同一告警規(guī)則的告警。
增加基于標(biāo)簽定義的告警去重和延遲發(fā)送功能。
新版新增功能
在告警監(jiān)控、告警管理、通知管理以及告警分析方面增加以下新功能:
類別
功能點(diǎn)
功能描述
告警監(jiān)控
關(guān)聯(lián)日志與時序監(jiān)控
支撐SQL Join語法、查詢和統(tǒng)計(jì)的中間結(jié)果集合操作擴(kuò)展。
黑白名單監(jiān)控
使用資源數(shù)據(jù)關(guān)聯(lián)白名單或黑名單對象。
數(shù)據(jù)協(xié)同關(guān)聯(lián)監(jiān)控能力
支持跨Project、跨區(qū)域、跨賬號協(xié)同的集合操作。更多信息,請參見多集合操作機(jī)制。
告警嚴(yán)重度
支持設(shè)置告警靜態(tài)、動態(tài)、無數(shù)據(jù)時的告警嚴(yán)重度。更多信息,請參見設(shè)置告警嚴(yán)重度。
標(biāo)簽、標(biāo)注
支持自定義標(biāo)簽、標(biāo)注,其中標(biāo)注值可使用變量。更多信息,請參見標(biāo)簽和標(biāo)注。
多目標(biāo)監(jiān)控
支持對一條告警規(guī)則中查詢和分析結(jié)果進(jìn)行分組評估,不同分組分開發(fā)送告警通知。更多信息,請參見分組評估。
無數(shù)據(jù)告警
無數(shù)據(jù)時發(fā)送告警通知。更多信息,請參見無數(shù)據(jù)告警。
告警恢復(fù)
告警恢復(fù)時發(fā)送告警通知。更多信息,請參見恢復(fù)通知。
告警管理
告警降噪控制
全局的控制范圍、告警靜默、告警之間抑制和壓制、多種告警歸類合并等。更多信息,請參見告警管理概述。
通知管理
告警動態(tài)分派
支持根據(jù)告警屬性動態(tài)分派給特定渠道下的指定用戶、用戶組或值班組。更多信息,請參見渠道分派與發(fā)送機(jī)制。
接收人管理
支持獨(dú)立的用戶管理、用戶組管理以及值班組管理。更多信息,請參見創(chuàng)建用戶和用戶組、創(chuàng)建值班組。
支持日歷
支持感知不同國家的節(jié)假日、工作日等,并做動態(tài)調(diào)整。更多信息,請參見日歷重置機(jī)制。
值班表管理
支持豐富的輪崗排班方案、支持代班。單個值班組可以有獨(dú)立的日歷,支持節(jié)假日自定義和感知。更多信息,請參見輪崗與代班場景。
渠道額度控制
支持短信、語音、郵件的額度控制,并支持特定用戶、組的自定義控制。更多信息,請參見通知渠道額度控制機(jī)制。
告警分析
告警規(guī)則中心、告警鏈路中心、告警排障中心
支持告警監(jiān)控規(guī)則總體執(zhí)行態(tài)勢、觸發(fā)告警狀態(tài)、告警各個環(huán)節(jié)鏈路、以及告警系統(tǒng)中各階段的錯誤展示。支持按照區(qū)域、項(xiàng)目和嚴(yán)重度等過濾查看告警態(tài)勢。
全局存儲
全局化的告警存儲,便于查看接收、處理的告警和相關(guān)日志。
配置項(xiàng)變化
配置項(xiàng)變化主要體現(xiàn)在告警規(guī)則參數(shù)、通知配置和內(nèi)容模板變量的變化。
告警規(guī)則參數(shù)
從舊版遷移到新版告警后,新增如下配置項(xiàng),其余配置項(xiàng)與舊版保持一致。
新增配置項(xiàng)
默認(rèn)值
分組評估
不分組
查詢統(tǒng)計(jì)的集合操作
內(nèi)嵌
觸發(fā)條件
特定條數(shù)滿足
告警嚴(yán)重度
中
無數(shù)據(jù)告警
關(guān)閉
恢復(fù)通知
關(guān)閉
通知配置
升級后,日志服務(wù)提取手機(jī)號、郵箱作為用戶標(biāo)識,并創(chuàng)建對應(yīng)的用戶,提取通知內(nèi)容作為內(nèi)容模板的內(nèi)容。根據(jù)通知渠道配置生成對應(yīng)的行動策略,默認(rèn)使用SLS內(nèi)置動態(tài)告警策略(
sls.builtin.dynamic
)。說明通知渠道中相同手機(jī)號、相同郵箱地址會自動匹配已升級完成的用戶,并使用該用戶發(fā)送告警通知。
通知渠道中相同的通知內(nèi)容會自動匹配已升級完成的內(nèi)容模板,并在發(fā)送告警通知時使用升級完成的內(nèi)容模板。
相同通知渠道自動匹配已升級完成的行動策略,并在發(fā)送告警通知時使用該行動策略。
通知方式
新版
舊版
短信
用戶名+手機(jī)號+內(nèi)容模板
短信手機(jī)號碼+發(fā)送內(nèi)容
語音
用戶名+手機(jī)號+內(nèi)容模板
語音手機(jī)號碼+發(fā)送內(nèi)容
郵箱
用戶名+郵箱地址+內(nèi)容模板
郵箱地址+發(fā)送內(nèi)容
釘釘
用戶名+手機(jī)號+內(nèi)容模板
請求地址+釘釘中@手機(jī)號+發(fā)送內(nèi)容
內(nèi)容模板變量
為了與告警策略中應(yīng)用的告警變量一致,新版的內(nèi)容模板變量有所調(diào)整,并增加多個新的變量。其中新版與舊版在名稱上變化的部分,對應(yīng)關(guān)系如下。
舊版變量
新版變量
說明
Aliuid
aliuid
Project所屬的阿里云賬號ID
Project
project
告警規(guī)則所屬Project
AlertID
alert_instance_id
告警執(zhí)行ID
AlertDisplayName
alert_name
告警規(guī)則顯示名稱
Condition
condition
觸發(fā)告警的條件表達(dá)式。其中,以觸發(fā)告警的值替換設(shè)置的變量,并使用中括號([])包裹。
RawCondition
raw_condition
原始的條件表達(dá)式,即condition中不替換變量的原始表達(dá)式。
Dashboard
dashboard
告警規(guī)則關(guān)聯(lián)的儀表盤名稱
DashboardUrl
dashboard_url
告警規(guī)則關(guān)聯(lián)的儀表盤地址
FireTime
fire_time
觸發(fā)時間
FullResultUrl
query_url
告警觸發(fā)歷史記錄的查詢地址URL
Results
results
查詢參數(shù)和結(jié)果,數(shù)組類型。字段解釋請參見附錄:Results結(jié)構(gòu)。
說明最多發(fā)送100條告警通知。
附錄:Results結(jié)構(gòu)
舊版字段 | 新版字段 | 說明 |
Query | query | 查詢語句 |
LogStore | store | 查詢的目標(biāo)Logstore |
StartTime | start_time | 查詢開始時間 |
StartTimeTs | start_time_ts | 查詢開始時間,Unix時間戳 |
EndTime | end_time | 查詢結(jié)束時間 |
EndTimeTs | end_time_ts | 查詢結(jié)束時間,Unix時間戳 |
RawResults | raw_results | 查詢原始結(jié)果,數(shù)組類型,每個元素為一條日志。數(shù)組長度和日志內(nèi)容大小有關(guān),最多包含100條。 |
RawResultsAsKv | raw_results_as_kv | 按照key-value格式化的原始查詢結(jié)果。 說明 該字段只可以作為模板變量引用,不會保存到Logstore。 |
RawResultCount | raw_result_count | 原始結(jié)果條數(shù)。 |
FireResult | fire_result | 觸發(fā)告警的日志。如果告警未觸發(fā)則為null。 |
FireResultAsKv | fire_result_as_kv | 按照key-value格式化的觸發(fā)告警的日志。 說明 該字段只可以作為模板變量引用,不會保存到Logstore。 |