日志服務(wù)新版告警是一站式的告警監(jiān)控、降噪、事務(wù)管理、通知分派的智能運(yùn)維平臺。本文介紹日志服務(wù)新版告警與各個開源告警系統(tǒng)的對比信息。

日志服務(wù)告警

日志服務(wù)新版告警支持監(jiān)控日志、時序等各類數(shù)據(jù),支持接收三方告警,支持對告警進(jìn)行降噪、事件管理、通知管理等,新增40+功能場景,充分考慮研發(fā)、運(yùn)維、安全以及運(yùn)營人員的告警監(jiān)控運(yùn)維需求。更多信息,請參見什么是日志服務(wù)告警

告警架構(gòu)

新版告警具備如下五大優(yōu)勢:

優(yōu)勢

與ELK X-Pack告警(Elasticsearch Watcher、Kibana 7.x+Alert)對比

自建ELK使用開源的Elasticsearch+Logstash+Kibana組合,其不包括告警功能。如果您要為自建ELK配置告警,需額外購買X-Pack商業(yè)包,其包含兩個告警功能(Elasticsearch Watcher和Kibana 7.x+Alert)。這兩個告警功能互相獨(dú)立,不能協(xié)同與關(guān)聯(lián)。

類別對比項(xiàng)日志服務(wù)告警ELK X-Pack告警
持久性告警服務(wù)可用性服務(wù)可用性>99.9%、存儲持久性>99.99999999%。商業(yè)版采用分布式,存儲數(shù)據(jù)需要手動配置。
成本費(fèi)用無訂閱費(fèi)用、免運(yùn)維、監(jiān)控與告警管理免費(fèi)、通知渠道僅短信和語音按照條數(shù)收取少量費(fèi)用。商業(yè)訂閱費(fèi)用、人工運(yùn)維費(fèi)用、自購的機(jī)器費(fèi)用、三方短信和語音費(fèi)用。
告警監(jiān)控監(jiān)控日志和時序數(shù)據(jù)的規(guī)模PB級別。TB級別。
監(jiān)控查詢分析語法支持SQL92語法(含擴(kuò)展)、PromQL語法、告警語法擴(kuò)展。
  • Elasticsearch Watcher:支持ES DSL。
  • Kibana 7.x+Alert:支持有限的過濾聚集操作。
機(jī)器學(xué)習(xí)能力支持十多種預(yù)測、異常檢測、根因分析等AI算法。支持X-Pack ML算法。
數(shù)據(jù)協(xié)同能力支持跨存儲庫、跨Project、跨地域、跨賬號協(xié)同監(jiān)控。支持同一集群下的同構(gòu)索引合并分析。
無數(shù)據(jù)告警支持。不支持。
告警恢復(fù)支持。不支持。
標(biāo)簽與標(biāo)注支持。Kibana 7.x+Alert支持自定義標(biāo)簽。
動態(tài)嚴(yán)重度支持。不支持。
分組評估支持,可自定義配置。
  • Elasticsearch Watcher:固定不分組。
  • Kibana 7.x+Alert:固定自動分組。
監(jiān)控側(cè)控制
  • 支持配置持續(xù)觸發(fā)閾值。
  • 支持暫停和自動恢復(fù)(基于時間)監(jiān)控。
Elasticsearch Watcher支持暫停和自動恢復(fù)(基于ACK)。
告警管理告警管理
  • 支持告警去重、合并、抑制、靜默。
  • 支持事務(wù)管理、責(zé)任人設(shè)置。
不支持。
通知管理通知管理支持通知渠道動態(tài)分派、告警級別提升、接收組管理、渠道日歷設(shè)置、值班表設(shè)置、渠道額度控制。不支持。
常用渠道支持短信、語音、釘釘、郵件、WebHook、阿里云消息中心等通知渠道。

其中通過WebHook,還支持企業(yè)微信、飛書、Slack等渠道。

支持郵件、WebHook等通知渠道,不支持短信和語音。
  • Watcher支持PagerDuty、JIRA、Slack。
  • Kibana Alert支持IBM Resilient、MS Teams、Service Now。

與Prometheus&Loki(含AlertManager)告警對比

自建Prometheus&Loki使用開源的Prometheus+Loki+AlertManager組合搭建告警監(jiān)控系統(tǒng),其中Prometheus Alert對時序數(shù)據(jù)進(jìn)行告警監(jiān)控,Loki對日志進(jìn)行告警監(jiān)控,兩者共同將告警發(fā)送給Alert Manager進(jìn)行告警管理。

類別對比項(xiàng)日志服務(wù)告警Prometheus+Loki 2.0告警
持久性告警服務(wù)可用性服務(wù)可用性>99.9%、存儲持久性>99.99999999%。部分服務(wù)采用分布式、部分服務(wù)采用單機(jī)可用性;存儲采用單機(jī)可用性。
成本費(fèi)用無訂閱費(fèi)用、免運(yùn)維、監(jiān)控與告警管理免費(fèi)、通知渠道僅短信和語音按照條數(shù)收取少量費(fèi)用。人工運(yùn)維費(fèi)用、自購的機(jī)器費(fèi)用、三方短信和語音費(fèi)用。
告警監(jiān)控監(jiān)控日志和時序數(shù)據(jù)的規(guī)模PB級別。
  • 日志:百GB級別。
  • 時序數(shù)據(jù):TB級別。
監(jiān)控查詢分析語法支持SQL92語法(含擴(kuò)展)、PromQL語法、告警語法。
  • 日志:LogQL語法。
  • 時序數(shù)據(jù):PromQL語法。
機(jī)器學(xué)習(xí)能力支持十多種預(yù)測、異常檢測、根因分析等AI算法。不支持。
數(shù)據(jù)協(xié)同能力支持跨存儲庫、跨Project、跨地域、跨賬號協(xié)同監(jiān)控。支持同一集群下跨指標(biāo)PromQL Join。
無數(shù)據(jù)告警支持。不支持。
告警恢復(fù)支持。支持。
標(biāo)簽與標(biāo)注支持。支持。
動態(tài)嚴(yán)重度支持。不支持。
分組評估支持,可自定義配置。支持按標(biāo)簽固定分組。
監(jiān)控側(cè)控制
  • 支持配置持續(xù)觸發(fā)閾值。
  • 支持暫停和自動恢復(fù)(基于時間)監(jiān)控。
支持設(shè)置持續(xù)觸發(fā)閾值,不支持暫停與恢復(fù)監(jiān)控。
告警管理告警管理
  • 支持告警去重、合并、抑制、靜默。
  • 支持事務(wù)管理、責(zé)任人設(shè)置。
支持告警去重、合并、抑制、靜默,不支持事務(wù)管理、責(zé)任人管理。
通知管理通知管理支持通知渠道動態(tài)分派、告警級別提升、接收組管理、渠道日歷設(shè)置、值班表設(shè)置、渠道額度控制。僅支持渠道動態(tài)分派,其他不支持。
常用渠道支持短信、語音、釘釘、郵件、WebHook、阿里云消息中心等通知渠道。

其中通過WebHook,還支持企業(yè)微信、飛書、Slack等渠道。

支持郵件、企業(yè)微信、WebHook(不支持自定義Body)、PagerDuty、PushOver、Slack、OpsGenie、VictorOps。不支持短信、語音服務(wù)。

通過三方插件,也可以支持釘釘、飛書、Slack等渠道。

與InfluxDB 2.0告警(含Kapacitor)告警對比

自建InfluxDB使用開源的InfluxDB OSS 2.0+Kapacitor組合搭建告警監(jiān)控系統(tǒng)。如果您需要集群部署功能,還需要購買InfluxDB商業(yè)版。該方案僅適用于時序數(shù)據(jù)的告警監(jiān)控。

類別對比項(xiàng)日志服務(wù)告警InfluxDB 2.0 告警(含Kapacitor)
持久性告警服務(wù)可用性服務(wù)可用性>99.9%、存儲持久性>99.99999999%。商業(yè)版采用分布式,支持存儲配置。開源采用單機(jī)版。
成本費(fèi)用無訂閱費(fèi)用、免運(yùn)維、監(jiān)控與告警管理免費(fèi)、通知渠道僅短信和語音按照條數(shù)收取少量費(fèi)用。商業(yè)版訂閱費(fèi)用、人工運(yùn)維費(fèi)用、自購的機(jī)器費(fèi)用、三方短信和語音費(fèi)用。
告警監(jiān)控監(jiān)控日志和時序數(shù)據(jù)的規(guī)模PB級別。
  • 日志:不支持。
  • 時序數(shù)據(jù):TB級別。
監(jiān)控查詢分析語法支持SQL92語法(含擴(kuò)展)、PromQL語法、告警語法擴(kuò)展。支持Flux語法。
機(jī)器學(xué)習(xí)能力支持十多種預(yù)測、異常檢測、根因分析等AI算法。支持Loud ML算法。
數(shù)據(jù)協(xié)同能力支持跨存儲庫、跨Project、跨地域、跨賬號協(xié)同監(jiān)控。支持單集群下跨Bucket Flux Join。
無數(shù)據(jù)告警支持。不支持。
告警恢復(fù)支持。不支持。
標(biāo)簽與標(biāo)注支持。支持設(shè)置簡單的標(biāo)簽。
動態(tài)嚴(yán)重度支持。支持。
分組評估支持,可自定義配置。不支持。
監(jiān)控側(cè)控制
  • 支持配置持續(xù)觸發(fā)閾值。
  • 支持暫停和自動恢復(fù)(基于時間)監(jiān)控。
不支持。
告警管理告警管理
  • 支持告警去重、合并、抑制、靜默。
  • 支持事務(wù)管理、責(zé)任人設(shè)置。
僅支持告警抑制,其他不支持。
通知管理通知管理支持通知渠道動態(tài)分派、告警級別提升、接收組管理、渠道日歷設(shè)置、值班表設(shè)置、渠道額度控制。僅支持通知渠道動態(tài)分派,其他不支持。
常用渠道支持短信、語音、釘釘、郵件、WebHook、阿里云消息中心等通知渠道。

其中通過WebHook,還支持企業(yè)微信、飛書、Slack等渠道。

支持郵件、WebHook(不支持靈活自定義Body)、exec、PagerDuty、PushOver、Slack、OpsGenie、VictorOps、HipChat等通知渠道。不支持短信、語音服務(wù)。