使用智能檢測算子發(fā)現(xiàn)異常數(shù)據(jù)
可觀測監(jiān)控 Prometheus 版可以通過智能檢測算子算法自動地發(fā)現(xiàn)KPI時間序列數(shù)據(jù)中的異常波動,實現(xiàn)時間序列的異常檢測,為后續(xù)的告警、自動止損、根因分析等提供決策依據(jù),本文介紹使用智能檢測算子發(fā)現(xiàn)異常數(shù)據(jù)波動的操作方法。
檢測Prometheus實例的異常數(shù)據(jù)波動
在左側(cè)導(dǎo)航欄單擊實例列表,進入可觀測監(jiān)控 Prometheus 版的實例列表頁面。
在單擊目標實例名稱對應(yīng)的grafana工作區(qū)。
在左側(cè)導(dǎo)航欄單擊圖標(Explore),然后在左上角的Explore右側(cè)下拉列表選擇對應(yīng)的數(shù)據(jù)源。
在Metrics下拉列表中選擇目標指標,可查看當前指標正常的時序數(shù)據(jù),例如目標指標為:
arms_cms_collector_duration_seconds
在Metrics右側(cè)文本框輸入以下PromQL查詢語句示例,即異常檢測算子。可檢測出當前指標在某些時段的數(shù)據(jù)異常波動情況。
anomaly_detect(arms_cms_collector_duration_seconds[180m],3)
說明arms_cms_collector_duration_seconds:為上一步驟中的目標指標名稱,請根據(jù)實際情況替換。
輸入的PromQL查詢語句數(shù)據(jù)類型必須是Range vector類型,因此需要在指標名稱后增加時間范圍“[180m]”,其中時間范圍默認選擇“[180m]”,參數(shù)默認選擇“3”。如果提前執(zhí)行了其他聚合函數(shù)操作,則需要將默認的時間范圍選擇變更為“[180m:]”,使其數(shù)據(jù)類型變?yōu)镽ange vector類型,例如:anomaly_detect(sum(node_memory_free_bytes)[180m:],3)。