本文檔介紹如何對存儲在日志服務(Log Service)中的數據進行統計和設置報警規則。
僅2022年09月13日22:00:00之前已訂購包年包月套餐(cms_edition)的用戶或已開通按量計費(cms_post)的用戶能使用日志監控功能。日志監控功能將于2024年09月14日下線,建議您使用企業云監控中的SLS日志監控替代。
前提條件
背景信息
業務日志的監控和報警原理如下圖所示。
操作步驟
(可選)授權云監控訪問日志服務的權限。
當您首次使用日志監控功能時,需要授權云監控訪問日志服務的權限。
登錄云監控控制臺。
在左側導航欄,選擇
。在云監控服務關聯角色對話框,單擊確定。
新建日志監控。
在日志監控頁面,單擊左上角的新建日志監控。
在關聯資源頁面,選擇關聯資源,單擊下一步。
在監控項定義頁面,設置分析日志,單擊下一步。
分析日志相關參數的設置方法,如下表所示。
參數
描述
監控項
監控指標的名稱。
單位
監控項的單位。
計算周期
監控項的計算周期。單位:分鐘。取值:1、2、3、4、5、10、15、20、30、60。
統計方法
在計算周期內根據選定的統計方法對日志數據進行聚合處理。如果字段值是數值型,可以使用所有統計方法,否則只能使用計數和countps兩種聚合算法。取值:
計數:計算統計周期內指定字段數值的個數。
求和:計算1分鐘內指定字段數值之和。
最大值:計算統計周期內指定字段數值的最大值。
最小值:計算統計周期內指定字段數值的最小值。
平均值:計算統計周期內指定字段數值的平均值。
countps:計算統計周期內指定字段求count后的每秒平均值。
sumps:計算統計周期內指定字段求sum后的每秒平均值。
distinct:去重后計算統計周期內指定字段出現的次數。
擴展字段
為統計方法中的結果提供四則運算功能,例如:在統計方法中配置了HTTP狀態碼請求總數TotalNumber和HTTP狀態碼大于499的請求數5xxNumber,則可以通過擴展字段計算出服務端的錯誤率:5xxNumber/TotalNumber*100。
日志篩選
對日志數據進行過濾,相當于SQL中的where條件,例如:Key為level,Value中需要監控的關鍵字為ERROR,該參數設置為
level>=ERROR
。選擇過濾的日志字段名不能包含中文。
Group-By
對數據進行空間維度聚合,相當于SQL中的Group By。
根據指定的維度,對監控數據進行分組。如果Group By不選擇任何維度,則根據聚合方法對全部監控數據進行聚合。
關于Group By,請參見Group By子句。
Select SQL
將統計方法轉化成SQL語句,方便您理解數據的處理方式。
應用分組
應用分組的名稱。將該監控項添加到指定應用分組中。
在監控項定義頁面,單擊預覽,預覽1分鐘的聚合日志(只計算最近100條日志數據),如下圖所示。
在報警設置頁面,設置報警規則相關參數,單擊下一步。
在創建結果頁面,單擊關閉。
查看日志監控數據。
創建日志監控后,等待3~5分鐘。在日志監控頁面,單擊目標監控項對應操作列的圖標,查看監控項的監控圖表。
查看監控項的報警通知。
當監控項達到報警條件時,您會收到報警通知。