日志服務SLS告警作為一站式運維告警平臺,為OSS的訪問提供了定制化的告警規則。您只需要在日志服務控制臺進行簡單配置,即可完成對OSS訪問指標的監控,并在指標出現異常時及時收到告警通知。
場景描述
客戶A是一家多媒體公司,主要產品有短視頻App。用戶可以在上面發布和觀看短視頻。客戶A使用了OSS中名為examplebucket的存儲空間來存儲用戶產生的短視頻,App每天的用戶活動具有一定的周期性,一般情況下深夜的PV較低,其他時段PV較高。
每天9點~10點之間的PV訪問基本持平。例如每月5號9點~10點的PV是50萬,6號9點~10點的PV是51萬可以理解為正常波動。如果6號9~10點的PV出現陡增至100萬或者陡降至20萬的情況,您可以通過創建日志服務告警規則,指定在某個時間段內PV陡增或者陡降20%時發出告警,并通過釘釘機器人推送告警信息。
前提條件
已為目標存儲空間examplebucket開啟實時日志查詢并記錄生成的Project名稱。
開啟實時日志查詢后,日志服務將自動生成名為oss-log-store
的Logstore,該Logstore保存在格式為oss-log-阿里云賬號ID-region
的Project下。請記錄生成的Project名稱,用于配置后續的通知渠道及告警閾值。開啟實時日志查詢的具體步驟,請參見查詢實時日志。
操作步驟
通過SLS OSS內置行動策略設置告警觸發后的通知渠道。
登錄日志服務控制臺。
在Project列表區域,單擊目標Project。
在左側導航欄中,單擊告警。
在告警中心頁面,選擇
。在行動策略頁面,單擊SLS內置行動策略名右側的修改。
在第一行動列表頁簽,渠道選擇釘釘自定義,然后將請求地址修改為釘釘群的機器人WebHook地址。其他選項,保留默認配置。
單擊確認。
設置觸發告警閾值。
在告警規則頁簽,新建告警下拉選擇從模版新建。
單擊OSS監控,然后單擊OSS訪問PV同比昨日變化率過高告警,觸發條件選擇有數據匹配,表達式修改為(change_rate >= 0 && change_rate > 20) || (change_rate < 0 && (-1) * change_rate > 20),其他參數保留默認配置。
單擊確定。
滿足以上觸發條件時,將發送告警通知。
常見問題
問題描述:告警渠道選擇釘釘機器人,但是釘釘通知發送失敗,且出現如下錯誤。
{"errcode":310000,"errmsg":"sign not match"}
{"errcode":310000,"errmsg":"keywords not in content"}
問題原因:機器人的安全設置有誤,導致通知被釘釘攔截。
解決方法:將安全設置配置為自定義關鍵字,其中一個關鍵字設置為“告警”,因為通知內容中至少包含其中1個關鍵字才可以發送成功。配置詳情,請參見釘釘-自定義。