如何配置監控報警
阿里云任務調度XXL-JOB支持任務維度和實例集群維度的監控報警配置。在任務運行時,通過指定監控報警配置,可以幫助您及時了解任務的執行情況,及時發現和處理問題。
任務維度監控報警配置
登錄XXL-JOB控制臺,并在頂部菜單欄選擇地域。單擊指定XXL-JOB實例,在左側導航欄,選擇任務管理,單擊指定任務操作列的編輯。在通知配置界面配置對應任務級別監控報警信息。
通知配置參數說明如下:
配置項 | 描述 | 默認值 |
超時報警 | 任務執行超時是否發送告警。 | 開啟 |
超時時間 | 任務執行超時的時間,任務執行超過設定值,上報超時報警。 | 7200秒 |
超時終止 | 任務執行超過指定時間是否自動停止,防止把下一次調度卡住。 | 關閉 |
成功通知 | 任務執行成功是否通知給聯系人。對于級別比較重要的任務,建議設置運行成功后通知聯系人。 | 關閉 |
失敗報警 | 任務執行失敗是否告警。 | 開啟 |
連續失敗次數 | 任務連續失敗指定次數才告警。 | 1 |
無可用機器報警 | 任務調度的時候沒有可用執行器是否告警。 | 開啟 |
通知方式 | 上報成功通知時,超時通知的方式。目前支持短信、Webhook、郵件和電話。 重要 如果配置項通知方式包含webhook方式,則需要額外配置以下內容。
| 無 |
通知對象 | 集成云監控聯系人,需要去云監控配置聯系人并激活聯系方式。 | 無 |
實例維度監控報警配置
登錄XXL-JOB控制臺,并在頂部菜單欄選擇地域。單擊進入指定XXL-JOB實例,在左側導航欄,選擇基礎信息菜單。
在調度統計大盤里,單擊右上角下的設置報警規則,或者單擊圖標,可以進行閾值告警(例如調度總數下跌20%告警)。
單擊創建告警規則,選擇產品為分布式任務調度,選擇指定實例,配置報警規則。
單擊添加規則,這里以簡單指標為例,監控指標為失敗次數,添加報警規則。
添加報警聯系人組,單擊確認即可完成監控報警配置。