本文通過示例說明如何創建應用監控告警并處理告警通知。
前提條件
已接入應用監控,具體操作,請參見應用監控接入概述。
背景信息
EDAS應用監控告警支持對采集到的各種應用指標配置告警規則。您可以根據需求和業務場景配置合理的告警規則,即可在應用不符合預期時收到通知,以便及時做出響應。本文以下述場景為例說明如何使用EDAS應用監控告警規則。
示例場景:核心業務請求延時過高或成功率下降。
示例應用名稱:user-service。user-service應用是部署在阿里云容器服務Kubernetes版集群上面的一個Java應用,且已經成功接入了EDAS應用監控。
user-service應用是公司的核心服務,如果其接口可用性下降將導致嚴重的后果,因此,當此應用提供的接口調用延時增加或者成功率下降時,運維人員需及時收到通知并且迅速響應。
在此背景下,運維人員需要關注的指標有:
應用提供服務的平均響應時間
應用提供服務的請求成功率
步驟一:驗證應用是否成功接入應用監控
執行以下步驟驗證user-service應用是否成功接入應用監控。
登錄EDAS控制臺。
在左側導航欄選擇應用管理>應用列表,在展開的列表中查找并單擊user-service應用名稱。
在左側導航欄單擊應用總覽。
進入應用總覽頁面,查看應用總覽頁面是否有數據。
如果頁面有數據,說明應用已經成功接入應用監控;如果頁面沒有任何數據,說明應用沒有成功接入,請將應用重新接入應用監控。
說明示例應用是容器服務Kubernetes版集群的Java應用,如果您的應用是其它類型,接入應用監控成功之后的頁面顯示可能與上圖不同,但是只要頁面有指標數據就說明已經接入成功。
步驟二:進入創建應用監控告警規則頁面
登錄EDAS控制臺。
在左側導航欄,單擊 ,在頂部菜單欄選擇地域并在頁面上方選擇所屬微服務空間,在集群類型下拉列表,選擇K8s集群,然后在頁面單擊具體的應用名稱。
在左側導航欄中選擇 。
在告警規則頁面右上角,單擊創建應用監控告警規則。
在創建應用監控告警規則頁面,設置告警應用為user-service、指標類型為應用調用類型統計。
步驟三:創建告警規則
本示例中需要創建以下兩條告警規則,并在告警觸發時通過短信,郵件和釘釘群通知聯系人:
user-service應用提供請求延時過高的告警規則:
最近3分鐘應用提供服務調用響應時間大于等于500 ms。
user-service應用提供請求成功率下降的告警規則:
最近3分鐘應用提供服務調用錯誤率小于等于90%。
一般認為接口在短時間內有所波動為正?,F象,持續性的異常才需要關注并且響應。所以在添加告警規則時,可以設置當最近3分鐘的平均延時都比較高或者請求失敗率低于90%的時候才需要告警。您在創建應用監控告警規則時,可以根據需要指定不同的時間和指標計算方法。
在創建應用監控告警規則頁面輸入告警名稱,添加告警條件。
此處先創建user-service應用提供請求延時過高的告警條件。
設置通知策略。
如果您已經創建過通知策略,則在通知策略區域選擇已有的通知策略。
如果您之前沒有創建過通知策略,則執行步驟3新建通知策略。新建完通知策略后,在創建應用監控告警規則頁面刷新并選擇通知策略。
可選:單擊通知策略右側的新建通知策略。
在右側彈出的新建通知策略面板中,選擇通知人,并設置其他參數,然后單擊確定。
如果您已經創建過聯系人,則在通知人區域選擇已有的聯系人。
如果您之前沒有創建過聯系人,則執行步驟4新建聯系人。新建完聯系人后,在新建通知策略面板刷新并選擇通知人。
可選:單擊通知人右側的新建聯系人。
在聯系人頁面創建聯系人、聯系人組和釘群。
在聯系人頁簽,單擊右上角的新建聯系人。
在新建聯系人對話框中輸入聯系人參數,然后單擊確認。
在聯系人組頁簽,單擊右上角的新建聯系組。
在新建聯系組對話框設置組名,并將上面創建的聯系人添加至聯系人組,然后單擊確認。
創建完成后,在聯系人組頁簽中可以查看已創建的聯系人組。
在釘群頁簽,單擊右上角的新建釘群。
在新建釘群對話框設置釘群參數,然后單擊確認。
創建完成后,在釘群頁簽中可以查看已創建的釘群。
告警規則創建完成后,單擊保存。
重復以上步驟創建user-service應用提供請求成功率下降的告警規則。
創建完成后,在控制臺的
頁面可以查看創建的兩條告警規則。
查看告警通知
當滿足告警條件時,收到的告警通知如下所示:
短信:
郵件:
釘釘群:
在釘釘群中收到告警通知后,您可以直接在釘釘群中處理告警。具體操作,請參見在釘釘群中處理告警。
處理告警
收到通知后,您可以在告警管理中查看告警的發送歷史和詳細告警時間信息。