云監控(CloudMonitor)是一項針對阿里云資源和互聯網應用進行監控的服務。您可以接入云監控服務通過設置報警規則對轉碼作業進行監控。本文為您介紹媒體處理中設置報警規則的操作步驟。
設置報警規則(接入云監控)
背景信息
您可以使用媒體處理云監控服務獲取系統性能、用量兩方面的監控數據指標。您還可以使用自定義報警服務,監控服務穩定性、分析使用情況,及時發現以及診斷相關問題。如需了解基本概念或進行報警聯系人和報警聯系組的配置,請參見概覽和創建報警聯系人或報警聯系人組。
監控指標
指標名稱 | 單位 | 指標描述 | 統計維度 | 時間粒度 |
請求成功率 | % | MPS服務的系統可用性衡量指標。計算公式:1 - 服務端錯誤請求(返回狀態碼為5xx)占總請求的百分比。 | 用戶層級 | 5分鐘 |
提交截圖任務數 | 次數 | MPS服務端接收到的截圖任務請求數。 | 管道層級 | 1分鐘 |
轉碼時長 | 分鐘 | MPS服務端接收并處理成功的輸出視頻時長。 | 管道層級 | 1分鐘 |
提交轉碼任務數 | 次數 | MPS服務端接收到的轉碼任務請求數。 | 管道層級 | 1分鐘 |
操作步驟
登錄媒體處理控制臺。
在左側導航欄,選擇
。單擊設置報警規則,進入報警規則頁面。
首次進入時,會彈出云監控服務關聯角色彈窗,單擊確定。如已關聯,請忽略。
單擊創建報警規則。
設置關聯資源。
參數
說明
產品
在下拉列表中選擇媒體處理產品。
資源范圍
報警規則作用的資源范圍。取值:
全部資源:報警規則作用于指定云產品的全部資源上,對于新加入的資源生效。
應用分組:報警規則作用于指定云產品的指定應用分組內的全部資源上,對于新加入的資源生效。
實例:報警規則作用于指定云產品的指定資源上。
規則描述
報警規則的主體。當監控數據滿足報警條件時,觸發報警規則。規則描述的設置方法如下:
單擊添加規則。
在添加規則描述面板,設置規則名稱、監控指標類型、監控指標、閾值、報警級別和報警方式等。
單擊確定。
說明關于如何設置復雜的報警條件,請參見報警規則表達式說明。
通道沉默周期
報警通知的間隔時長。報警發生后如果未恢復正常,可以重復發送一次報警通知。取值:5分鐘、15分鐘、30分鐘、60分鐘、3小時、6小時、12小時和24小時。
某監控指標達到報警閾值時發送報警,如果監控指標在通道沉默周期內持續超過報警閾值,在通道沉默周期內不會重復發送報警通知;如果監控指標在通道沉默周期后仍未恢復正常,則云監控再次發送報警通知。
例如:當通道沉默周期選擇12小時時,如果報警未恢復正常,則間隔12小時后,云監控會再次發送報警通知。
生效時間
報警規則的生效時間,報警規則只在生效時間內才會檢查監控數據是否需要報警。
報警聯系人組
發送報警的聯系人組。
應用分組的報警通知會發送給該報警聯系人組中的報警聯系人。報警聯系人組是一組報警聯系人,可以包含一個或多個報警聯系人。關于如何創建報警聯系人和報警聯系人組,請參見創建報警聯系人或報警聯系人組。
報警回調
公網可訪問的URL,用于接收云監控通過POST請求推送的報警信息。目前僅支持HTTP協議。關于如何設置報警回調,請參見使用閾值報警回調。
說明單擊高級設置,可設置該參數。
當您需要測試報警回調地址的連通性時,可以執行以下操作。
單擊回調地址正后方的測試。
在WebHook測試面板,您可以通過Webhook返回的狀態碼和測試結果詳情對報警回調地址的連通性進行判斷和排查。
說明您還可以設置Webhook的回調模板類型和語言,再次單擊測試,獲取對應的測試結果詳情。
單擊關閉。
彈性伸縮
如果您打開彈性伸縮開關,當報警發生時,會觸發相應的伸縮規則。您需要設置彈性伸縮的地域、彈性伸縮組和彈性伸縮規則。
說明單擊高級設置,可設置該參數。
日志服務
如果您打開日志服務開關,當報警發生時,會將報警信息寫入日志服務的日志庫。您需要設置日志服務的地域、ProjectName和Logstore。
關于如何創建Project和Logstore,請參見快速入門。
說明單擊高級設置,可設置該參數。
輕量消息隊列(原 MNS)-Topic
如果您打開輕量消息隊列(原MNS) -Topic開關,當報警發生時,會將報警信息寫入輕量消息隊列(原MNS)的主題。您需要設置輕量消息隊列(原MNS)的地域和主題。
關于如何創建主題,請參見創建主題。
說明單擊高級設置,可設置該參數。
無數據處理方法
無監控數據時報警的處理方式。取值:
不做任何處理(默認值)
發送無數據報警
視為恢復
說明單擊高級設置,可設置該參數。
標簽
報警規則的標簽。包括標簽名稱和標簽值。
單擊確認,完成報警規則創建。
管理報警規則
登錄云監控控制臺。
在左側導航欄選擇
,查看、修改、啟用、禁用和刪除對應的報警規則。