圖數據庫GDB已接入云監控平臺,通過對重要的監控指標設置報警規則,讓您及時得知指標數據或實例發生異常,幫您迅速定位處理故障。
背景信息
云監控(CloudMonitor)是針對阿里云資源和互聯網應用提供監控的服務,為您提供開箱即用的企業級開放型一站式監控解決方案。您可以創建報警規則、設置監控項,在監控項的報警規則被觸發時,云監控將通知報警聯系組中的所有聯系人。
報警聯系人和聯系組是云監控發送報警通知的基礎。您需要先創建報警聯系人和報警聯系組,并將報警聯系人添加到報警聯系組。具體操作,請參見創建報警聯系人或報警聯系人組。
操作步驟
登錄云監控控制臺。
在左側導航欄,單擊
。單擊創建報警規則。
在創建報警規則頁面,根據頁面配置向導設置報警規則。
參數
說明
產品
云監控可管理的云產品名稱。
根據實例類型,選擇圖數據庫GDB。
資源范圍
報警規則作用的資源范圍。取值:
全部資源:報警規則作用于指定云產品的全部資源上。
示例:您設置了全部資源粒度的GDB CPU使用率大于80%報警,則只要用戶名下有GDB CPU使用率大于80%,就會發送報警通知。資源范圍選擇全部資源時,報警的資源最多1000個,超過1000個可能會導致達到閾值不報警的問題,建議您使用應用分組按業務劃分資源后再設置報警。
應用分組:報警規則作用于指定云產品的指定應用分組內的全部資源上。
實例:報警規則作用于指定云產品的指定資源上。
示例:您如果設置了實例粒度的主機CPU使用率大于80%報警,則當該實例CPU使用率大于80%時,會發送報警通知。
規則描述
報警規則的主體。當監控數據滿足報警條件時,觸發報警規則。規則描述的設置方法如下:
單擊添加規則。
在添加規則描述面板,設置規則名稱、監控指標類型、監控指標、閾值、報警級別和報警方式等。
單擊確定。
說明您可以通過單擊添加報警規則設置多條報警規則。
通道沉默周期
報警發生后未恢復正常,間隔多久重復發送一次報警通知。取值:5分鐘、15分鐘、30分鐘、60分鐘、3小時、6小時、12小時和24小時。
某監控指標達到報警閾值時發送報警,如果監控指標在通道沉默周期內持續超過報警閾值,在通道沉默周期內不會重復發送報警通知;如果監控指標在通道沉默周期后仍未恢復正常,則云監控再次發送報警通知。
生效時間
報警規則的生效時間,報警規則只在生效時間內才會檢查監控數據是否需要報警。
報警聯系人組
發送報警的聯系人組。
應用分組的報警通知會發送給該報警聯系人組中的報警聯系人。報警聯系人組是一組報警聯系人,可以包含一個或多個報警聯系人。
關于如何創建報警聯系人和報警聯系人組,請參見創建報警聯系人或報警聯系人組。
標簽
報警規則的標簽。包括標簽名稱和標簽值。
報警回調
公網可訪問的URL,用于接收云監控通過POST請求推送的報警信息。目前僅支持HTTP協議。關于如何設置報警回調,請參見使用閾值報警回調。
說明單擊高級設置,可設置該參數。
彈性伸縮
如果您打開彈性伸縮開關,當報警發生時,會觸發相應的伸縮規則。您需要設置彈性伸縮的地域、彈性伸縮組和彈性伸縮規則。
說明單擊高級設置,可設置該參數。
日志服務
如果您打開日志服務開關,當報警發生時,會將報警信息寫入日志服務的日志庫。您需要設置日志服務的地域、ProjectName和Logstore。
關于如何創建Project和Logstore,請參見快速入門。
說明單擊高級設置,可設置該參數。
輕量消息隊列(原 MNS)— topic
如果您打開輕量消息隊列(原 MNS)— topic開關,當報警發生時,會將報警信息寫入輕量消息隊列的主題。您需要設置輕量消息隊列的地域和主題。
關于如何創建主題,請參見創建主題。
說明單擊高級設置,可設置該參數。
函數計算
如果您打開函數計算開關,當報警發生時,會將報警通知發送至函數計算進行格式處理。您需要設置函數計算的地域、服務和函數。
關于如何服務和函數,請參見快速創建函數。
說明單擊高級設置,可設置該參數。
無數據處理方法
無監控數據時報警的處理方式。取值:
不做任何處理(默認值)
發送無數據報警
視為恢復
說明單擊高級設置,可設置該參數。
設置完成后,單擊確認。
創建完成后,您可以在云監控控制臺報警規則列表中查看。
相關文檔
您也可以在云監控控制臺設置事件報警規則,設置方法請參見和管理系統事件報警規則(舊版)。
報警規則設置成功后,您可以在云監控控制臺管理報警規則,具體請參見: