合理使用監控相關的功能可以幫助您及時發現和排查實例問題,在故障發生前處理掉潛在風險,避免影響業務。
診斷實例的健康狀態
實例健康診斷功能可以全方位診斷實例的操作系統配置、網絡狀態、磁盤狀態等。診斷報告中針對異常診斷項目的影響按照嚴重程度區分,并提供修復方案,方便您及時處理潛在風險。更多信息,請參見診斷實例的健康狀態。
及時處理系統事件
系統在執行某些運維動作或檢測到某些異常,判斷會影響實例正常運行時,會自動發送系統事件。系統事件中會同時提供應對措施、事件周期等信息,建議您及時處理系統事件,避免實例重啟、停止等問題影響您的業務。更多信息,請參見ECS系統事件概述。
通知包年包月實例到期的系統事件示例如下圖所示。
請確保在消息中心開啟接收ECS到期通知、產品運維通知、ECS故障通知等消息相關的站內信,否則在ECS管理控制臺將不能收到系統事件,設置頁面如下圖所示。
關注實例運行指標
阿里云收集并展示實例運行指標,供您了解實例的實時和歷史運行情況。您可以基于運行指標判斷實例運行是否正常,例如CPU使用率持續偏高時,可能需要排查是否存在異常進程或者實例配置過低。
利用報警服務自動通知
使用云監控的報警服務,您可以針對關注的事件或者實例運行指標設置報警規則,在發生指定事件或實例運行指標出現異常時,自動以郵件等方式通知到聯系人,減輕人工運維壓力。更多信息,請參見設置事件通知和設置ECS實例報警。
針對事件的報警規則示例如下所示。
針對實例運行指標的報警規則示例如下所示。
文檔內容是否對您有幫助?