實例健康狀態表示實例操作系統的運行狀態,通過實例健康狀態,您可以快速確定ECS實例是否真正可用(例如是否可以通過SSH、RDP等訪問)。本文介紹實例健康狀態與生命周期狀態的區別和關系,以及如何通過ECS控制臺或API查看實例健康狀態。
實例健康狀態說明
實例健康狀態關注的是實例操作系統的運行狀態,包括操作系統是否正常運行,實例的網絡是否連通,CPU或磁盤等性能是否受到影響等。
通過監控實例健康可以及時發現實例操作系統運行狀態是否正常。
例如,實例的生命周期狀態為Running,并不意味著實例的操作系統已經運行起來了;只有當實例健康狀態為OK時,表示實例的操作系統已經運行起來,才可以通過SSH或RDP進行訪問。
實例健康狀態每分鐘更新一次,您可以根據實例健康狀態來識別實例是否存在問題,以便及時處理相應問題。
您可以通過實例健康狀態改變通知事件報警規則,及時了解實例健康狀態。更多信息,請參見創建系統事件報警規則。
實例健康狀態與實例生命周期狀態之間的區別和對應的場景說明,如下表所示。
實例生命周期狀態(Lifecycle Status)
實例健康狀態(HealthStatus)
實例健康狀態中文描述
實例真正狀態說明
修復方案
Starting
Initializing
初始化中
實例正處于初始化階段。
等待實例啟動。
Running
實例操作系統正在啟動中。
等待實例啟動。
Running
Impaired
操作系統運行存在異常
實例操作系統正在運行中,但是實例可能受到底層宿主機、存儲、網絡等限制,導致性能受到影響或降級。
實例操作系統正在運行中,但是遭到OOM出現了藍屏、夯住(Hang)等問題。
通過啟動/重啟實例,響應對應實例因操作系統錯誤需重啟事件。
上報故障,等待阿里云處理。
Running
OK
正常
實例操作系統正在運行中,且實例未受任何外部因素影響。
無
Stopping/Stopped
InsufficientData
數據不足
實例處于關機中或已關機狀態。
啟動實例。
Deleted
NotApplicable
不適用
實例當前生命周期狀態無效。
無
查看ECS實例健康狀態
在ECS控制臺查看實例健康狀態
登錄ECS管理控制臺。
在左側導航欄,選擇 。
在頁面左側頂部,選擇目標資源所在的資源組和地域。
添加健康狀態顯示列。
在實例列表的右上角,單擊圖標。
在實例列表設置對話框里,單擊未顯示區域中健康狀態右側的圖標,然后單擊繼續。
找到目標實例,在健康狀態列,查看實例健康狀態。
通過阿里云CLI查看實例健康狀態
執行以下命令,調用DescribeInstances和DescribeInstancesFullStatus查看特定實例的健康狀態。
aliyun ecs DescribeInstances --RegionId TheRegionId --output cols=InstanceId,InstanceName rows=Instances.Instance[] aliyun ecs DescribeInstancesFullStatus --RegionId TheRegionId --InstanceId.1 i-bp1afnc98r8k69****** --output cols=HealthStatus rows=InstanceFullStatusSet.InstanceFullStatusType[]
執行以下命令,調用DescribeInstancesFullStatus查看指定地域下所有實例的健康狀態。
詳細的地域ID列表,請參見地域和可用區。
aliyun ecs DescribeInstancesFullStatus --RegionId TheRegionId --output cols=HealthStatus rows=InstanceFullStatusSet.InstanceFullStatusType[]
發起健康狀態檢查請求后,阿里云會為請求的每臺實例返回健康狀態。
返回信息中,HealthStatus表示實例的健康狀態,Status表示實例的生命周期狀態。
如果實例處于正常狀態,則健康狀態為OK。
如果實例處于異常狀態,則健康狀態會返回其他指標。
更多實例健康狀態與生命周期狀態區別與對應場景說明,請參見實例健康狀態說明。