云監控會自動獲取您當前阿里云賬號下的云產品資源,您可以在云監控控制臺查看ECI實例的監控圖表,了解ECI實例運行狀況,也可以設置報警規則,以便及時得知異常監控數據,并進行處理。
監控指標說明
云監控(CloudMonitor)是一項針對阿里云資源和互聯網應用進行監控的服務。對于ECI實例,云監控支持以下監控指標:
類別 | 指標 | 說明 |
實例 | instance_cpu_utilization | CPU利用率 |
instance_memory_utilization | 內存利用率 | |
GPU | gpu_memory_used | GPU顯存使用量 |
gpu_memory_utilization | GPU顯存利用率 | |
gpu_utilization | GPU利用率 | |
Volume | volume_space_total | 存儲空間的總容量 |
volume_space_used | 存儲空間的已使用容量 | |
volume_space_utilization | 存儲空間的利用率 | |
volume_inode_total | Inode可用容量 | |
volume_inode_used | Inode使用量 | |
volume_inode_utilization | Inode利用率 |
Volume類別的指標僅支持臨時存儲空間和掛載的云盤數據卷,不支持其他類型的數據卷。
Linux的Inode節點中記錄了文件的類型、大小、權限、所有者、文件連接的數目、創建時間與更新時間等重要信息,以及指向數據塊的指針信息。Inode利用率達到100%會造成無法繼續新建目錄或者文件。
更多信息,請參見ECI監控指標。
查看監控數據
您可以在云監控控制臺查看ECI實例的運行狀態和各個指標的監控數據。
在頁面上方,選擇地域。
在實例列表中,單擊要查看監控數據的ECI實例。
選擇想要查看的監控指標類別。
默認分組:CPU和內存指標。
GPU:GPU相關指標。
僅指定GPU實例規格(例如gn7等規格族)創建的ECI GPU實例,可以查看GPU的指標數據。
選擇該類別后,可進一步選擇查看某一GPU的數據。
Volume:存儲相關指標。
該類別指標僅支持臨時存儲空間和掛載的云盤數據卷,不支持其他類型的數據卷。
擇該類別后,可進一步選擇查看臨時存儲空間(EphemeralVolume)或者某個數據卷的數據。
根據需要選擇或自定義設置時間段,查看監控數據。
說明一次最多可查看連續30天的監控數據。
默認分組
GPU
Volume
后續操作
您可以針對ECI實例的一個或多個監控指標設置報警規則(例如CPU利用率高于80%),當監控數據符合報警規則時,云監控會自動發送報警通知,便于您及時了解資源運行狀態,處理異常情況。
教程示例:通過云監控及時獲取存儲空間不足的實例信息。