數據監控
通過查看CPFS智算版文件系統的容量監控和性能信息,您可以了解CPFS智算版文件系統的存儲容量使用情況和讀寫吞吐、讀寫IOPS等情況。通過為CPFS智算版文件系統的重要監控指標設置報警規則,您可以及時獲知指標異常并快速處理異常。本文介紹CPFS智算版文件系統支持的監控項以及其報警規則配置。
背景信息
云監控(CloudMonitor)是一項針對阿里云資源和互聯網應用進行監控的服務。云監控可用于監控各云服務資源的監控指標,并針對指定監控指標設置報警。使您全面了解阿里云上資源的使用情況和業務運行狀況,并及時對故障資源進行處理,保證業務正常運行。更多信息,請參見什么是云監控。
監控數據保留策略
監控數據保留90天,過期自動清除。起始時間為數據產生的時間。
監控項
CPFS智算版支持通過云監控對文件系統實例容量進行數據監控,支持對文件系統的實例的性能進行監控,同時也支持對計算節點中客戶端的性能進行監控。
容量監控
類型 | 指標 | 指標名稱 | 單位 | 說明 |
文件系統 | CPFS Capacity | 總存儲空間 | 字節 | 文件系統在周期內的總存儲空間。 |
CPFS Capacity Used | 數據量 | 字節 | 文件系統在周期內實際使用的數據量。 | |
CPFS Inode Limit | 最大文件數 | 個 | 文件系統在周期內的可使用的最大文件數量。 | |
CPFS Inode Alloc | 已分配文件數 | 個 | 文件系統在周期內已分配的文件數量。 | |
CPFS Inode Used | 已使用文件數 | 個 | 文件系統在周期內已使用的文件數量。 | |
Fileset | BMCPFSFsetCapacityLimit | Fileset已分配容量 | 字節 | 已分配容量為Fileset最多可寫入的容量空間,達到配額上限后無法再寫入新數據。 |
BMCPFSFsetCapacityUsed | Fileset已使用容量 | 字節 | Fileset的實際已使用容量。 | |
BMCPFSFsetInodeLimit | Fileset已分配文件數 | 個 | 已分配文件數為Fileset最多可寫入的文件與目錄數量,達到配額上限后無法再寫入數據。 | |
BMCPFSFsetInodeUsed | Fileset已使用文件數 | 個 | Fileset的實際已使用文件數。 |
性能監控
類型 | 指標 | 指標名稱 | 單位 | 說明 |
文件系統 | ThruputRead | 讀吞吐 | 字節/秒 | 文件系統在周期內每秒平均讀吞吐字節。 |
ThruputWrite | 寫吞吐 | 字節/秒 | 文件系統在周期內每秒平均寫吞吐字節。 | |
IopsRead | 讀IOPS | 次/秒 | 文件系統在周期內每秒平均讀IOPS次數。 | |
IopsWrite | 寫IOPS | 次/秒 | 文件系統在周期內每秒平均寫IOPS次數。 | |
數據流動 | ThroughputImport | 導入吞吐 | 字節/秒 | 數據流動導入任務在周期內每秒平均吞吐字節。 |
ThroughputExport | 導出吞吐 | 字節/秒 | 數據流動導出任務在周期內每秒平均吞吐字節。 | |
QPSImportMeta | 導入元數據QPS | 次/秒 | 數據流動導入任務在周期內每秒平均請求元數據次數。 | |
QPSExportMeta | 導出元數據QPS | 次/秒 | 數據流動導出任務在周期內每秒平均請求元數據次數。 | |
IOPSImport | 導入IOPS | 次/秒 | 數據流動導入任務在周期內IOPS每秒平均次數。 | |
IOPSEXport | 導出IOPS | 次/秒 | 數據流動導出任務在周期內IOPS每秒平均次數。 | |
LatencyImport | 導入延遲 | us | 數據流動導入任務在周期內的平均延遲。 | |
LatencyExport | 導出延遲 | us | 數據流動導出任務在周期內的平均延遲。 | |
客戶端 | ClientReadIops | 客戶端讀IOPS | 次/秒 | 客戶端在周期內的讀IOPS每秒平均次數。 |
ClientWriteIops | 客戶端寫IOPS | 次/秒 | 客戶端在周期內的寫IOPS每秒平均次數。 | |
ClientReadLatency | 客戶端讀平均延遲 | us | 客戶端在周期內的平均讀延遲。 | |
ClientWriteLatency | 客戶端寫平均延遲 | us | 客戶端在周期內的平均寫延遲。 | |
ClientReadThroughput | 客戶端讀吞吐 | 字節/秒 | 客戶端在周期內的每秒平均讀吞吐字節。 | |
ClientWriteThroughput | 客戶端寫吞吐 | 字節/秒 | 客戶端在周期內的每秒平均寫吞吐字節。 |
報警規則說明
通過云監控控制臺,您可以為不同監控指標設置報警規則。當資源的監控指標達到報警條件時,云監控會自動發送報警通知。下表列出了報警規則的報警級別、通知機制以及報警條件信息。
報警等級 | 通知機制 | 報警條件 |
緊急Critical | 電話+短信+郵件+釘釘機器人 | 連續N個周期監控指標的平均值與指定閾值滿足所設置的判斷條件。其中N值請根據報警等級進行區分設置。 說明 當所選的指標類型不同時,報警條件會存在差異,請以實際界面為準。 |
警告Warn | 短信+郵件+釘釘機器人 | |
普通Info | 郵件+釘釘機器人 |