您可以通過阿里云云監控來監控文件系統讀請求頻率、讀取請求大小、每秒讀取字節數、存儲空間等。并通過設置報警規則,及時獲取異常信息。本文介紹如何查看性能監控詳情及創建報警規則。
前提條件
性能監控指標說明
指標 | 指標名稱 | 單位 | 描述 |
read_iops | 文件系統讀請求頻率 | 次/秒 | 該文件系統在周期內每秒平均讀請求次數。 |
read_iosize | 文件系統讀取請求大小 | 字節 | 該文件系統在周期內讀取請求大小。 |
read_throughput | 文件系統每秒讀取字節數 | 字節/秒 | 該文件系統在周期內每秒平均讀取大小。 |
remaining_storagespace | 文件系統空間剩余量 | 字節 | 該文件系統在周期內存儲空間的剩余空間。 |
storageutilization | 文件系統空間使用率 | % | 該文件系統在周期內存儲空間的使用率。 |
used_storagespace | 文件系統空間使用量 | 字節 | 該文件系統在周期內存儲空間的已使用量。 |
write_iops | 文件系統寫請求頻率 | 次/秒 | 該文件系統在周期內每秒平均寫請求次數。 |
write_iosize | 文件系統寫入請求大小 | 字節 | 該文件系統在周期內寫入請求大小。 |
write_throughput | 文件系統每秒寫入字節數 | 字節/秒 | 該文件系統在周期內每秒平均寫入字節數。 |
查看性能監控詳情
創建報警規則
在創建報警規則前,請先閱讀云監控提供的監控服務文檔,了解基本概念并進行報警聯系人和報警聯系組的配置。
登錄云監控控制臺。
在左側導航欄,選擇 ,單擊創建報警規則。
在創建報警規則頁面,配置如下相關信息。
配置項
說明
產品
選擇文件存儲HDFS。
資源范圍
報警規則作用的資源范圍。取值:
全部資源:報警規則作用于文件存儲 HDFS 版的全部資源上。
應用分組:報警規則作用于文件存儲 HDFS 版的指定應用分組內的全部資源上。
實例:報警規則作用于文件存儲 HDFS 版的指定資源上。
規則描述
報警規則的主體。當監控數據滿足報警條件時,觸發報警規則。規則描述的設置方法如下:
單擊添加規則。
在添加規則描述面板,設置規則名稱、指標類型、監控指標、閾值、報警級別和報警方式等。
單擊確定。
通道沉默周期
報警發生后未恢復正常,間隔多久重復發送一次報警通知。取值:5分鐘、15分鐘、30分鐘、60分鐘、3小時、6小時、12小時和24小時。
某監控指標達到報警閾值時發送報警,如果監控指標在通道沉默周期內持續超過報警閾值,在通道沉默周期內不會重復發送報警通知;如果監控指標在通道沉默周期后仍未恢復正常,則云監控再次發送報警通知。
生效時間
報警規則的生效時間,報警規則只在生效時間內才會檢查監控數據是否需要報警。
報警聯系人組
發送報警的聯系人組。
應用分組的報警通知會發送給該報警聯系人組中的報警聯系人。報警聯系人組是一組報警聯系人,可以包含一個或多個報警聯系人。
關于如何創建報警聯系人和報警聯系人組,請參見創建報警聯系人和報警聯系組。
標簽
報警規則的標簽。包括標簽名稱和標簽值。
報警回調
公網可訪問的URL,用于接收云監控通過POST請求推送的報警信息。目前僅支持HTTP協議。關于如何設置報警回調,請參見使用閾值報警回調。
當您需要測試報警回調地址的連通性時,可以執行以下操作。
單擊回調地址正后方的測試。
在WebHook測試面板,您可以通過Webhook返回的狀態碼和測試結果詳情對報警回調地址的連通性進行判斷和排查。
說明您還可以設置Webhook的回調模板類型和語言,再次單擊測試,獲取對應的測試結果詳情。
單擊關閉。
說明單擊高級設置,可配置該參數。
彈性伸縮
如果您打開彈性伸縮開關,當報警發生時,會觸發相應的伸縮規則。您需要設置彈性伸縮的地域、彈性伸縮組和彈性伸縮規則。
說明單擊高級設置,可配置該參數。
日志服務
如果您打開日志服務開關,當報警發生時,會將報警信息寫入日志服務。您需要設置日志服務的地域、ProjectName和Logstore。
關于如何創建Project和Logstore,請參見快速入門。
說明單擊高級設置,可配置該參數。
輕量消息隊列(原MNS)— topic
如果您打開輕量消息隊列(原MNS)— topic開關,當報警發生時,會將報警信息寫入輕量消息隊列的主題。您需要設置輕量消息隊列的地域和主題。
關于如何創建主題,請參見創建主題。
說明單擊高級設置,可配置該參數。
函數計算
如果您打開函數計算開關,當報警發生時,會將報警通知發送至函數計算進行格式處理。您需要設置函數計算的地域、服務和函數。
關于如何設置服務和函數,請參見快速創建函數。
說明單擊高級設置,可配置該參數。
無數據處理方法
無監控數據時報警的處理方式。取值:
不做任何處理(默認值)
發送無數據報警
視為恢復
說明單擊高級設置,可配置該參數。
單擊確認,完成報警規則的設置。
當文件系統的監控項超過設定閾值后會自動發送報警通知,使您及時獲取監控數據異常。