本文介紹如何在阿里云云存儲網關控制臺查看文件網關的告警以及告警的處理方式。
查看告警
查看網關告警有兩種方式,一種是查看當前地域下所有網關的告警,另外一種是查看單個網關的告警。
操作步驟
方式一:所有網關的告警。
方式二:單個網關的告警。
參數 | 說明 |
告警類型 | 目前文件網關僅支持三種告警類型:
|
告警級別 | 當前告警的級別。 |
網關ID | 當前告警的網關ID。 說明 您可以單擊網關ID查看對應網關的事件告警信息。 |
共享名稱 | 當前告警的共享名稱。 |
解決方案 | 您可以單擊解決方案的鏈接查看對應告警的處理方式等。 |
告警時間 | 首次告警發生的時間。 |
恢復時間 | 恢復告警的時間,未恢復的告警顯示為未恢復。 |
告警的處理方式
元數據空間不足
告警原因
元數據空間指的是SMB或NFS共享所對應的緩存盤中用于存儲元數據的空間,主要包括目錄結構等信息,文件數目越多,使用的元數據空間也就越大。共享使用的緩存盤由數據空間和元數據空間組成,默認20%的緩存盤空間會用來存儲元數據。當可用元數據空間不足3 GB或者不足所有元數據空間的20%時會觸發此告警。
處理方式
建議擴展共享對應的緩存盤來擴大元數據空間,避免因元數據空間不足而導致無法寫入,更多信息請參見擴展緩存。
限流
告警原因
當同時寫入緩存盤的數據總量大于緩存盤數據空間高水位時(80%)會觸發此告警,最終可能導致寫入失敗。
處理方式
排查數據上傳是否存在問題導致緩存空間無法釋放,下面幾種情況都可能導致數據無法及時上傳。
OSS Bucket不存在。
OSS Bucket策略導致網關訪問OSS Bucket受限。
OSS Bucket類型是歸檔存儲類型或者冷歸檔存儲類型。
同時寫入的文件大小超過可用緩存盤容量,無法及時關閉文件并上傳。
您可以根據實際情況調整業務,下調同時寫入緩存盤的數據總量。
您也可以擴展共享對應的緩存盤來擴大數據空間。更多信息,請參見擴展緩存。
上傳隊列堆積
告警原因
觸發此告警可能的原因有:
OSS Bucket不存在。
OSS Bucket策略導致網關訪問OSS Bucket受限。
OSS Bucket類型是歸檔存儲類型或者冷歸檔存儲類型。
處理方式
請您根據以下步驟進行排查:
請檢查當前使用的OSS Bucket是否存在。如果不存在,請使用已存在的OSS Bucket。
請檢查當前使用的OSS Bucket是否配置了相關策略,導致網關無法訪問該OSS Bucket。
請檢查當前使用的OSS Bucket是否為歸檔存儲類型或者冷歸檔存儲類型。如果沒有特殊需求,建議您使用標準存儲類型的OSS Bucket。
如果當前上傳隊列長度低于1000,或者在觀察到告警產生后的一段時間內,上傳隊列長度整體呈下降趨勢,則可以基本判斷網關運行正常,未出現明顯問題。
如果您排查后仍然無法恢復告警或有疑問,請提交工單進行處理。