云數據庫 Tair(兼容 Redis)實例作為更靠近應用服務的數據層,通常會執行較多的數據存取并消耗網絡帶寬。不同的實例規格對應的最大帶寬有所不同,當超過該規格的最大帶寬時,將對應用服務的數據訪問性能造成影響。
步驟一:查詢流量使用率
查詢實例在指定時段的流量使用率。具體操作,請參見查看性能監控。
本案例中,入流量和出流量的使用率快速上升并持續維持在100%,如下圖所示:
通常來說,流量的平均使用率持續保持在80%時需引起注意,可能流量不足。
需關注的監控指標為Intranet In Ratio(入流量使用率)和Intranet Out Ratio(出流量使用率)。
步驟二:優化流量使用率
調整實例的帶寬,降低對業務的影響并獲得較長的時間窗口來排查問題。具體操作,請參見手動增加實例帶寬。
說明您也可以開啟帶寬彈性伸縮,當帶寬使用率達到閾值后會自動增加或減少實例的帶寬,幫助您輕松應對突發或計劃中的流量高峰,專注于業務提升。更多信息,請參見開啟帶寬彈性伸縮。
當業務的訪問量與預期帶寬消耗不匹配,例如流量使用率的增長趨勢和QPS的增長趨勢明顯不一致。您可以通過緩存分析功能,發現實例中存在的大Key。具體操作,請參見離線全量Key分析。
對大Key(通常大于10 KB)進行優化,例如將大Key拆分、減少對大Key的訪問、刪除不必要的大Key等。
對于集群架構的Tair(企業版)內存型實例,可開啟代理查詢緩存功能(Proxy Query Cache)以應對因熱點Key引發的流量過大或傾斜的問題。更多信息,請參見實時Top Key統計、通過Proxy Query Cache優化熱點Key問題。
可選:對于集群架構的實例,可使用直連模式來應對業務上的網絡超大流量。具體操作,請參見開通直連訪問。
說明開啟直連后,實例的整體帶寬限制變為單個分片的最大帶寬*分片數,例如128分片的集群實例,每個分片的最大帶寬為96 MB/s,開啟直連后整體帶寬為12,288 MB/s。
經過上述步驟優化后,流量使用率依舊較高,可評估升級至更大內存的規格,以承載更大的網絡流量。具體操作,請參見變更實例配置。
說明在正式升級實例的規格前,您可以先購買一個按量付費的實例,測試要升級到的目標規格是否能夠滿足業務的負載需求,測試完成后可將其釋放。關于如何釋放實例,請參見釋放按量付費實例。