可觀測監控 Prometheus 版提供一鍵安裝AHPA組件功能,并提供開箱即用的專屬監控大盤。本文介紹如何為AHPA開啟可觀測監控 Prometheus 版。
前提條件
已開通可觀測監控Prometheus版。具體操作,請參見計費說明。
已創建Kubernetes集群。具體操作,請參見創建ACK托管集群、創建ACK Serverless集群。
已開通阿里云資源中心。具體操作,請參見開通資源中心。
已部署AHPA。具體操作,請參見部署AHPA。
背景信息
在云原生場景下,資源容量通常難以預估,而使用K8s原生的HPA,您需要面對彈性滯后以及配置復雜問題。阿里云容器服務與達摩院決策智能時序團隊合作推出了AHPA(Advanced Horizontal Pod Autoscaler)彈性預測,其可以根據業務歷史指標,自動識別彈性周期并對容量進行預測,幫助您提前進行彈性規劃,解決彈性滯后的問題。
接入AHPA
登錄Prometheus控制臺,在左側導航欄單擊接入中心。
單擊ACK AHPA卡片,然后根據控制臺指引完成組件接入。下面對重點配置項進行說明。
配置項
說明
自動安裝 AHPA Controller
選擇是否自動安裝AHPA Controller。
Metrics 采集間隔(秒)
監控數據采集時間間隔,默認15s。
已接入的組件可單擊Prometheus控制臺左側導航欄中的接入管理查看。接入管理頁面包括已接入環境、已接入組件和大盤查詢頁簽,您可以查看Targets、指標、大盤、告警等信息。
查看AHPA大盤數據
在接入管理頁面單擊已接入組件頁簽,單擊AHPA卡片。單擊大盤列表頁簽,單擊大盤名稱,您可以查看其監控大盤的詳情數據。
可觀測監控 Prometheus 版提供的AHPA大盤數據包括CPU使用率、實際Pod數、CPU實際使用量與預測使用量、Pod趨勢。
CPU利用率和實際POD數大盤區域:展示了當前工作負載(Deployment)的CPU平均使用率以及Pod數量。
CPU實際使用量與預測使用量區域:表示當前工作負載中Pod的CPU使用總量與預測給出的使用量。如果預測給出的使用量大于實際使用量,則表明預測的CPU容量充足。
Pod 趨勢區域:您可以查看實際Pod數、推薦Pod數以及主動預測的Pod數。
實際Pod數:表示當前運行中的Pod數量。
推薦Pod數:表示AHPA推薦擴縮容Pod數量。即綜合主動預測、被動預測以及邊界區間給出的最終Pod數量。
主動預測:是系統基于歷史數據,主動識別出周期性,并給出的預測Pod數量。
AHPA關鍵指標說明
指標名 | 說明 |
ahpa_proactive_pods | 主動預測Pod數 |
ahpa_reactive_pods | 被動預測Pod數 |
ahpa_requested_pods | 推薦Pod數 |
ahpa_max_pods | 最大Pod數 |
ahpa_min_pods | 最小Pod數 |
ahpa_target_metric | 目標閾值 |