阿里云Prometheus監控提供一鍵安裝AHPA組件功能,并提供開箱即用的專屬監控大盤。本文介紹如何為AHPA開啟Prometheus監控。
前提條件
已在集群中開啟阿里云Prometheus監控,且Prometheus Agent版本為3.0.0以上,請參見步驟一:開啟阿里云Prometheus監控。
已部署AHPA,且版本為v2.0.0及以上,請參見部署AHPA。
已將如下預測結果的代碼寫入Prometheus配置。
apiVersion: v1 kind: ConfigMap metadata: name: application-intelligence namespace: kube-system data: prometheus_writer_url: http://cn-hangzhou-intranet.arms.aliyuncs.com/prometheus/190601496873****/cd5ec926b715e41b282296d1415a1***/cn-hangzhou/api/v3/write prometheus_writer_ak: xxx prometheus_writer_sk: xx ...
prometheus_writer_url
:設置Remote Write內網地址。prometheus_writer_ak
: 設置阿里云賬號的AccessKeyID。prometheus_writer_sk
:設置阿里云賬號的AccessKeySecret。
步驟一:接入AHPA
您可以參見下方步驟將AHPA組件接入阿里云Prometheus。
登錄ARMS控制臺。
在左側的導航欄,單擊接入中心,然后在頁面的搜索欄輸入AHPA。
單擊AHPA資源卡片,根據頁面信息提示,選擇待接入的容器服務集群和配置信息,完成AHPA的接入
配置項
說明
接入名稱
當前AHPA監控唯一名稱。
metrics采集間隔(秒)
監控數據采集時間間隔。
查看AHPA大盤數據
登錄ARMS控制臺。
在左側的導航欄,單擊接入管理,然后單擊已接入組件。
單擊AHPA資源卡片,然后單擊大盤列表頁簽,單擊具體大盤名稱,在Grafana查看AHPA監控大盤的詳情數據。
Prometheus監控提供的AHPA大盤數據包括CPU使用率、Pod數、預測Pod數等。
CPU使用率&實際POD數大盤:當前工作負載(Deployment)的CPU平均利用率以及Pod數量。
CPU實際使用量與預測使用量:當前工作負載中Pod的CPU使用總量與預測給出的使用量。如果預測給出的使用量大于實際使用量,則表明預測的CPU容量充足。
Pod趨勢:實際Pod數、推薦Pod數以及主動預測的Pod數。
實際Pod數:當前運行中的Pod數量。
推薦Pod數:AHPA推薦擴縮容Pod數。綜合主動預測、被動預測以及邊界區間給出的最終Pod數。
主動預測:是基于歷史數據,識別出周期性,然后預測出來的Pod數。
AHPA關鍵指標說明
指標名 | 說明 |
ahpa_proactive_pods | 主動預測Pod數 |
ahpa_reactive_pods | 被動預測Pod數 |
ahpa_requested_pods | 推薦Pod數 |
ahpa_max_pods | 最大Pod數 |
ahpa_min_pods | 最小Pod數 |
ahpa_target_metric | 目標閾值 |
相關文檔
在云原生場景下,資源容量通常難以預估,而使用K8s原生的HPA,需要面對彈性滯后以及配置復雜問題。AHPA(Advanced Horizontal Pod Autoscaler)彈性預測可以根據業務歷史指標,自動識別彈性周期并對容量進行預測,幫助您提前進行彈性規劃,解決彈性滯后問題。關于AHPA的更多實踐,請參見彈性伸縮最佳實踐。