ACK集群已經兼容阿里云Prometheus和Grafana,無需您自建監控系統和可視化大盤。在Knative中部署業務應用后,您可以將Knative服務的監控數據接入Prometheus,通過Grafana大盤實時查看Knative的響應延遲、請求并發數、CPU和內存資源用量等數據。
前提條件
已在集群中部署Knative,請參見部署Knative。
費用說明
將Knative服務的監控數據接入阿里云Prometheus監控功能后,相關組件會自動將監控指標發送至阿里云Prometheus服務,這些指標將被視為自定義指標。使用自定義指標會引起額外的費用。
為避免產生額外的費用,建議在啟用此功能前,仔細閱讀阿里云Prometheus的計費概述,了解自定義指標的收費策略。費用將根據您的集群規模和應用數量等因素產生變動。您可以通過資源消耗統計功能,監控和管理您的資源使用情況。
開啟阿里云Prometheus監控
登錄容器服務管理控制臺,在左側導航欄選擇集群。
在集群列表頁面,單擊目標集群名稱,然后在左側導航欄,選擇 。
在Knative頁面,單擊監控大盤頁面,然后單擊開啟Prometheus監控。
查看Knative監控大盤
開啟阿里云Prometheus監控后,即可在監控大盤頁簽下查看具體的監控數據。
分類 | 說明 |
請求數據 | 在Overview (average over the selected time range)區域,查看Knative的請求量(Request Volume)、請求成功率(Success Rate)、4xx(客戶端錯誤)、5xx(服務器端錯誤)和Pod擴縮容趨勢的監控數據。 說明 Request Volume、4xx和5xx的大盤圖標縱軸ops/sec表示每秒處理請求數。 |
響應延遲數據 | 在Response Time區域,查看Knative的響應延遲數據,包括P50、P90、P95和P99。 |
請求并發數 | 在Autoscaler區域,查看Knative的請求并發數的詳細數據。 |
資源使用量情況 | 在Resource Usages區域,查看Knative的資源使用量情況,包括CPU和內存。 |
查看Knative服務發現關鍵指標
在ARMS控制臺左側導航欄,單擊接入管理,在右側頁面的已接入環境的容器環境頁簽下,單擊對應Prometheus服務實例的名稱。在容器環境頁面,單擊指標采集,查看Knative服務發現指標。以下介紹Knative服務發現關鍵指標。
當Knative應用縮容到0且沒有Pod實例時,Prometheus無法采集Pod的并發請求數、每秒請求數等指標。只有訪問Knative應用Pod后,控制臺才會展示這些指標。
當Knative應用沒有縮容到0時,無需訪問Knative應用Pod,控制臺便會展示Pod的并發請求數、Pod每秒請求數等指標。
指標名稱 | 說明 |
queue_average_concurrent_requests | Pod的并發請求數。 |
queue_requests_per_second | Pod每秒請求數。 |
revision_request_latencies | 響應延遲。 |
revision_request_count | Revision請求數。 |
相關文檔
您可以基于SLS實現日志采集和監控告警,請參見在Knative上實現日志采集、為Knative服務開啟監控告警。