本文主要介紹在容器服務ACK集群中,如何接入可觀測監控 Prometheus 版以及如何在集群中查看監控大盤和如何設置告警規則。
前提條件
步驟一:接入容器集群
可觀測監控Prometheus服務和容器服務默認做了產品能力集成,您可以通過以下兩種方式將Prometheus服務接入容器集群中。
方式一:通過容器服務控制臺接入
新建集群時接入
在創建容器服務集群時,默認會集成Prometheus服務能力給用戶提供容器監控能力。
已有集群接入
您可以按照以下步驟在已有集群中接入Prometheus服務。
登錄容器服務管理控制臺,在左側導航欄選擇集群。
在集群列表頁面,單擊目標集群名稱,然后在左側導航欄,選擇 。
在Prometheus 監控頁面,單擊開始安裝。
說明控制臺會自動安裝組件、檢查監控大盤。安裝完成后,單擊各個頁簽查看相應的監控數據。
Prometheus服務接入容器集群后,數據接入大概需要1~2分鐘左右,所以監控大盤剛開始不顯示數據。
方式二:通過ARMS或Prometheus控制臺接入
您也可以通過ARMS控制臺或者Prometheus控制臺接入容器集群,兩種方式的操作步驟類似,此處以ARMS控制臺為例進行說明。
登錄ARMS控制臺。
在左側導航欄單擊接入中心。
在接入中心頁面,單擊基礎設施頁簽,在基礎設施區域選擇容器集群監控。
在容器集群監控面板的開始接入頁簽,選擇待接入的容器集群,然后單擊確定。
Prometheus服務接入容器集群后,數據接入大概需要1~2分鐘左右,所以監控大盤剛開始不顯示數據。
步驟二:查看監控大盤
Prometheus默認內置了很多容器監控大盤,包括集群概覽、核心組件、Node、Pod等監控能力,在容器服務控制臺、ARMS控制臺、Prometheus控制臺都有透出。您可以通過以下兩種方式查看監控大盤。
方式一:在容器服務控制臺查看
登錄容器服務管理控制臺,在左側導航欄選擇集群。
在集群列表頁面,單擊目標集群名稱,然后在左側導航欄,選擇 。
在Prometheus 監控頁面,單擊需要查看監控大盤,即可查看相應的監控數據。
方式二:在ARMS或Prometheus控制臺查看
您也可以登錄應用實時監控服務ARMS控制臺或者Prometheus監控服務控制臺查看集群的監控大盤。下面以ARMS控制臺為例:
登錄ARMS控制臺。
在左側導航欄單擊接入管理。
在接入管理頁面,單擊大盤查詢頁簽。
在容器環境中選擇待查看的集群,即可查看對應的監控大盤。
步驟三:設置告警
登錄ARMS控制臺。
在左側導航欄單擊接入管理。
在接入管理頁面的已接入環境頁簽中,選擇容器環境,在容器環境列表中,單擊目標環境名稱進入容器環境詳情頁面。
在組件管理頁簽,在組件類型區域單擊告警規則,即可查看Prometheus內置的告警通知。
內置的告警規則會產生告警事件,但是不會進行告警通知,如果您希望將告警通知發送到郵件或其他平臺,可以單擊編輯配置通知方式。在告警配置頁面,您也可以自定義告警閾值、持續時間、告警內容等,告警詳細配置可參見創建Prometheus告警規則。
在極簡模式下,您可以設置告警的通知對象、通知時段和重復策略。