查看集群信息
當(dāng)需要故障排查時,可以通過集群信息頁面提供的巡檢信息、相關(guān)云資源、集群資源監(jiān)控等信息來快速定位和解決問題。本文介紹如何查看集群信息以及集群信息項。
前提條件
操作步驟
登錄容器計算服務(wù)控制臺,在左側(cè)導(dǎo)航欄選擇集群。
在集群頁面,單擊目標(biāo)集群ID,然后在左側(cè)導(dǎo)航欄,選擇集群信息。
在集群信息頁面,單擊不同頁簽,可以查看不同維度的信息。
頁簽
說明
概覽
選擇要查看的命名空間,查看應(yīng)用狀態(tài)、組件狀態(tài)和資源監(jiān)控圖表等內(nèi)容。
應(yīng)用狀態(tài):顯示當(dāng)前運行的部署、容器組、有狀態(tài)副本集等應(yīng)用狀態(tài)的示意圖,綠色圖標(biāo)代表正常,黃色圖標(biāo)代表異常。
集群風(fēng)險預(yù)警:自動掃描Kubernetes集群,提示您潛在的風(fēng)險和對應(yīng)的解決方案,防止您的業(yè)務(wù)受損。
事件:顯示集群的事件信息,例如警告和錯誤事件等。
資源監(jiān)控:提供CPU和內(nèi)存的監(jiān)控圖表。CPU統(tǒng)計單位為Cores(核),可顯示小數(shù)點后3位,最小統(tǒng)計單位是millcores,即一個核的1/1000;內(nèi)存的統(tǒng)計單位是Gi,可顯示小數(shù)點后3位。更多相關(guān)信息,請參見Meaning of CPU和Meaning of memory。
基本信息
基本信息:集群ID、狀態(tài)、地域。
集群信息:API Server連接端點、Service CIDR、RRSA OIDC、自定義證書SAN。
集群維護(hù):配置集群維護(hù)窗口。
連接信息
獲取公網(wǎng)和內(nèi)網(wǎng)環(huán)境下KubeConfig文件的配置內(nèi)容,用于配置通過kubectl客戶端訪問集群。
說明創(chuàng)建集群時未勾選API Server 訪問配置只可以看到內(nèi)網(wǎng)環(huán)境下KubeConfig文件的配置內(nèi)容。
集群資源
集群所使用的相關(guān)云資源,包括專有網(wǎng)絡(luò)VPC、節(jié)點虛擬交換機(jī)、安全組、日志服務(wù)Project、API Server負(fù)載均衡(SLB)等。通過單擊相應(yīng)的資源ID可以跳轉(zhuǎn)至對應(yīng)的控制臺。
重要這些資源由阿里云容器計算服務(wù)進(jìn)行管理,請勿隨意刪除或自行修改,避免集群異常,影響集群內(nèi)應(yīng)用的正常運行。
集群監(jiān)控
對接可觀測監(jiān)控 Prometheus 版,對集群進(jìn)行資源監(jiān)控,支持快速查看負(fù)載的CPU、內(nèi)存、網(wǎng)絡(luò)等指標(biāo)的使用率,帶來更專業(yè)的監(jiān)控與報警能力和更合適的容器場景指標(biāo)。更多信息,請參見使用阿里云Prometheus監(jiān)控ACS集群狀態(tài)。
集群日志
集群的運行日志。
任務(wù)日志
查看集群任務(wù)、任務(wù)狀態(tài)、變更時間等。失敗任務(wù)將提示失敗信息,方便協(xié)助問題的排查和診斷。