阿里云容器計算服務ACS使用容器智能運維平臺提供一鍵故障診斷能力,包括Pod診斷、Service診斷、Ingress診斷,可以輔助您定位集群中出現的問題。本文介紹如何在ACS集群中使用集群診斷功能。
診斷功能介紹
容器智能運維平臺提供的診斷功能如下表所示。
診斷項 | 說明 |
診斷K8s Pod狀態異常相關的問題,例如Pod啟動失敗,Pod頻繁重啟等 。 | |
診斷Service相關的問題,例如Service配置、資源配額、異常事件信息等。 | |
診斷Ingress相關的流量配置等問題。 |
配置故障診斷
使用故障診斷功能時,系統將在您的集群上執行數據采集程序并收集檢查結果。采集的信息包括系統版本、負載、容器組件等運行狀態及系統日志中關鍵錯誤信息。數據采集程序不會采集您的業務信息及敏感數據。
配置Pod診斷與配置Service、Ingress等診斷操作類似。這里以配置Pod診斷為例,介紹如何配置故障診斷功能。
登錄容器計算服務控制臺,在左側導航欄選擇集群。
在集群列表頁面,單擊目標集群名稱,然后在左側導航欄,選擇
,并按照對話框提示進行授權。在故障診斷頁面,單擊Pod診斷。
在Pod診斷頁面,單擊診斷。
在選擇Pod面板,選擇Pod命名空間和Pod名稱,仔細閱讀注意事項后選中我已知曉并同意,然后單擊發起診斷。
說明您可以根據頁面提示查看診斷進展。診斷完成后,診斷頁面將顯示診斷結果和診斷項,供您查看異常原因并修復問題。
看診斷結果
在故障診斷頁面診斷列表的操作列,單擊目標診斷報告對應的診斷詳情,在診斷詳情頁面查看詳細診斷結果。
根據集群配置,具體檢查項可能稍有不同。實際結果請以診斷頁面結果為準。
診斷項 | 對應的檢查項狀態 | 說明 |
Pod診斷 |
| Pod診斷包括Pod、ClusterComponent檢查項。通過Pod狀態、集群組件狀態綜合判定Pod異常原因。在診斷詳情頁面,可以看到Pod的診斷結果、修復建議及具體的診斷項列表。 鼠標懸浮在檢查項右側圖標上,即可查看檢查項說明。 如果有異常或警告類的檢查項,會顯示在待處理頁簽中。 檢查項狀態為異常時,可以在目標檢查項右側狀態中的查看詳情的Tips中查看異常。 |
Service診斷 | Service診斷包括Service和ResourceQuotas檢查項。通過檢查CLB計費類型、證書、配額、異常Event等檢查項判定Service異常原因。 鼠標懸浮在檢查項右側圖標上,即可查看檢查項說明。 如果有異常或警告類的檢查項,會顯示在待處理頁簽中。 檢查項狀態為異常時,可以在目標檢查項右側狀態中的查看詳情的Tips中查看異常。 | |
Ingress診斷 | Ingress診斷包括Ingress、Addon、SLB檢查項。通過Ingress狀態、Ingress插件狀態和SLB狀態綜合判定Ingress異常原因。 鼠標懸浮在檢查項右側圖標上,即可查看檢查項說明。 如果有異常或警告類的檢查項,會顯示在待處理頁簽中。 檢查項狀態為異常時,可以在目標檢查項右側狀態中的查看詳情的Tips中查看異常。 |