服務網格ASM提供日志中心功能,支持從ASM控制臺查看服務網格控制平面和數據平面日志。啟用日志采集后,您可以通過日志中心查看控制平面日志、配置基于日志的告警規則、查看數據平面日志和相關的Dashboard。本文介紹如何啟用控制平面日志采集和日志告警。
前提條件
阿里云賬號已開通阿里云日志服務SLS。具體操作,請參見開通日志服務。
重要將日志采集到ASM的日志服務不額外收取任何費用,但日志服務SLS會按照寫入數據量計費或按使用功能計費。關于SLS計費的詳細說明,請參見計費概述。
數據平面集群已安裝logtail-ds組件。具體操作,請參見啟用日志服務組件Logtail。
已添加集群到ASM實例,且實例版本為1.17.2.35及以上。具體操作,請參見添加集群到ASM實例和升級ASM實例。
說明若您的實例為1.17.2.35以下,請參見啟用控制平面日志采集和日志告警(舊版)。
啟用控制平面日志采集
登錄ASM控制臺,在左側導航欄,選擇 。
在網格管理頁面,單擊目標實例名稱,然后在左側導航欄,選擇 。
在日志中心頁面,單擊控制平面日志頁簽,選擇新建Project或使用已有Project,進行相關配置,然后單擊啟用控制平面日志采集,在確認對話框,單擊確定。
將日志采集到日志服務SLS后,您可以進行以下操作。
通過控制臺查看控制平面日志。具體操作,請參見查看控制平面日志。
啟用基于日志的告警,及時發現控制平面問題。具體操作,請參見配置控制平面日志告警。
若您不再需要此功能,可以在控制平面日志頁簽的右上角,單擊關閉控制面日志采集,在確認對話框,單擊確定。
查看控制平面日志
啟用控制平面日志采集后,由于托管側的日志被采集到日志服務SLS中,您可以通過日志服務SLS控制臺或服務網格ASM控制臺集成的日志瀏覽界面,查看或檢索控制平面日志。
SLS分發建立需要一定時間,因此在啟用日志后短時間內,在控制臺可能會出現暫時看不到日志的情況。
方式一:通過ASM控制臺
登錄ASM控制臺,在左側導航欄,選擇 。
在網格管理頁面,單擊目標實例名稱,然后在左側導航欄,選擇 。
在日志中心頁面,單擊控制平面日志頁簽,查看日志相關信息。
方式二:通過SLS控制臺
登錄日志服務控制臺。
在Project列表區域,單擊目標集群對應的日志服務Project名稱。
在左側日志庫單擊目標日志庫,然后在頁面右側,查看日志相關信息。
配置控制平面日志告警
啟用控制平面日志采集后,您可以配置控制平面日志告警。
配置告警通知人
您可以配置SLS服務網關內置行動策略,設置告警通知接收人,通知模板等。
登錄日志服務控制臺。
在Project列表區域,單擊目標Project名稱,然后在左側導航欄,單擊告警。
在告警中心頁面,單擊
。在用戶組管理頁簽,單擊SLS 服務網格內置用戶組右側操作列下的修改。
在修改用戶組對話框,在待添加成員區域選中目標成員,單擊圖標,將目標成員添加到已添加成員區域,然后單擊確認。
觸發告警通知示例
本文限于篇幅無法覆蓋每一個告警項,以下例子將通過錯誤的配置觸發從網格控制面推送配置失敗。
登錄ASM控制臺,在左側導航欄,選擇 。
在網格管理頁面,單擊目標實例名稱,然后在左側導航欄,選擇 ,然后單擊使用YAML創建。
在創建頁面,選中目標命名空間和任意場景模板,配置YAML。
本文以default命名空間為例,配置服務網關,YAML示例如下:
apiVersion: networking.istio.io/v1beta1 kind: Gateway metadata: name: gateway-test namespace: default spec: selector: istio: ingressgateway servers: - hosts: - '*console.aliyun.com' port: name: https number: 443 protocol: HTTPS tls: credentialName: not-existing-credential mode: SIMPLE
查看告警通知。
登錄ASM控制臺,在左側導航欄,選擇 。
在網格管理頁面,單擊目標實例名稱,然后在左側導航欄,選擇 。
在日志中心頁面,單擊控制平面日志,搜索
ACK ERROR
,查看告警信息。如果您配置了告警通知人的郵箱地址,可以在郵箱中查看告警通知。
告警處理建議
診斷出警告的網格配置
ASM網格診斷在您的集群中發現了潛在有風險的網格配置,這些配置可能會導致ASM的執行結果不符合預期。您可以通過網格診斷頁面查看告警內容,并按照網格診斷頁面的提示修正錯誤的配置。更多信息,請參見使用ASM網格診斷。
診斷出錯誤的網格配置
ASM網格診斷在您的集群中發現了錯誤的網格配置,這些配置有較高的風險引起不符合預期的行為。您應當盡快在網格診斷頁面查看告警內容,并遵照網格診斷頁面給出的提示修正錯誤的配置。更多信息,請參見使用ASM網格診斷。
網格規則配置不符合規范要求導致從網格控制面推送配置失敗
以下表格列出了常見的數據面同步失敗錯誤信息和處理建議。如果您沒有找到對應的錯誤信息,請提交工單。
錯誤信息 | 處理建議 |
| 該告警信息表示數據面集群不支持您為數據面配置的證書,您需要重新配置證書。當前僅支持P-256 ECDSA證書。具體操作,請參見通過ASM網關啟用HTTPS安全服務。 |
| 該告警信息表示您為數據面配置的證書路徑有誤或證書不存在,您需要檢查證書掛載路徑是否與Gateway中配置的路徑相符。具體操作,請參見通過ASM網關啟用HTTPS安全服務。 |
| 該告警信息表示您為網關配置的監聽端口重復,請檢查您的Gateway,刪除重復的端口。 |
| 該告警信息表示在Sidecar和Ingressgateway中無法找到您通過EnvoyFilter針對15021這個Listener Patch的配置中引用的 |
| 該告警信息表示即將棄用您數據面的XDS V2協議。通常是因為您的數據面Sidecar的版本與控制平面不符。升級數據平面的Sidecar可以解決該問題,您需要刪除Pod,待Pod自動重新創建后會自動注入最新版本的Sidecar。 |
證書管理處存在過期證書,可能導致網關處理TLS流量失敗
該告警提示證書管理中的證書已經過期,需要立即處理。
證書管理處存在即將過期的證書,請及時更新證書
該告警提示證書管理中的證書即將過期,需要盡快處理。
相關操作
修改控制平面日志Project
登錄ASM控制臺,在左側導航欄,選擇 。
在網格管理頁面,單擊目標實例名稱,然后在左側導航欄,選擇 。
在日志中心頁面的控制平面日志頁簽下方,單擊更改日志Project,在更改日志Project對話框,按需進行修改,然后單擊確認。