Serverless 應用引擎 SAE(Serverless App Engine)平臺的監控和數據源類型分豐富多樣,這些指標都默認集成了阿里云可觀測監控 Prometheus 版(Managed Service for Prometheus),且可觀測監控 Prometheus 版已集成可觀測可視化 Grafana 版。您可以通過Grafana共享版查看預置大盤,或通過創建計費版本的Grafana工作區對SAE的監控數據進行二次開發。
前提條件
您已開通SAE服務,并創建SAE應用。具體操作,請參見創建應用。
使用說明
查看SAE平臺預置的單應用Grafana大盤,例如單應用的基礎監控大盤、ARMS應用監控大盤。
查看和配置全局多應用的Grafana可觀測大盤,包括全局所有應用、任務、實例、發布單等各維度指標的統計和Top N大盤,按需配置自定義監控大盤。使用該能力,實現 1人輕松運維成百上千個應用。
通過Prometheus配置SAE各個指標的監控報警規則,保障業務的連續性與服務的高可用。
更多信息,請參見什么是可觀測可視化 Grafana 版和Grafana。
功能入口
登錄SAE控制臺。
在左側導航欄,選擇 ,在頂部菜單欄選擇地域,然后單擊具體應用名稱。
在應用詳情頁面的左側導航欄,單擊基礎監控,然后再單擊頂部提示信息中查看詳情。
基礎監控大盤:頁面會跳轉至Grafana的基礎監控大盤頁面。大盤示例,請參見查看單應用的基礎監控Grafana大盤。
應用監控大盤:您可以單擊頁面左側的,返回Grafana的搜索頁面。如需查看應用監控大盤,搜索關鍵詞
arms
,找到以arms-metrics-<您應用所在的地域>-
開頭的目錄,展開目錄后,查看具體的監控指標。大盤示例,請參見查看單應用的ARMS監控Grafana大盤。
查看單應用的基礎監控Grafana大盤
該大盤展示單個應用下全部實例維度和單個應用維度的監控指標。具體指標如下:
CPU使用率
系統平均負載
內存使用量
網絡流入流出速率
網絡數據包
磁盤使用量
磁盤IOPS
磁盤吞吐率
TCP連接數
查看單應用的ARMS監控Grafana大盤
SAE內置的ARMS監控能力適用于Java應用。
該大盤從API、Application、DB和Machine維度,展示監控指標。大盤內各指標含義,請參見應用監控指標說明。
API(應用總覽監控視圖)
應用總覽視圖展示應用全局的請求數、RT和錯誤數,以及鏈路上下游的請求數、RT和錯誤數監控指標。
Application(應用詳情監控視圖)
應用詳情視圖包括服務調用(提供的服務和調用的服務)、JVM、實例等監控指標。
DB(應用關聯的數據庫監控視圖)
應用關聯的數據庫監控視圖包含請求數、錯誤數、RT、連接池等監控指標。
Machine(應用實例監控視圖)
應用實例監控視圖包含單個應用下具體實例IP的CPU、內存、負載、磁盤、網絡流量和網絡數據包等監控指標。
配置全局多應用的Grafana可觀測大盤
創建Grafana工作區會產生一定的費用。更多信息,請參見計費規則。
如果基礎監控大盤和應用監控大盤不能滿足您的需求,您可以通過配置全局可觀測大盤,自定義更全面、更精細化的大盤數據,便于以全局視角及時發現當前問題,規避潛在風險,分析未來趨勢。
創建Grafana工作區。具體操作,請參見創建Grafana工作區。
您可以在工作區管理頁面,查看剛創建成功的目標工作區。
在工作區管理頁面,單擊目標工具區名稱,然后在工作區信息頁面的云服務集成區域,集成SAE各項數據源。
集成SAE數據源,該數據源包含SAE基礎監控數據以及平臺側相關數據。
在云服務集成列表中,選擇Prometheus云服務監控(舊),篩選集成對應地域的云產品SAE自監控數據源。
集成ARMS數據源,該數據源包含SAE應用監控數據。
在云服務集成列表中,選擇ARMS應用監控服務,集成對應地域的數據源。
集成SLS數據源,該數據源包含SAE事件信息。
在云服務集成列表中,選擇SLS日志服務,添加SLS數據源。具體操作,請參見云服務集成。
創建數據源時,所屬項目選擇
aliyun-product-data-{userId}-{regionId}
,logstore選擇sae_event
。說明2023年04月28日前未部署過的應用,需重新部署后才會產生數據。
在Grafana中,導入大盤模板。
輸入各項大盤模板的ID,導入大盤模板并添加步驟2的數據源。如下圖所示,導入數據源成功后,即可查看Grafana大盤。具體操作,請參見添加并使用Prometheus數據源。
分類
大盤ID
導入數據源
查看監控指標
應用全局大盤
18555
任務全局大盤
18556
實例生命周期大盤
19098
發布單大盤
19099
通過Prometheus配置SAE各個指標的監控告警規則
創建Grafana工作區會產生一定的費用。更多信息,請參見計費規則。
通過集成Prometheus云服務監控的SAE數據源,您可以基于應用、任務、實例和發布單等SAE的關鍵業務指標,配置監控告警以保障業務的連續性與服務的高可用。
支持的SAE指標
Prometheus中內置的SAE業務指標明細如下。
配置監控告警規則
集成SAE數據源。
創建Grafana工作區。具體操作,請參見創建Grafana工作區。
您可以在工作區管理頁面,查看剛創建成功的目標工作區。
在工作區管理頁面,單擊目標工具區名稱,然后在工作區信息頁面的云服務集成區域,集成SAE數據源。
集成SAE數據源,該數據源包含SAE基礎監控數據以及平臺側相關數據。
在云服務集成列表中,選擇Prometheus云服務監控(舊),篩選集成對應地域的云產品SAE自監控數據源。
配置規則。
集成SAE數據源后,登錄Prometheus控制臺并創建監控告警規則。具體操作,請參見Prometheus告警規則。