日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

通過Prometheus配置SAE Grafana大盤和報警規則

Serverless 應用引擎 SAE(Serverless App Engine)平臺的監控和數據源類型分豐富多樣,這些指標都默認集成了阿里云可觀測監控 Prometheus 版(Managed Service for Prometheus),且可觀測監控 Prometheus 版已集成可觀測可視化 Grafana 版。您可以通過Grafana共享版查看預置大盤,或通過創建計費版本的Grafana工作區對SAE的監控數據進行二次開發。

前提條件

您已開通SAE服務,并創建SAE應用。具體操作,請參見創建應用

使用說明

  • 查看SAE平臺預置的單應用Grafana大盤,例如單應用的基礎監控大盤、ARMS應用監控大盤。

  • 查看和配置全局多應用的Grafana可觀測大盤,包括全局所有應用、任務、實例、發布單等各維度指標的統計和Top N大盤,按需配置自定義監控大盤。使用該能力,實現 1人輕松運維成百上千個應用。

  • 通過Prometheus配置SAE各個指標的監控報警規則,保障業務的連續性與服務的高可用。

更多信息,請參見什么是可觀測可視化 Grafana 版Grafana

功能入口

  1. 登錄SAE控制臺

  2. 在左側導航欄,選擇應用管理 > 應用列表,在頂部菜單欄選擇地域,然后單擊具體應用名稱。

  3. 在應用詳情頁面的左側導航欄,單擊基礎監控,然后再單擊頂部提示信息中查看詳情

    • 基礎監控大盤:頁面會跳轉至Grafana的基礎監控大盤頁面。大盤示例,請參見查看單應用的基礎監控Grafana大盤

    • 應用監控大盤:您可以單擊頁面左側的image.png,返回Grafana的搜索頁面。如需查看應用監控大盤,搜索關鍵詞arms,找到以arms-metrics-<您應用所在的地域>-開頭的目錄,展開目錄后,查看具體的監控指標。大盤示例,請參見查看單應用的ARMS監控Grafana大盤

查看單應用的基礎監控Grafana大盤

該大盤展示單個應用下全部實例維度和單個應用維度的監控指標。具體指標如下:

  • CPU使用率

  • 系統平均負載

  • 內存使用量

  • 網絡流入流出速率

  • 網絡數據包

  • 磁盤使用量

  • 磁盤IOPS

  • 磁盤吞吐率

  • TCP連接數

image.png

查看單應用的ARMS監控Grafana大盤

重要

SAE內置的ARMS監控能力適用于Java應用。

該大盤從API、Application、DB和Machine維度,展示監控指標。大盤內各指標含義,請參見應用監控指標說明

  • API(應用總覽監控視圖)

    應用總覽視圖展示應用全局的請求數、RT和錯誤數,以及鏈路上下游的請求數、RT和錯誤數監控指標。

    image.png

  • Application(應用詳情監控視圖)

    應用詳情視圖包括服務調用(提供的服務和調用的服務)、JVM、實例等監控指標。

    image.png

  • DB(應用關聯的數據庫監控視圖)

    應用關聯的數據庫監控視圖包含請求數、錯誤數、RT、連接池等監控指標。

    sc_db_dashboard

  • Machine(應用實例監控視圖)

    應用實例監控視圖包含單個應用下具體實例IP的CPU、內存、負載、磁盤、網絡流量和網絡數據包等監控指標。

    sc_machine_dashboard

配置全局多應用的Grafana可觀測大盤

重要

創建Grafana工作區會產生一定的費用。更多信息,請參見計費規則

如果基礎監控大盤和應用監控大盤不能滿足您的需求,您可以通過配置全局可觀測大盤,自定義更全面、更精細化的大盤數據,便于以全局視角及時發現當前問題,規避潛在風險,分析未來趨勢。

  1. 創建Grafana工作區。具體操作,請參見創建Grafana工作區

    您可以在工作區管理頁面,查看剛創建成功的目標工作區。

  2. 工作區管理頁面,單擊目標工具區名稱,然后在工作區信息頁面的云服務集成區域,集成SAE各項數據源。

    • 集成SAE數據源,該數據源包含SAE基礎監控數據以及平臺側相關數據。

      在云服務集成列表中,選擇Prometheus云服務監控(舊),篩選集成對應地域的云產品SAE自監控數據源。

      image.png

    • 集成ARMS數據源,該數據源包含SAE應用監控數據。

      在云服務集成列表中,選擇ARMS應用監控服務,集成對應地域的數據源。sc_application_monitoring_service_in_cloud_service_integration

    • 集成SLS數據源,該數據源包含SAE事件信息。

      在云服務集成列表中,選擇SLS日志服務,添加SLS數據源。具體操作,請參見云服務集成image.png

      創建數據源時,所屬項目選擇aliyun-product-data-{userId}-{regionId}logstore選擇sae_eventimage.png

      說明

      2023年04月28日前未部署過的應用,需重新部署后才會產生數據。

  3. 在Grafana中,導入大盤模板。

    輸入各項大盤模板的ID,導入大盤模板并添加步驟2的數據源。如下圖所示,導入數據源成功后,即可查看Grafana大盤。具體操作,請參見添加并使用Prometheus數據源

    分類

    大盤ID

    導入數據源

    查看監控指標

    應用全局大盤

    18555

    sc_import_sae_application_dashboard_from_grafana

    sc_sae_application_overview_dashboard

    任務全局大盤

    18556

    sc_import_sae_job_dashboard_from_grafana

    sc_sae_job_overview_dashboard

    實例生命周期大盤

    19098

    sc_import_sae_instance_lifecycle_dashboard_from_grafana

    sc_sae_instance_lifecycle_dashboard

    發布單大盤

    19099

    sc_import_sae_changeorder_overview_dashboard_from_grafana

    sc_sae_changeorder_overview_dashboard

通過Prometheus配置SAE各個指標的監控告警規則

重要

創建Grafana工作區會產生一定的費用。更多信息,請參見計費規則

通過集成Prometheus云服務監控的SAE數據源,您可以基于應用、任務、實例和發布單等SAE的關鍵業務指標,配置監控告警以保障業務的連續性與服務的高可用。

支持的SAE指標

Prometheus中內置的SAE業務指標明細如下。

應用相關指標

指標名稱

類型

說明

單位

維度

app_replicas_count

gauge

應用目標實例數

"appId", "appName", "namespace"

app_available_replicas_count

gauge

應用可用實例數

"appId", "appName", "namespace"

任務相關指標

指標名稱

類型

說明

單位

維度

job_active_count

gauge

任務正在運行數

"appId", "appName", "jobId", "namespace"

job_succeeded_count

gauge

任務運行成功數

"appId", "appName", "jobId", "namespace"

job_failed_count

gauge

任務運行失敗數

"appId", "appName", "jobId", "namespace"

job_cost_time

gauge

任務執行耗時

s

"appId", "appName", "jobId", "namespace"

實例相關指標

指標名稱

類型

說明

單位

維度

instance_state

gauge

實例運行狀態,其中不同狀態的數值映射如下:

  • 0:Pending

  • 1:PodInitializing

  • 2:Init

  • 3:ContainerCreating

  • 4:Running

  • 5:Terminating

  • 6:ImagePullBackOff

  • 7:ErrImagePull

  • 8:CrashLoopBackOff

  • 9:Error

  • 10:ContainerStatusUnknown, NotFound

  • 11:Completed

  • 12:Failed

  • -1:其他狀態

"appId", "appName", "namespace", "instanceId"

發布單相關指標

指標名稱

類型

說明

單位

維度

changeorder_count

counter

變更執行總數

"appId", "appName", "namespace", "regionId","changeorderType"

changeorder_success

counter

變更執行成功數

"appId", "appName", "namespace", "regionId","changeorderType"

changeorder_failed

counter

變更執行失敗數

"appId", "appName", "namespace", "regionId","changeorderType"

changeorder_time

histogram

變更執行耗時

ms

"appId", "appName", "namespace", "regionId","changeorderType"

task_time

histogram

變更步驟耗時

ms

"appId", "appName", "namespace", "regionId", "taskType"

配置監控告警規則

  1. 集成SAE數據源。

    1. 創建Grafana工作區。具體操作,請參見創建Grafana工作區

      您可以在工作區管理頁面,查看剛創建成功的目標工作區。

    2. 工作區管理頁面,單擊目標工具區名稱,然后在工作區信息頁面的云服務集成區域,集成SAE數據源。

      集成SAE數據源,該數據源包含SAE基礎監控數據以及平臺側相關數據。

      在云服務集成列表中,選擇Prometheus云服務監控(舊),篩選集成對應地域的云產品SAE自監控數據源。

      image.png

  2. 配置規則。

    集成SAE數據源后,登錄Prometheus控制臺并創建監控告警規則。具體操作,請參見Prometheus告警規則