日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

資源配額監控與報警

資源配額(Quota)支持查看和監控資源狀況,提供詳細的監控指標,幫助您掌握資源負載情況。通過監控報警功能,您可以靈活配置報警規則和通知,來實時監控資源水位。當資源水位出現波動(例如CPU使用率超過閾值)時,則會發送報警通知。本文為您介紹如何通過云監控ARMS,查看監控數據、配置監控報警通知、訂閱監控指標。

前提條件

要設置資源配額(Quota)的監控與報警,您需要先創建資源配額,詳情請參見資源配額(Quota)功能介紹。

使用限制

功能分類

支持的資源類型

支持的地域

Quota

靈駿智算資源

  • 華北6(烏蘭察布)

  • 新加坡

通用計算資源

  • 華北2(北京)

  • 華東2(上海)

  • 華東1(杭州)

  • 華南1(深圳)

  • 華北6(烏蘭察布)

  • 新加坡

監控指標說明

監控指標主要包括CPU、內存、磁盤、網絡,以及GPU相關指標。全量指標列表及細節說明請參見PAI-資源配額(Quota)指標列表。

監控指標

描述

CPU調度量(Quota維度)

指定QuotaCPU調度量。

CPU總量(Quota維度)

指定QuotaCPU總量。

CPU使用率(Quota維度)

指定QuotaCPU使用百分比。

GPU算力使用率(Quota維度)

指定QuotaGPU算力使用率。

GPU顯存使用率(Quota維度)

指定QuotaGPU顯存使用率。

GPU調度量(Quota維度)

指定QuotaGPU調度量。

GPU總量(Quota維度)

指定QuotaGPU總量。

GPU設備功耗(Quota維度)

指定QuotaGPU設備功耗。

內存使用率(Quota維度)

指定Quota的內存使用百分比。

更多指標,請參考PAI-資源配額(Quota)指標列表

使用云監控

云監控(CloudMonitor)是一項針對阿里云資源和互聯網應用進行監控的服務,為云上用戶提供開箱即用的企業級開放型一站式監控解決方案。您可以登錄云監控控制臺,查看PAI-資源配額(Quota)監控數據,并設置告警通知。云監控還支持通過API訂閱指標數據,助您建立自己的監控系統和數據大盤。更多關于云監控的詳細介紹,請參見什么是云監控。

計費說明

使用云監控服務會產生一定的費用,詳細的計費說明,請參見云監控計費說明。

查看監控數據

  1. 登錄云監控控制臺。

  2. 在左側導航欄,選擇可視化(Dashboard) > 云產品大盤。

  3. 云產品大盤頁面,選擇PAI-資源配額(Quota)。在搜索框內,選擇或搜索資源配額名稱,對應的監控圖表會在頁面下方展示。

    在對應的監控圖表中,可以進行以下操作:

    • 切換監控維度:目前支持Quota維度節點維度的監控指標展示。image

    • 切換展示時間范圍image

    • 放大視圖:您可以單擊每個圖表右上角的放大按鈕image.png,查看監控數據的細節視圖。image

配置監控報警

通過監控報警功能,您可以監控資源配額(Quota)中已分配的資源的水位,并靈活地配置報警規則。如果資源水位出現波動,例如低于配置的報警規則時,則會發送報警通知。通過云監控控制臺配置監控報警通知的操作步驟如下:

步驟一:配置報警聯系人

  1. 登錄云監控控制臺。

  2. 在左側導航欄,選擇報警服務 > 報警聯系人。

  3. 報警聯系人頁簽,單擊創建聯系人,填寫報警聯系人的姓名、手機號碼、郵箱或Webhook地址,并單擊確認。

  4. 報警聯系組頁簽,單擊新建聯系人組,填寫報警聯系人組的組名,并選擇已有報警聯系人,然后單擊確認。

步驟二:配置報警規則

  1. 云監控控制臺的左側導航欄,選擇云資源監控 > 云產品監控

  2. 云產品監控頁面,搜索并進入PAI-資源配額(Quota)。image

  3. PAI-資源配額(Quota)頁面,選擇服務所在的地域,然后單擊創建報警規則

  4. 創建報警規則面板,配置下列參數,并單擊確認。

    參數

    描述

    產品

    云監控管理的產品名稱,選擇PAI-資源配額(Quota)

    資源范圍

    報警規則的作用范圍,目前支持全部資源、應用分組和實例:

    • 全部資源:任何資源滿足報警規則,都會發送報警通知。

    • 實例:根據您選定的產品,您需要選擇關聯資源(即資源配額ID),僅選中的單個或多個資源實例滿足報警規則時,才發送報警通知。

    規則描述

    報警規則主體,當監控數據滿足指定條件時,觸發報警規則。規則描述的設置方法,請參見創建報警規則。

    通道沉默周期

    報警發生后如果未恢復正常,間隔多久重復發送一次報警通知。

    生效時間

    報警規則的生效時間。報警規則只在生效時間內才會檢查監控數據是否需要報警。

    報警聯系人組

    發送報警的聯系人組,選擇已綁定報警聯系人的報警組。

    標簽

    自定義設置報警規則的標簽。包括標簽名稱和標簽值。

  5. PAI-資源配額(Quota)頁面,單擊查看報警規則,可查看已創建的報警規則詳情、報警歷史等,并支持修改規則。

您也可以通過調用API的方式,配置監控報警通知,功能包括查看報警歷史、管理報警模板、配置報警規則和報警聯系人等。具體調用方法和詳情介紹,請參見云監控API目錄:報警服務。

訂閱監控指標

云監控提供完善的API服務,您可以通過調用API的方式,訂閱資源配額的監控指標及數據,搭建自己的監控系統和數據大盤。具體操作步驟,請參見云產品監控API目錄。

云監控API

API概述

DescribeMetricLast

調用DescribeMetricLast接口查詢指定監控項的最新監控數據。

DescribeMetricList

調用DescribeMetricList接口查詢指定云產品的指定監控項的監控數據。

DescribeMetricData

調用DescribeMetricData接口查詢指定云產品的某個監控項的監控數據。

DescribeMetricMetaList

調用DescribeMetricMetaList接口查詢云監控開放的監控項詳情。

DescribeProjectMeta

調用DescribeProjectMeta接口查詢云監控支持的時序類監控項產品列表。

DescribeMetricTop

調用DescribeMetricTop接口先查詢指定云產品的指定監控項的最新監控數據,再查詢該監控項排序后的監控數據。

DescribeMetricList接口為例,為您說明如何調用該API來查詢PAI-分布式訓練(DLC)產品下指定指標的監控數據。

  1. 前往PAI-資源配額(Quota)指標列表頁面。

  2. 在指標列表頁面,單擊目標指標操作列下的獲取指標數據。image

  3. OpenAPI門戶頁面,配置以下關鍵參數,其他參數取默認配置。更多參數配置說明,請參見DescribeMetricList

    參數

    描述

    Namespace

    配置為acs_pai_quota。

    MetricName

    配置對應的監控指標。例如QUOTA_CPU_REQUEST。

    StartTime

    開始時間。例如2024-05-15 00:00:00。

    EndTime

    結束時間。例如2024-05-28 00:00:00。

    說明

    StartTimeEndTime之間的間隔小于等于31天。

  4. 參數配置完成后,單擊發起調用,即可查看相應時間的監控數據。image

使用ARMS

應用實時監控服務ARMS(Application Real-Time Monitoring Service)是一款阿里云云原生可觀測產品平臺?;?span id="z68uejxpaoma" class="help-letter-space">ARMS提供的能力,你可以自定義一套PAI-資源配額(Quota)服務的Grafana大盤,以及使用Prometheus配置靈活的報警規則,幫助您全面詳細的監控PAI-資源配額(Quota)指標數據。關于ARMS更詳細的內容介紹,請參見應用實時監控服務ARMS。

計費說明

使用ARMS服務會產生一定的費用,詳細的計費說明,請參見ARMS計費說明。

接入監控數據

具體操作步驟如下:

  1. 登錄ARMS控制臺

  2. 在左側導航欄,單擊接入中心。

  3. 接入中心頁面,單擊左側人工智能頁簽,然后單擊阿里云 PAI-資源配額 (Quota) 服務。image

  4. (可選)在彈出的面板中,預覽監控數據接入后的展示效果,并查看采集指標和告警規則模板。

    效果預覽

    單擊效果預覽頁簽,查看指標監控大盤。image

    采集指標

    單擊采集指標頁簽,查看采集指標。image

    告警規則模板

    單擊告警規則模板,查看告警規則模板。image

  5. 在彈出的面板的開始接入頁簽,配置以下參數,然后單擊確定

    參數

    描述

    選擇數據存儲地域

    選擇數據存儲的地域。

    接入名稱

    按照控制臺提示信息配置服務的接入名稱。

    大約需要等待1~2分鐘,即可完成PAI-資源配額(Quota)監控數據的接入。

  6. 安裝完成后,您可以單擊接入管理,查看已接入環境的詳細信息。

查看Grafana大盤

  1. 登錄ARMS控制臺,在左側導航欄選擇接入管理,并在已接入環境>云服務區域環境頁簽,單擊環境名稱。

  2. 組件管理頁簽的組件類型區域單擊大盤,即可查看內置的Grafana大盤。image

  3. 單擊大盤名稱,查看監控大盤。d3bae3f2d8c2bc286812e5969e1b9118

配置Prometheus監控報警

您可以通過Prometheus配置監控報警,具體操作步驟如下:

  1. 登錄ARMS控制臺,在左側導航欄選擇接入管理,并在已接入環境>云服務區域環境頁簽,單擊環境名稱。

  2. 組件管理組件類型區域單擊告警規則,即可查看內置的告警規則。image

  3. 內置的告警規則會產生告警事件,但是不會進行告警通知,您可以通過以下兩種配置方法將告警通知發送到郵件或其他平臺:

    • 通過設置通知策略,制定針對告警事件的匹配規則。當匹配規則被觸發時,系統會以您指定的通知方式向通知對象發送告警信息。具體操作,請參見通知策略。

    • 通過編輯告警規則配置通知方式。image

      在編輯Prometheus告警規則頁面,您也可以自定義告警條件、持續時間、告警內容以及告警通知等。有關告警詳細配置的信息,請參見創建Prometheus告警規則。image