云監(jiān)控
如果您希望實時掌握Kafka資源(實例、Topic、Group)狀態(tài),監(jiān)控資源數(shù)據(jù)是否超過閾值,您可以使用云監(jiān)控實時監(jiān)測您賬戶下創(chuàng)建的資源。您還可以為云監(jiān)控項設(shè)置報警規(guī)則,當(dāng)監(jiān)控項數(shù)據(jù)超過設(shè)定的報警閾值時,云監(jiān)控可以通過電話、短信、郵件、釘釘機器人等方式通知您,幫助您及時應(yīng)對異常情況。
監(jiān)控項
監(jiān)控項的數(shù)據(jù)聚合周期為1分鐘,即1分鐘計算一次,計算出來每秒多少字節(jié)。您可以將該數(shù)據(jù)理解為一分鐘內(nèi)的平均值。
監(jiān)控項的數(shù)據(jù)延時1分鐘。
云消息隊列 Kafka 版監(jiān)控指標(biāo)支持以下監(jiān)控項:
監(jiān)控項 | 單位 |
實例業(yè)務(wù)實際流入流量 | B/s |
實例業(yè)務(wù)實際流出流量 | B/s |
實例消息生產(chǎn)條數(shù) | count/s |
實例消息發(fā)送次數(shù) | count/s |
實例消息消費次數(shù) | count/s |
實例磁盤使用率 說明 實例磁盤使用率(%)顯示的是實例各節(jié)點中磁盤使用率的最大值。 | % |
實例公網(wǎng)寫入帶寬 | bit/s |
實例公網(wǎng)讀取帶寬 | bit/s |
實例公網(wǎng)讀取帶寬(節(jié)點維度) | bit/s |
實例公網(wǎng)寫入帶寬(節(jié)點維度) | bit/s |
實例公網(wǎng)讀取帶寬使用率(節(jié)點維度) | % |
實例公網(wǎng)寫入帶寬使用率(節(jié)點維度) | % |
生產(chǎn)流量在實例規(guī)格占比 | % |
消費流量在實例規(guī)格占比 | % |
分區(qū)在實例規(guī)格占比 | % |
計費說明
使用云監(jiān)控功能云消息隊列 Kafka 版不收取費用。
前提條件
創(chuàng)建服務(wù)關(guān)聯(lián)角色
角色名稱:AliyunServiceRoleForAlikafka
角色策略名稱:AliyunServiceRolePolicyForAlikafka
權(quán)限說明:允許云消息隊列 Kafka 版使用該角色訪問您的服務(wù)(云監(jiān)控和ARMS服務(wù))以完成云監(jiān)控相關(guān)功能。
具體文檔說明:服務(wù)關(guān)聯(lián)角色。
查看云監(jiān)控數(shù)據(jù)
在概覽頁面的資源分布區(qū)域,選擇地域。
在實例列表頁面,單擊目標(biāo)實例名稱。
在左側(cè)導(dǎo)航欄,選擇 。
在云監(jiān)控頁面,單擊報警規(guī)則頁簽,單擊要查看監(jiān)控數(shù)據(jù)的資源頁簽,找到要查看監(jiān)控數(shù)據(jù)的資源,單擊其右側(cè)操作列的云監(jiān)控,設(shè)置時間范圍,查看監(jiān)控數(shù)據(jù)。
頁面會自動顯示當(dāng)前資源所有的監(jiān)控項圖表。
設(shè)置報警規(guī)則
在云監(jiān)控頁面,單擊報警規(guī)則,選擇實例、Topic或Group資源頁簽,設(shè)置報警規(guī)則。
頁面將跳轉(zhuǎn)至云監(jiān)控控制臺的創(chuàng)建報警規(guī)則面板。
在創(chuàng)建報警規(guī)則面板按提示設(shè)置規(guī)則和通知信息,然后單擊確定。具體參數(shù)設(shè)置,請參見創(chuàng)建報警規(guī)則。
查看報警信息
在云監(jiān)控頁面,單擊報警規(guī)則,然后單擊要查看報警信息的資源(實例、Topic或Group)頁簽。
找到具體的資源名稱,單擊操作列的報警規(guī)則。
在關(guān)聯(lián)的報警規(guī)則面板,選擇目標(biāo)報警規(guī)則,單擊其操作列的詳情,您可以查看報警規(guī)則、禁用或啟用報警規(guī)則、刪除報警規(guī)則、查看報警歷史。
相關(guān)文檔
實例的Prometheus監(jiān)控數(shù)據(jù),請參見Prometheus監(jiān)控。
關(guān)于監(jiān)控報警的更多常見問題,請參見監(jiān)控報警問題。