快速入門
當(dāng)您使用阿里云Elasticsearch時(shí),系統(tǒng)會(huì)為您自動(dòng)開通高級(jí)監(jiān)控報(bào)警服務(wù),并將您賬號(hào)下的存量和新購(gòu)Elasticsearch實(shí)例接入監(jiān)控報(bào)警服務(wù)。本文為您介紹如何查看與配置可視化監(jiān)控,以及如何配置日志報(bào)警規(guī)則和指標(biāo)報(bào)警規(guī)則。
背景信息
高級(jí)監(jiān)控報(bào)警服務(wù)能夠?yàn)槟械赜蛳碌腅lasticsearch集群提供全維度指標(biāo)和日志監(jiān)控分析服務(wù)。您可以在平臺(tái)為您提供的Grafana中查看集群、節(jié)點(diǎn)、索引和機(jī)器資源等維度的可視化監(jiān)控?cái)?shù)據(jù),進(jìn)行集群的異常日志分析,并可以根據(jù)業(yè)務(wù)需求自定義監(jiān)控大屏和報(bào)警規(guī)則。關(guān)于高級(jí)監(jiān)控報(bào)警的更多信息,請(qǐng)參見高級(jí)監(jiān)控報(bào)警概述。
前提條件
已在支持高級(jí)監(jiān)控報(bào)警服務(wù)的地域下創(chuàng)建阿里云Elasticsearch實(shí)例:
目前高級(jí)監(jiān)控報(bào)警服務(wù)支持的地域包括:杭州、北京、上海、深圳、青島、張家口、成都、廣州、烏蘭察布、北京金融云、美國(guó)東部、美國(guó)西部、日本、印度尼西亞、中國(guó)香港,具體以控制臺(tái)為準(zhǔn)。
創(chuàng)建實(shí)例的具體操作,請(qǐng)參見創(chuàng)建阿里云Elasticsearch實(shí)例。
熟悉Grafana監(jiān)控大屏的使用方法。詳細(xì)信息,請(qǐng)參見Grafana Dashboard。
使用限制
高級(jí)監(jiān)控報(bào)警功能提供了基礎(chǔ)指標(biāo)、引擎指標(biāo)和日志數(shù)據(jù)的監(jiān)控和報(bào)警。僅內(nèi)核版本大于1.2.0的6.7.0或7.10.0版本支持引擎指標(biāo)監(jiān)控。升級(jí)內(nèi)核版本,請(qǐng)參見升級(jí)版本。
使用RAM角色單點(diǎn)登錄阿里云控制臺(tái)時(shí),不支持訪問高級(jí)監(jiān)控報(bào)警服務(wù)。如果需要訪問,可使用RAM用戶單點(diǎn)登錄阿里云控制臺(tái)。
操作流程
操作視頻
步驟一:查看和配置可視化監(jiān)控
- 登錄阿里云Elasticsearch控制臺(tái)。
在左側(cè)導(dǎo)航欄,單擊高級(jí)監(jiān)控報(bào)警。
系統(tǒng)默認(rèn)將您賬號(hào)下的存量和新購(gòu)Elasticsearch實(shí)例全部接入監(jiān)控報(bào)警服務(wù)。
首次使用監(jiān)控大盤需要進(jìn)行應(yīng)用授權(quán)。
如果您是阿里云賬號(hào),同時(shí)選中以下三項(xiàng)授權(quán),單擊授權(quán),即可完成emon_grafana應(yīng)用授權(quán)。
選項(xiàng)
說(shuō)明
獲取登錄用戶的基本信息(默認(rèn)授權(quán)域,不可移除)
系統(tǒng)默認(rèn)已經(jīng)選中。從當(dāng)前阿里云賬號(hào)獲取登錄用戶的基本信息,例如令牌過(guò)期時(shí)間戳、令牌主體、令牌接收者以及頒發(fā)者等信息。
阿里云頒發(fā)的唯一用戶標(biāo)志符
需要手動(dòng)選中。獲取當(dāng)前阿里云賬號(hào)的UID,以避免多個(gè)RAM用戶重復(fù)授權(quán)。
用戶的名稱等個(gè)人信息
需要手動(dòng)選中。獲取當(dāng)前云賬號(hào)(可以是阿里云賬號(hào),也可以是RAM用戶)登錄用戶名的相關(guān)信息,例如用戶的顯示名稱、登錄名稱,授權(quán)之后用戶能看到當(dāng)前登錄的用戶賬號(hào)名稱。
如果您是RAM用戶,等待阿里云賬號(hào)完成首次登錄授權(quán)后,您可以正常使用高級(jí)監(jiān)控報(bào)警功能。或者進(jìn)行手動(dòng)授權(quán):
阿里云賬號(hào)給您的RAM用戶授權(quán),授權(quán)策略內(nèi)容如下。
<yourAccountId>
需要替換為您的RAM用戶身份ID。具體操作,請(qǐng)參見通過(guò)腳本編輯模式創(chuàng)建自定義權(quán)限策略。{ "Version": "1", "Statement": [ { "Effect": "Allow", "Action": ims:*, "Resource": acs:ims::<yourAccountId>:application/*, } ] }
使用RAM用戶進(jìn)行監(jiān)控大盤授權(quán),策略內(nèi)容如下。具體操作,請(qǐng)參見通過(guò)腳本編輯模式創(chuàng)建自定義權(quán)限策略。
{ "Version": "1", "Statement": [ { "Effect": "Allow", "Action": [ "cms:DescribeActiveMetricRuleList", "cms:ListAlarm", "cms:QueryMetricList", "cms:QueryMetricLast" ], "Resource": "*" } ] }
cms:DescribeActiveMetricRuleList
:授予調(diào)用云監(jiān)控emon_grafana的權(quán)限,如果不添加該權(quán)限,頁(yè)面會(huì)出現(xiàn)報(bào)錯(cuò)提示。"cms:ListAlarm", "cms:QueryMetricList", "cms:QueryMetricLast"
:授予查看默認(rèn)基礎(chǔ)監(jiān)控頁(yè)面的權(quán)限,如果不添加這幾個(gè)權(quán)限,將無(wú)法查看默認(rèn)基礎(chǔ)監(jiān)控頁(yè)面。
說(shuō)明如果您的授權(quán)出現(xiàn)問題,請(qǐng)通過(guò)重新授權(quán)進(jìn)行處理。
在高級(jí)監(jiān)控報(bào)警頁(yè)面,查看默認(rèn)監(jiān)控。
在左側(cè)導(dǎo)航欄,選擇 ,查看已接入實(shí)例的指標(biāo)監(jiān)控?cái)?shù)據(jù)。
指標(biāo)監(jiān)控的詳細(xì)信息,請(qǐng)參見基礎(chǔ)指標(biāo)和引擎指標(biāo)。
在左側(cè)導(dǎo)航欄,選擇 ,查看已接入實(shí)例的日志監(jiān)控?cái)?shù)據(jù)。
日志監(jiān)控的詳細(xì)信息,請(qǐng)參見日志監(jiān)控。
在高級(jí)監(jiān)控報(bào)警頁(yè)面的左側(cè)導(dǎo)航欄,選擇 ,配置并查看自定義監(jiān)控。
具體操作步驟,請(qǐng)參見配置自定義監(jiān)控大屏。
(可選)步驟二:配置日志報(bào)警規(guī)則
如果您需要通過(guò)監(jiān)控日志進(jìn)行報(bào)警通知,請(qǐng)執(zhí)行以下操作:
在高級(jí)監(jiān)控報(bào)警頁(yè)面的左側(cè)導(dǎo)航欄中,選擇 。
在默認(rèn)日志指標(biāo)頁(yè)簽右側(cè),單擊配置日志報(bào)警。
參考系統(tǒng)為您提供的報(bào)警模板,配置日志報(bào)警規(guī)則或自由定制日志報(bào)警規(guī)則。
詳細(xì)操作步驟,請(qǐng)參見日志報(bào)警。
(可選)步驟三:配置指標(biāo)報(bào)警規(guī)則
如果您需要通過(guò)監(jiān)控指標(biāo)進(jìn)行報(bào)警通知,請(qǐng)?jiān)?b data-tag="uicontrol" id="uicontrol-p0r-ssr-0uh" class="uicontrol">高級(jí)監(jiān)控報(bào)警頁(yè)面的左側(cè)導(dǎo)航欄中,執(zhí)行以下操作:
選擇
,在概覽頁(yè)頁(yè)面,查看所有報(bào)警組的通知記錄和報(bào)警事件。詳細(xì)信息,請(qǐng)參見查看報(bào)警通知記錄和事件。
選擇 ,創(chuàng)建報(bào)警組并添加報(bào)警規(guī)則。
具體操作,請(qǐng)參見創(chuàng)建報(bào)警組和配置報(bào)警規(guī)則。
查看單個(gè)報(bào)警組的通知記錄和報(bào)警事件。詳細(xì)信息,請(qǐng)參見查看通知記錄和查看報(bào)警事件。
選擇 ,添加指標(biāo)報(bào)警通知人或聯(lián)系人組。
具體操作,請(qǐng)參見新增聯(lián)系人和新增聯(lián)系人組。
常見問題
Q:同一時(shí)段內(nèi)監(jiān)控同一實(shí)例,為什么高級(jí)監(jiān)控和Kibana監(jiān)控的數(shù)據(jù)不一致?
A:阿里云Elasticsearch的高級(jí)監(jiān)控是內(nèi)部自研監(jiān)控,在使用時(shí)會(huì)和其他監(jiān)控服務(wù)的數(shù)據(jù)存在差異,具體如下:
采樣周期差異性:采集周期和Kibana或第三方監(jiān)控存在差異,采集到的數(shù)據(jù)不同,因此會(huì)存在差異。
查詢算法差異性:例如,高級(jí)監(jiān)控和Kibana監(jiān)控采集數(shù)據(jù)時(shí)都會(huì)受集群穩(wěn)定性的影響,高級(jí)監(jiān)控QPS指標(biāo)會(huì)因集群的抖動(dòng)會(huì)出現(xiàn)監(jiān)控突增、負(fù)值或無(wú)監(jiān)控等狀況,而Kibana監(jiān)控可能顯示為空。
說(shuō)明如果高級(jí)監(jiān)控提供的指標(biāo)比Kibana監(jiān)控多,在實(shí)際使用時(shí),建議將高級(jí)監(jiān)控和Kibana監(jiān)控結(jié)合起來(lái)分析集群監(jiān)控詳情。
采集接口差異性:Kibana監(jiān)控指標(biāo)依賴于Elasticsearch API,而高級(jí)監(jiān)控部分節(jié)點(diǎn)級(jí)別的指標(biāo)(例如CPU使用率、load_1m、磁盤使用率等),調(diào)用的是阿里云Elasticsearch底層系統(tǒng)接口,因此監(jiān)控中除了Elasticsearch進(jìn)程外還包含了系統(tǒng)級(jí)別資源的占用情況。