定時批量進(jìn)行ECS健康診斷
ECS實(shí)例健康診斷能全面檢查實(shí)例的系統(tǒng)狀態(tài)、網(wǎng)絡(luò)狀況及磁盤狀況,以便及時了解健康情況并處理常見問題。此外,針對需定期為一批實(shí)例進(jìn)行健康檢查的需求,提供了預(yù)設(shè)的OOS公共模板(ACS-ECS-ScheduleToExecuteECSDiagnosticReports)。利用OOS的強(qiáng)大自動化運(yùn)維能力,該模板可簡化定時與批量診斷實(shí)例的過程,并方便獲取異常報告。
操作步驟
創(chuàng)建執(zhí)行
登錄系統(tǒng)運(yùn)維管理控制臺,左側(cè)導(dǎo)航欄選擇 。
搜索
ACS-ECS-ScheduleToExecuteECSDiagnosticReports
,單擊創(chuàng)建執(zhí)行。配置基本信息頁面,填寫參數(shù)。
執(zhí)行描述(可選):用戶自定義的描述文本信息。
模板類型:公共任務(wù)模板。
模板選擇:
ACS-ECS-ScheduleToExecuteECSDiagnosticReports
。執(zhí)行模式:自動執(zhí)行。
資源組(可選):自定義OOS任務(wù)所屬的資源組。
標(biāo)簽(可選):自定義OOS任務(wù)的標(biāo)簽。
單擊下一步:設(shè)置參數(shù),進(jìn)入設(shè)置參數(shù)頁面。
定時類型:
立即執(zhí)行:創(chuàng)建任務(wù)后立即執(zhí)行,不會周期性重復(fù)執(zhí)行。
僅在指定時間執(zhí)行一次:僅在指定時間執(zhí)行一次。
周期性重復(fù)執(zhí)行:按照cron格式指定的時間周期性執(zhí)行。
重復(fù)頻率的時區(qū):默認(rèn)是東八區(qū)北京時間。
規(guī)則結(jié)束時間:任務(wù)結(jié)束的時間,默認(rèn)2099-12-01 08:00:00。
地域ID:指定運(yùn)行的阿里云地域,可以通過DescribeRegions - 查詢地域列表查詢。
targets: 可以按照多種方式選擇,并且在每次運(yùn)行時,具體執(zhí)行的實(shí)例列表會根據(jù)指定的條件重新刷新。
手動選擇實(shí)例:直接指定運(yùn)行的一個或者多個實(shí)例。
指定實(shí)例標(biāo)簽:通過設(shè)置匹配的標(biāo)簽,動態(tài)指定目標(biāo)實(shí)例。
指定實(shí)例資源組:通過設(shè)置資源組的標(biāo)簽,動態(tài)指定一組實(shí)例。
上傳csv文件:人工上傳實(shí)例列表。
選擇全部:該地域下所有實(shí)例。
指定配置清單條件:可以指定匹配多個條件的實(shí)例,需要了解OOS語法。
rateControl: 批量執(zhí)行時的并發(fā)控制
速率控制類型:并發(fā)控制
并發(fā)速率:一次執(zhí)行多少個實(shí)例
最大錯誤次數(shù):執(zhí)行幾次或者百分比的失敗次數(shù)則停止
設(shè)置執(zhí)行的RAM角色:OOS以什么角色執(zhí)行對應(yīng)的操作和API。可以參考為OOS服務(wù)設(shè)置RAM權(quán)限進(jìn)行設(shè)置,其中執(zhí)行批量實(shí)例健康診斷,需要以下三個API的操作權(quán)限:
"ecs:CreateDiagnosticReport" "ecs:DescribeDiagnosticReportAttributes" "ecs:DescribeInstances"
是否通知異常結(jié)果(可選):默認(rèn)不通知。
說明該通知只支持類釘釘?shù)膮f(xié)議格式。
通知地址(可選):類釘釘應(yīng)用的Webhook地址
通知@(可選):通知的內(nèi)容中添加@人員。
單擊下一步:確定,單擊創(chuàng)建。
查看歷史執(zhí)行結(jié)果
登錄系統(tǒng)運(yùn)維管理控制臺,左側(cè)導(dǎo)航欄選擇 。
選擇需要查看的記錄,單擊詳情,執(zhí)行結(jié)果是輸出有異常的實(shí)例信息和異常信息,更進(jìn)一步的詳細(xì)說明可以通過
IssueId
在診斷指標(biāo)與診斷結(jié)果條目說明通過查詢診斷結(jié)果條目ID
獲取。例如:- ResourceId: i-uf659o9rxxey22fpw1do HasPublicIp: true MetricSetId: dms-instancedefault MetricResult: Status: Finished MetricId: Instance.SGIngress Issues: Issue: - OccurrenceTime: 2024-04-11T09:37Z Additional: '{"Policy":"drop","Port":"22","Service":"SSH","Effect":"INSTANCE-SG-SSH-DISABLED","Protocol":"TCP","Direction":"ingress"}' Severity: Info IssueId: Instance.Network.SSHPortRuleDeny - OccurrenceTime: 2024-04-11T09:37Z Additional: '{"Policy":"drop","Port":"-1","Service":"PING","Effect":"INSTANCE-SG-PING-DISABLED","Protocol":"ICMP","Direction":"ingress"}' Severity: Info IssueId: Instance.SgRule.PingPortDeny Severity: Info MetricCategory: ECSService.SecurityGroup
根據(jù)
IssueId:Instance.Network.SSHPortRuleDeny
獲取的詳細(xì)說明