應(yīng)用管理監(jiān)控報(bào)警最佳實(shí)踐
在應(yīng)用管理中創(chuàng)建應(yīng)用后,建議實(shí)時(shí)監(jiān)控其健康狀況。這有助于快速響應(yīng)故障,確保業(yè)務(wù)持續(xù)穩(wěn)定運(yùn)行。應(yīng)用管理已集成云監(jiān)控功能,讓應(yīng)用監(jiān)控變得更簡(jiǎn)便高效。
功能優(yōu)勢(shì)
上云后,若使用單一阿里云賬號(hào)集中管理所有云資源,鑒于企業(yè)內(nèi)部存在多個(gè)業(yè)務(wù)線,每個(gè)業(yè)務(wù)線通常涉及一個(gè)或多個(gè)應(yīng)用服務(wù)。這些業(yè)務(wù)線被分配給不同的團(tuán)隊(duì)管理。因此,按應(yīng)用對(duì)資源進(jìn)行分組管理能有效減輕管理負(fù)擔(dān)并提升運(yùn)營效率。
例如,傳統(tǒng)模式下,運(yùn)維人員在排查問題時(shí)需要首先確定受影響的業(yè)務(wù),然后找到該業(yè)務(wù)對(duì)應(yīng)的應(yīng)用,接著定位到其所在地域的線上環(huán)境應(yīng)用分組,最后查看監(jiān)控指標(biāo)以檢查是否存在異常。
但在按應(yīng)用分組維度創(chuàng)建了報(bào)警規(guī)則后,報(bào)警信息中將包含應(yīng)用名稱(以識(shí)別出關(guān)聯(lián)的業(yè)務(wù))及應(yīng)用分組名稱,便于快速判斷受影響的業(yè)務(wù)及其環(huán)境類型。
云監(jiān)控為云上用戶提供開箱即用的企業(yè)級(jí)開放型一站式監(jiān)控解決方案。云監(jiān)控涵蓋IT設(shè)施基礎(chǔ)監(jiān)控和外網(wǎng)網(wǎng)絡(luò)質(zhì)量撥測(cè)監(jiān)控,是基于事件、自定義指標(biāo)和日志的業(yè)務(wù)監(jiān)控,為您全方位提供更高效、全面、省錢的監(jiān)控服務(wù)。使用云監(jiān)控,不但可以幫助您提升系統(tǒng)服務(wù)可用時(shí)長(zhǎng),還可以降低企業(yè)IT運(yùn)維監(jiān)控成本。
應(yīng)用管理會(huì)自動(dòng)為每個(gè)應(yīng)用分組在云監(jiān)控中創(chuàng)建一個(gè)對(duì)應(yīng)的云監(jiān)控應(yīng)用分組。
查看應(yīng)用分組的監(jiān)控信息?
在應(yīng)用分組的概覽頁面,查看到應(yīng)用分組對(duì)應(yīng)的標(biāo)簽。應(yīng)用管理會(huì)根據(jù)這些標(biāo)簽在云監(jiān)控中創(chuàng)建動(dòng)態(tài)分組。云監(jiān)控應(yīng)用分組與應(yīng)用管理中的應(yīng)用分組是一一對(duì)應(yīng)的。
監(jiān)控視圖:常見資源類型的核心指標(biāo)的監(jiān)控圖表,可分組查看或按實(shí)例查看。
故障列表:故障列表顯示當(dāng)前應(yīng)用分組正在報(bào)警的全部資源,如果正在報(bào)警的規(guī)則被禁用,則故障列表中不再顯示被禁用規(guī)則的故障信息。
可用性監(jiān)控:設(shè)置應(yīng)用的可用性監(jiān)控配置。
組進(jìn)程監(jiān)控:配置進(jìn)程級(jí)別的監(jiān)控。
報(bào)警歷史:記錄報(bào)警事件的歷史數(shù)據(jù)。
報(bào)警規(guī)則:管理報(bào)警規(guī)則的列表。
設(shè)置應(yīng)用的報(bào)警
使用報(bào)警聯(lián)系人組
云監(jiān)控的報(bào)警通知對(duì)象是報(bào)警聯(lián)系人組。建議按應(yīng)用維度創(chuàng)建聯(lián)系人組,并將與應(yīng)用相關(guān)的開發(fā)和運(yùn)維負(fù)責(zé)人加入到這些聯(lián)系人組中。
使用報(bào)警模板
推薦采用報(bào)警模板來維護(hù)應(yīng)用的報(bào)警配置。基于應(yīng)用架構(gòu),在模板內(nèi)設(shè)定相應(yīng)的報(bào)警規(guī)則。例如,對(duì)于包含ECS實(shí)例、RDS數(shù)據(jù)庫實(shí)例以及SLB負(fù)載均衡器的Web應(yīng)用,可以在報(bào)警模板中添加對(duì)這些資源監(jiān)控指標(biāo)的報(bào)警規(guī)則。利用報(bào)警模板,可以快速為不同環(huán)境(如預(yù)發(fā)布環(huán)境與生產(chǎn)環(huán)境)或多個(gè)地理區(qū)域生成統(tǒng)一標(biāo)準(zhǔn)的報(bào)警配置。
統(tǒng)一應(yīng)用的監(jiān)控報(bào)警配置
如果您應(yīng)用中的所有分組需要保持相同的監(jiān)控報(bào)警配置,您可以配置應(yīng)用級(jí)別的報(bào)警設(shè)置。這可以在創(chuàng)建應(yīng)用時(shí)進(jìn)行設(shè)置,或者在應(yīng)用創(chuàng)建后通過高級(jí)設(shè)置進(jìn)行修改。應(yīng)用級(jí)別的監(jiān)控報(bào)警配置將在所有現(xiàn)有及新建的應(yīng)用分組中自動(dòng)生效,從而幫助您節(jié)省管理成本。
應(yīng)用的報(bào)警聯(lián)系人組。
應(yīng)用的報(bào)警模板。
應(yīng)用健康檢查URL:使用此URL來配置可用性監(jiān)控規(guī)則。如果報(bào)警模板中已經(jīng)包含可用性監(jiān)控,此項(xiàng)可以不填。比如應(yīng)用可以暴露一個(gè)checkhealth地址(如
http://localhost:8080/checkhealth
),云監(jiān)控通過定時(shí)輪詢這個(gè)地址來判斷應(yīng)用是否可用。