本文通過具體案例為您介紹如何通過云監控實現內網監控。
背景信息
隨著越來越多的用戶從經典網絡遷移到更安全、更可靠的VPC網絡環境,如何監控VPC內部服務是否正常響應就成為需要關注的問題。本文將通過具體案例說明如何監控VPC內ECS上的服務是否可用、VPC內ECS到RDS、Redis的連通性如何、VPC內SLB是否正常響應。
準備工作
內網監控的原理如下圖所示。
首先需要您在主機上安裝云監控插件,然后通過控制臺創建監控任務,選擇已安裝插件的主機作為探測源,并配置需要探測的目標URL或端口。創建監控任務成功后,作為探測源的主機會通過云監控插件每分鐘發送一個HTTP請求或Telnet請求到目標URL或端口,并將響應時間和狀態碼收集到云監控進行報警和圖表展示。
操作步驟
作為探測源的服務器需要安裝云監控插件。
需要創建應用分組,并將作為探測源的服務器加入到分組中。
登錄云監控控制臺。
在左側導航欄,選擇
。在應用分組頁簽,單擊目標應用分組名稱鏈接。
在目標應用分組的左側導航欄,單擊可用性監控。
單擊添加可用性監控。
在創建/修改可用性監控面板,設置任務相關參數。
參數
描述
任務名稱
可用性監控的任務名稱。
探測源
待探測的實例ID。
探測目標
待探測目標。取值:
URL或者IP:僅用于云服務器ECS。
云數據庫RDS版:僅用于云數據庫RDS版。
云數據庫Redis版:僅用于云數據庫Redis版。
探測類型
待探測類型。
當探測目標為URL或者IP時,支持如下探測類型:
HTTP(S):需要輸入待探測目標的URL地址。
TELNET:需要輸入待探測目標的IP地址。
PING:需要輸入待探測目標的IP地址。
當探測目標為云數據庫RDS版或云數據庫Redis版時,支持如下探測類型:
TELNET:需要選擇實例ID和探測連接地址。
PING:需要選擇實例ID和探測連接地址。
請求方法
探測類型的請求方法。請求方法包括HEAD、GET和POST。
說明當探測目標為URL或者IP,且探測類型為HTTP(S)時,需要設置該參數。
監控頻率
探測周期。
取值:15秒、30秒、1分鐘、2分鐘、5分鐘、15分鐘、30分鐘和60分鐘。例如:選擇1分鐘頻率,云監控將以1分鐘/次的頻率監控目標實例。
說明當探測目標為URL或者IP,且探測類型為HTTP(S)時,需要設置該參數。
Headers
站點探測時HTTP或HTTPS的Headers。
Header格式:
parameter1:value1
。多個Header之間用半角逗號(,)分隔。
說明當探測目標為URL或者IP,且探測類型為HTTP(S)時,需要設置該參數。
提交內容
站點探測時POST的請求內容。
提交內容格式:
parameter1=value1¶meter2=value2
,僅支持英文。說明當探測目標為URL或者IP、探測類型為HTTP(S)和請求方法為POST時,需要設置該參數。
匹配響應內容
站點探測的匹配響應方式和匹配響應信息。
當匹配響應信息非空時,站點探測讀取HTTP服務器回應Body的前64KB,從中查找匹配響應信息。匹配響應方式取值:
包含匹配內容則報警
不包含匹配內容則報警
說明當探測目標為URL或者IP,且探測類型為HTTP(S)時,需要設置該參數。
說明需要監控VPC內ECS本地進程是否響應正常時,可在探測源中選中所有需要監控的ECS,在探測目標中填寫
localhost:port/path
格式的地址,進行本地探測。當您需要監控VPC內SLB是否正常響應時,可選擇與SLB在同一VPC網絡內的ECS實例作為探測源,在探測目標中填寫SLB的地址進行探測。
當您需要監控VPC內ECS實例中使用的RDS或Redis是否正常響應時,可將與ECS在同一VPC網絡內的RDS或Redis添加到應用分組,并在探測源中選擇相應的ECS實例,探測目標中選擇RDS或Redis實例。
單擊下一步。
在報警設置頁面,設置報警相關參數。
參數
描述
狀態碼
當探測的狀態碼滿足報警設置時,觸發報警。
狀態碼和響應時間其中之一達到閾值后都會觸發報警,報警會發送給應用分組的報警聯系人組。
響應時間
當探測的響應時間滿足報警設置時,觸發報警。
狀態碼和響應時間其中之一達到閾值后都會觸發報警,報警會發送給應用分組的報警聯系人組。
報警級別
報警級別和報警通知方式。取值:
Critical(電話+短信+郵件+釘釘機器人)
Warning(短信+郵件+釘釘機器人)
Info(郵件+釘釘機器人)
報警回調
公網可訪問的URL,用于接收云監控通過POST請求推送的報警信息。目前僅支持HTTP協議。關于如何設置報警回調,請參見使用閾值報警回調。
通道沉默周期
報警發生后未恢復正常,間隔多久重復發送一次報警通知。取值:5分鐘、15分鐘、30分鐘、60分鐘、3小時、6小時、12小時和24小時。
某監控指標達到報警閾值時發送報警,如果監控指標在通道沉默周期內持續超過報警閾值,在通道沉默周期內不會重復發送報警通知;如果監控指標在通道沉默周期后仍未恢復正常,則云監控再次發送報警通知。
生效時間
報警規則的生效時間。報警規則只在生效時間內發送報警通知,非生效時間內產生的報警只記錄報警歷史。
日志服務
如果您打開日志服務開關,當報警發生時,會將報警信息發送至日志服務的日志庫。您需要設置日志服務的地域、ProjectName和Logstore。
關于如何創建Project和Logstore,請參見快速入門。
單擊確定。
單擊目標任務對應操作列的。
您可以在監控圖表中查看監控詳情。