MSFE是多活流量統一入口,采用多臺ECS集群化部署。您可以使用云監控對每臺ECS開啟主機監控和報警,以便出現主機性能瓶頸或者系統故障問題時能夠快速發現和處理,進而規避風險。本文介紹如何使用云監控對MSFE進行監控和報警。
背景信息
云監控針對主機監控和報警,以及應用分組、可用性監控、Dashboard等基礎功能均不收費。想要了解更多云監控信息,請參見什么是云監控。
開啟主機監控
配置報警規則
ECS類型的指標是從物理機層面采集的,數據準確性低于Agent從VM內部采集的數據,因此推薦您查看Agent采集的指標配置報警規則。推薦配置報警規則的監控項名稱如下,具體詳情請參見操作系統監控項。
監控內容 | 推薦配置報警規則的監控項名稱 | 說明 |
---|---|---|
CPU使用率 | (Agent)cpu.total | 一臺ECS只運行一個Tengine進程服務,Tengine對資源的消耗主要體現在CPU使用率上,通常情況下,若CPU使用率達到60%,就需要考慮擴容。 |
Load | (Agent)load.5m.percore | CPU平均每核過去5分鐘的系統平均負載。 |
內存使用率 | (Agent)memory.used.utilization | - |
磁盤使用率 | (Agent)disk.usage.utilization_device | Tengine進程會打印tengine-access_log和tengine-error_log日志。 日志采用滾動覆蓋的方式,滾動覆蓋保留的文件數為7,全部日志文件最大會占用21 G磁盤空間。建議添加磁盤使用率報警規則,避免出現磁盤滿的問題。 |