MSFE是多活流量統一入口,采用多臺ECS集群化部署。您可以使用云監控對每臺ECS開啟主機監控和報警,以便出現主機性能瓶頸或者系統故障問題時能夠快速發現和處理,進而規避風險。本文介紹如何使用云監控對MSFE進行監控和報警。

背景信息

云監控針對主機監控和報警,以及應用分組、可用性監控、Dashboard等基礎功能均不收費。想要了解更多云監控信息,請參見什么是云監控

開啟主機監控

  1. 登錄云監控控制臺
  2. 在左側導航欄,單擊主機監控
  3. 主機監控頁面,通過在搜索框中輸入主機名稱或者實例ID等搜索需要開啟監控的ECS,然后選中目標ECS實例前面的復選框,并單擊左上角的安裝/更新Agent,在彈出的面板根據界面提示完成配置,來安裝云監控插件,實現對每臺ECS開啟主機監控和報警。
  4. 單擊操作列的監控圖表,可查看ECS實例的CPU、內存、負載、網絡、連接、磁盤、IO、進程等監控指標詳情。具體監控項詳情請參見監控項說明

配置報警規則

ECS類型的指標是從物理機層面采集的,數據準確性低于Agent從VM內部采集的數據,因此推薦您查看Agent采集的指標配置報警規則。推薦配置報警規則的監控項名稱如下,具體詳情請參見操作系統監控項

監控內容推薦配置報警規則的監控項名稱說明
CPU使用率(Agent)cpu.total一臺ECS只運行一個Tengine進程服務,Tengine對資源的消耗主要體現在CPU使用率上,通常情況下,若CPU使用率達到60%,就需要考慮擴容。
Load(Agent)load.5m.percoreCPU平均每核過去5分鐘的系統平均負載。
內存使用率(Agent)memory.used.utilization-
磁盤使用率(Agent)disk.usage.utilization_device

Tengine進程會打印tengine-access_log和tengine-error_log日志。

日志采用滾動覆蓋的方式,滾動覆蓋保留的文件數為7,全部日志文件最大會占用21 G磁盤空間。建議添加磁盤使用率報警規則,避免出現磁盤滿的問題。