系統通過采集各種指標、日志和鏈路等數據,并進行海量數據的清洗、計算。以此來支撐產品層的應用監控、業務監控、平臺監控、基礎設施監控、告警管理和分布式鏈路等能力。作為一個企業級產品,系統提供資源租戶隔離、訪問鑒權控制和監控配置模板等企業級特性。并且提供數據高可用、服務高可靠、雙機房容災部署等平臺特性。
基于系統豐富數據和強大功能,可以支撐容災巡檢、故障重放、彈性擴縮、微服務治理和全鏈路壓測等場景。
應用監控
系統能同時監控容器應用和經典應用,并通過 LDC、IDC 和單機實例等多視角、多維度逐層下鉆分析,實時展現服務實例、依賴的中間件和基礎資源運行狀態、使用趨勢和告警信息,發掘應用故障所在的層級和對象,保證應用的流暢運行。
業務監控
系統提供了靈活的、基于業務場景的自定義業務監控,通過業務監控可將不同監控圖表展示到同一個屏幕上,通過不同的大盤模板、統計模板等形式來展示可觀測數據,例如,分鐘級多 Key、TopN 等,讓用戶可以全面、深入地掌握業務數據。
中間件監控
系統默認集成了對消息、Mesh、數據庫等中間件的監控,并支持在應用監控中查看應用所調用各中間件的情況。
基礎資源監控
支持對物理機、虛擬機、Kubernetes 集群和原生容器等資源的監控。
分布式鏈路
分布式鏈路幫助運維人員、開發人員和架構師看清楚復雜的大規模微服務架構下的應用及服務之間的復雜調用關系、性能指標、出錯信息與關聯日志,從而實現故障根因分析、服務治理、應用開發調試、性能管理、性能調優、架構管控、故障定責等運維開發工作。
告警管理
針對各資源對象,系統允許用戶靈活地配置自定義告警規則,并支持多種訂閱方式,如郵件、短信、釘釘等。當監控數據滿足閾值條件時,第一時間通知對應的運維人員,幫助其發現異常及原因。
企業級特性
在企業級特性層面,RMS 包含的能力如下:
提供多層級業務和資源隔離機制,比如租戶、workspace 等,保證監控數據的安全性。
支持監控具有多 VPC 服務實例的應用,并以應用中心視角展示監控數據。
支持監控配置模板導入與導出,使測試環境的應用監控配置可在生產環境一鍵激活,避免了重復配置,也保證了發布流程的標準化和可控性。