業務實時監控(Real-time Monitoring Service,簡稱 RMS)是一款具有可視化監測能力的金融級監控產品?;谌罩?、指標、鏈路等海量數據進行多維聚合,向用戶提供業務監控、應用監控、云原生監控、基礎資源監控、日志查詢分析、分布式鏈路等多角度的可視化監測功能,有豐富的可視化大盤,并提供了告警訂閱功能。該服務可以幫助運維、研發、SRE (Site Reliability Engineer)等快速地發現問題、定位問題、分析問題、解決問題,為線上系統可用率提供有效保障。
業務實時監控支持的功能特性如下:
全方位實時監控:提供業務、應用、基礎資源、云原生等各種視角的監控能力,可實現關鍵指標秒級、普通指標分鐘級的監控,具有高可靠、高時效、低延遲的特點。
靈活的報警規則:可根據業務特征、時間段、重要程度等維度設置報警規則,實現不誤報、不漏報。
便捷的自定義配置:具有豐富的自定義產品配置功能,可便捷、高效地進行產品、報警配置。
開放的技術棧配置: 可實現 Kubernetes、SOFA 技術棧應用部署即監控,通過簡單技術棧配置,即可接入并監控非標業務應用。可視化大盤:豐富的可視化大盤,幫助您定制個性化的監控大盤。
分布式鏈路:提供應用拓撲和鏈路查詢功能,觀測應用及服務之間的復雜調用關系、性能指標、出錯信息與關聯日志,從而實現故障根因分析、服務治理、應用開發調試、性能管理、性能調優、架構管控、故障定責等運維開發工作。
日志查詢和日志關聯:提供日志查詢和日志關聯功能。用戶不僅可以對日志執行查詢操作,還可以進行歷史查詢和上下文查詢,以及查看 Error 指標關聯的錯誤日志和鏈路關聯業務日志,更加方便高效地進行問題分析定位。
低資源占用:在可靠傳輸大量監控數據時,保證對宿主機的 CPU、內存等資源的極低占用率。
高可用:提供萬臺設備的分鐘級監控部署能力,故障自動恢復,集群可伸縮。
穩定高效的時序和數據存儲:在線持續聚合數據,保證數據容量可控,提供智能分級存儲、存放策略。