日志服務幫助暢捷通運維開發團隊解決了誤報頻繁、 無法快速發現問題站點、無法快速定位異常的問題,實現了運維效率、運維成本、溝通成本等方面的改善。日志服務支撐了暢捷通所有云產品的健康穩定運行,在IT運維開發領域樹立了一個標桿。
公司簡介
暢捷通信息技術股份有限公司是用友旗下成員企業。暢捷通致力于為小微企業提供社交化、個性化、服務化、小量化的生意管理支持。暢捷通針對小微企業財務及管理轉型問題,通過技術賦能,助力企業業務在線,改變傳統的經營業態,實現利潤持續增長。暢捷通充分利用SaaS業務與客戶的高頻互動的優勢深挖客戶的價值,從而多方面滿足小微企業對云產品的需求。暢捷通未來業務將從SaaS市場拓展到企業業務運營服務的BaaS市場,并致力于成為中國較大的一站式小微企業服務平臺。更多信息,請參見暢捷通。
業務場景
暢捷通IT運維開發部負責暢捷通所有云產品(包括好會計、好生意、易代賬等)的生產及測試系統的運維、上線、發布等工作。該部門構建了一套MIDAS智能運維平臺,提供了數據接入、數據處理、場景化分析等能力。
業務痛點
暢捷通在智能運維平臺開發初期,底層使用了自建的ELK進行運維數據分析。隨著暢捷通業務的增長接入的應用系統增多,暢捷通很快發現平臺出現各種問題,各產品的穩定運行受到極大挑戰。
并發量大
幾萬個點并發發送數據,每天產生的各種日志與消息達到TB級。自建的ELK系統性能較差,優化性能需要耗費大量開發資源。
類型雜
訪問類、系統類、應用類、通知類、消息類等等,種類繁多、格式千奇百怪,為數據清洗增加了巨大的難度。
來源多
網絡、服務器、移動App、Web、Docker等各種來源的日志,接口繁多,并且要求實時性高,無法集中統一管理。
應用深入
各產品部門對收集來的數據都有著自己個性化的需求,監控報警、問題診斷、分析挖掘、報表等,消費模式也多種多樣。
解決方案
針對這些問題與調整,暢捷通選擇日志服務作為基礎來深度打造其智能運維平臺。
高效消息采集和傳輸
暢捷通利用日志服務的強大數據接入能力,將其混合云架構中網絡、服務器、移動端、容器的各類訪問類、系統類、應用類、消息類等各類日志統一匯入日志服務,實現每天TB級數據的快速處理。
靈活的數據處理和存儲
針對內部已經具備完善CMDB和關聯規則的情況,暢捷通將原始日志進行語義切分和序列化后,對應到場景分析中。暢捷通在策略組中找到相應的執行策略,再發到外部服務中,用外部服務去調用Ansible或者消息轉發等操作,實現數據投遞的集中管理,為后續眾多場景化分析提供支撐。
智能異常檢測和定位
暢捷通通過日志服務的時序數據分析與函數計算能力構建了智能運維平臺,通過直接使用同環比函數,可以快速的得出監控指標的當前值,并且具有實時性。有了同環比后,報警的發送會變得準確,與原來的閾值相比準確性大大提高。暢捷通通過日志服務的異常預測函數,從海量指標中快速定位異常,將有問題的地方顯示出來,快速發現系統故障。暢捷通通過日志服務將各塊匯集過來的數據進行標記后,與應用的配置信息進行關聯和整合,通過時序發現故障的根因,從而可以實現故障預測。
暢捷通基于日志服務打造的智能運維平臺的架構如下圖所示。