TRaaS 技術風險防控平臺,是以螞蟻內部 SRE 長期實踐方法論和內部工具沉淀為依托,形成的解決用戶上云和分布式改造過程中,可觀測、故障應急、容災、混沌工程、資金安全、壓測等運維問題的平臺產品。
高可用管理平臺
高可用管理平臺(High Availability Service,HAS)是以容災為主的高可用管控平臺產品,可實現容災方案的端到端整體能力,從客戶業務到中間件、PaaS 以及 IaaS 整體的容災切換及恢復、容災規劃、容災模擬演練等能力,并包含整體機房及容災狀態的監控能力、容災大盤展示、環境巡檢、風險應急等。
HAS 提供容災服務視圖、預案編排能力、切換和恢復能力,支持多機房部署架構下的機房級別一鍵容災切換和恢復。
產品架構
產品優勢
螞蟻技術風險管理體系方法論+平臺工具完整落地
通過高可用管理平臺工具,可以輸出螞蟻多年積累點的技術風險防控內容,并在此基礎上助力用戶建設符合用戶實際情況的技術風險防控體系,提升用戶整體技術風險防控水平。
技術風險防控效率有效提升
通過高可用管理平臺技術風險防控能力,自動化、標準化、例行化日常運維,降低操作復雜度,運維結果清晰可見,實現風險事件的閉環管理。
通過日常巡檢主動感知業務運行風險,在對業務造成影響前及時處理。
自動化故障診斷和標準化應急預案,快速定位并恢復故障,減少因故障引起的業務中斷時間。
故障演練主動檢驗應用的高可用能力。
支持螞蟻產品雙中心容災切換,滿足監管合規需求。
技術風險防控內容庫快速更新
阿里云、螞蟻技術風險團隊基于域內、域外技術風險防控經驗,共建日常巡檢、故障診斷、應急預案內容庫,用戶可享受最新的技術風險防控內容。
金融級容災
容災等級最高可達 5 級。
容災能力豐富,支持容災大屏監控告警、容災仿真演練、容災巡檢等能力。
經過支付寶和網商銀行規模驗證。
全鏈路容災
支持從客戶應用到中樞態的全鏈路容災能力,實現端到端整體容災,全鏈路監控和運維,無需多平臺對接。包含用戶應用、中間件、PaaS、IaaS 全鏈路多層容災。
多場景容災
支持金融行業的全部容災場景:
同城雙活
異地主備
兩地三中心
LDC 單元化
應用場景
日常風險防控 |
在日常的運維場景中,通過多功能模塊的聯動使用,自動化執行日常運維腳本,實現定期可控的日常巡檢運維;同時不斷更新優化日常巡檢、故障診斷、應急預案等內容的建設,不斷豐富和完善應用技術風險防控體系,簡化日常應用運維操作。 |
故障演練 |
為不斷提升產品高可用能力,通過高可用管理平臺的故障演練模塊,設計并規劃演練計劃和恢復方案,繼而在演練過程中不斷發現、解決容災預案存在的問題。以此,降低產品使用過程中故障發生概率,提高故障恢復效率,進而實現產品高可用性的有效提升。 |
機房級容災 |
|
全鏈路壓測
全鏈路壓測(Loadcenter)為企業提供涵蓋性能壓測、壓測報告輸出以及壓測風險防控的一站式壓測服務。結合螞蟻集團多年的線上全鏈路壓測經驗,為您提供高仿真、低成本、高風險識別的在線壓測體驗。
產品架構
產品優勢
復雜的場景建模能力
支持多種流量模型,可快速導入配置流量。
支持模板化腳本及自定義開發腳本,滿足不同復雜度的業務場景壓測需求。
強大的報告分析能力
壓測記錄存檔、集中管理。
結合實時監控服務,壓測結果中記錄標準應用監控數據及業務自定義監控數據,可快捷地找出存在瓶頸的應用及相關性能指標。
報告對比分析,追蹤應用性能基線演進。
穩定的壓力輸出能力
壓力機橫向擴容,秒級動態調整壓力,可滿足千萬級 TPS 壓測需求。
支持內網接口壓測
壓力機資源池支持公有和租戶私有兩種模式:
公有模式下,您無需自備壓力機,可隨時執行壓測。
私有模式下,使用您的壓力機,可節省帶寬成本并降低網絡延時,同時支持內部接口級測試,無需暴露在公網,更安全。
支持多種協議
支持常規的 HTTP/HTTPS 及 SOFARPC 協議。
提供基于 Java 語言的自定義開發腳本模式,可自行擴展私有協議。
可靠的生產壓測風險防控能力
與多個金融科技產品打通,整合應用監控、業務監控以及運維能力,發現風險可自動停止壓測。
結合金融科技 SOFA 中間件產品,使用影子全鏈路壓測方案,可進行壓測流量和正常流量的隔離,讓您可以在生產環境進行壓測。
應用場景
全鏈路壓測適用于任何有壓測或者模擬流量需求的應用場景。
新系統上線測試 |
新系統上線前,根據預期的業務模型對系統進行壓力和負載測試,測試系統是否存在性能問題以及預期容量是否能夠應對上線后的業務壓力。 |
原系統基線回歸 |
定期對線上系統進行恒定場景的性能回歸,觀察系統的性能是否存在變化,及時發現迭代、技術升級帶來的系統性能衰減。 |
系統容量評估 |
在開展運營活動之前,對系統容量進行壓測評估,根據業務場景持續加壓,評估系統容量水位,以便提前進行優化和擴容,如有限流措施,也可以通過壓測來進行驗證。 |
系統故障演練 |
利用持續的壓測流量來驗證系統異常時業務是否會受到影響??梢岳脡簻y流量配合故障注入演練、機房容災演練,觀察業務影響程度以及恢復能力。 |
資金安全監控
資金安全監控平臺是一個通過旁路方式,對業務流程中資金流向進行實時分析和實時告警、從技術上保障資金安全的實時核對平臺,旨在保障資金在流經業務系統時,不會出現資金流失的問題。
產品架構
產品優勢
對生產系統無侵入,旁路采集核對數據。
規則可配置,無需編碼;規則隨時可以新增或修改,滿足多種核對需求。
支持實時、準實時、T+1、T+H 等多種不同核對時效,滿足您對于資損風險監控時效性的不同需求。
管理功能豐富,提供核對大盤、覆蓋率度量等管控能力。
支持短信、郵件、釘釘等通知渠道,可為核心業務提供即時監控、即時應急保障。
提供資損風險監控覆蓋的度量功能,并配備專家咨詢服務,將多年積累的資損防控經驗帶給云上用戶。
應用場景
業務護航 |
幫助您階段性地或定期梳理涉及資金鏈路的核心業務——通過配置核對規則,對各類數據作相互核對,或對數據內容作邏輯檢查,確保核心業務運行無誤。 |
變更風險檢查 |
變更發布前,添加變更業務表與關聯表的核對規則,或者變更業務表數據的檢查規則,確保變更上線后不存在資損風險監控盲點。 |
歷史數據掃雷 |
批量檢查存量業務的歷史數據是否已存在差異,及時分析差異原因并修復漏洞,追回資損。 |
數據質量監控 |
數據缺漏也可能間接引發資損。您可以配置核對規則來檢查數據完整性,對數據質量進行監控,及時發現故障。 |