附錄:SOFAStack 產(chǎn)品目錄
SOFAStack 源于自螞蟻內(nèi)部沉淀十多年的金融級分布式中間件技術(shù)體系,吸收了支付寶自創(chuàng)立以來在關(guān)鍵金融交易系統(tǒng)錘煉出來的架構(gòu)實踐。SOFAStack 所有的產(chǎn)品技術(shù)均經(jīng)過螞蟻集團自身嚴苛的金融場景驗證,為金融交易技術(shù)保證風(fēng)險安全的同時,幫助業(yè)務(wù)需求敏捷迭代;同時滿足異地容災(zāi)、低成本快速擴容的需求,能夠解決傳統(tǒng)集中式架構(gòu)轉(zhuǎn)型的困難,并通過打造大規(guī)模高可用分布式系統(tǒng)架構(gòu),來支撐金融業(yè)務(wù)創(chuàng)新。
SOFAStack 由三大領(lǐng)域模塊組成:分布式中間件、運維管理(應(yīng)用 PaaS)、高階運維保障。
分布式中間件
螞蟻分布式中間件的產(chǎn)品發(fā)展路徑,一直秉承著引領(lǐng)和擁抱業(yè)界先進標準和實踐的理念,同時亦能滿足傳統(tǒng)金融架構(gòu)的平滑遷移和融合適配,以穩(wěn)妥應(yīng)對業(yè)務(wù)升級變更,并積極應(yīng)對金融交易系統(tǒng)所面臨的服務(wù)和數(shù)據(jù)擴展性、事務(wù)一致性、秒級容災(zāi)、彈性供給與調(diào)度等關(guān)鍵技術(shù)的挑戰(zhàn)。
雙模微服務(wù)
微服務(wù)平臺(SOFAStack Microservice Platform)通過微服務(wù)(SOFAStack Microservice,簡稱 SOFAStack MS)和服務(wù)網(wǎng)格(SOFAStack Mesh),提供了既支持 SOFA 框架又支持 Service Mesh 架構(gòu)的微服務(wù)管理和治理能力。
微服務(wù):提供了 SOFA 框架的微服務(wù),包含 RPC 服務(wù)、動態(tài)配置、限流熔斷。
服務(wù)網(wǎng)格:通過 Service Mesh 技術(shù)支持原生 Dubbo 、Spring Cloud、SOFA 框架,無侵入地提供了對 Dubbo、Spring Cloud、SOFA 應(yīng)用的服務(wù)管理和治理能力。
產(chǎn)品架構(gòu)
產(chǎn)品優(yōu)勢
高性能分布式服務(wù)框架
提供高性能和透明化的 RPC 遠程服務(wù)調(diào)用,具有高可伸縮性、高容錯性的特點。
微服務(wù)治理中心
提供一系列的服務(wù)治理策略,保障服務(wù)高質(zhì)量運行,最終達到對外承諾的服務(wù)質(zhì)量等級協(xié)議。
高可靠的輕量級配置中心
提供應(yīng)用運行時動態(tài)修改配置的服務(wù),并提供圖形化的集中化管理界面。
多活數(shù)據(jù)中心
支持同城雙活/異地多活架構(gòu),具備異地容災(zāi)能力,保障系統(tǒng)的可用性。
應(yīng)用場景
傳統(tǒng)應(yīng)用微服務(wù)改造 |
通過微服務(wù)產(chǎn)品將傳統(tǒng)金融業(yè)務(wù)系統(tǒng)拆分為模塊化、標準化、松耦合、可插拔、可擴展的微服務(wù)架構(gòu),可縮短產(chǎn)品面世周期,快速上架,搶占市場待機;不僅可確保客戶服務(wù)的效率,也降低了運營成本。 |
高并發(fā)業(yè)務(wù)快速擴展 |
通過微服務(wù)產(chǎn)品開發(fā)互聯(lián)網(wǎng)金融業(yè)務(wù),可提高研發(fā)效率,更靈活地響應(yīng)業(yè)務(wù)變化,快速迭代創(chuàng)新產(chǎn)品;并針對熱點模塊進行快速擴展來提高處理能力,輕松應(yīng)對突發(fā)流量,同時提高用戶體驗,為更多小微客戶提供個性化的金融產(chǎn)品和交易成本較低的便捷金融服務(wù)。 |
多數(shù)據(jù)中心異地多活 |
通過微服務(wù)產(chǎn)品可快速構(gòu)建可擴展、高性能的金融級分布式核心系統(tǒng),擁有彈性擴容和異地多活的能力。 |
任務(wù)調(diào)度
任務(wù)調(diào)度(Task Scheduler,簡稱 TS)提供分布式任務(wù)調(diào)度框架,實現(xiàn)任務(wù)的分布式處理,并能規(guī)范化、自動化、可視化和集中化地對金融企業(yè)不同業(yè)務(wù)系統(tǒng)的任務(wù)進行統(tǒng)一的調(diào)度和全方位的監(jiān)控運維管理。
產(chǎn)品架構(gòu)
產(chǎn)品優(yōu)勢
支持集群任務(wù)
支持對數(shù)據(jù)進行自定義維度的分片,不限制拆分層數(shù),因此可以充分利用集群的所有機器;當數(shù)據(jù)量較大時,多層調(diào)度任務(wù)可以更快地處理完數(shù)據(jù),同時支持簡單單機任務(wù)的運行。
支持任務(wù)的圖形化依賴編排
將多個任務(wù)按執(zhí)行的順序編排成一張拓撲圖,自動執(zhí)行,無需人工干預(yù),從而保證大量任務(wù)調(diào)度的快速高效的完成。
豐富的任務(wù)配置項
提供豐富的任務(wù)配置項,包括多種路由策略、多種失敗重試模式、多種漏觸發(fā)處理策略,并支持在線配置調(diào)度任務(wù)入?yún)ⅰ?/p>
靈活的觸發(fā)控制
支持任務(wù)通過定時觸發(fā)、周期性觸發(fā)、事件觸發(fā)和人工手動觸發(fā)。
應(yīng)用場景
金融行業(yè)的批處理 |
該場景需要在規(guī)定時間內(nèi)處理完指定的數(shù)據(jù)。傳統(tǒng)的處理方式是根據(jù)數(shù)據(jù)庫分片來處理,每臺機器處理一個數(shù)據(jù)分片。這種方式的缺點就是當業(yè)務(wù)集群的機器數(shù)量大于分片數(shù)時,很多機器處于閑置狀態(tài),資源利用率低。集群任務(wù)允許用戶自己對數(shù)據(jù)進行拆分,將待處理數(shù)據(jù)拆分成一個個索引塊,業(yè)務(wù)集群中的每臺機器都會分配到數(shù)據(jù)進行處理,使用靈活,并可以監(jiān)控任務(wù)的執(zhí)行情況。 |
金融行業(yè)的日切 |
金融行業(yè)的日切是一個很復(fù)雜的操作,需要多個任務(wù)按照指定順序協(xié)同工作才可以完成。傳統(tǒng)實現(xiàn)方式是在系統(tǒng)代碼里指定任務(wù)的執(zhí)行順序,當業(yè)務(wù)發(fā)生變化時需要修改代碼才可以正常工作,可維護性很差。使用 SOFAStack 任務(wù)調(diào)度中的任務(wù)編排功能,可以輕松完成任務(wù)之間的依賴調(diào)整,大大提高了可維護性,并可以直觀地看到任務(wù)的執(zhí)行情況。 |
消息隊列
SOFAStack 消息隊列是基于 Apache RocketMQ 構(gòu)建的分布式消息中間件,為分布式應(yīng)用提供異步解耦和削峰填谷的能力,支持多種消息類型,提供高可靠、高吞吐量、高可用、事務(wù)一致性的異步通訊能力。
產(chǎn)品架構(gòu)
產(chǎn)品優(yōu)勢
開箱即用
多種消息類型:事務(wù)消息、定時消息、順序消息。
多種訂閱模式:Pub/Sub、Tag 過濾、集群消費、廣播消費。
多協(xié)議多語言:TCP/HTTP 協(xié)議,多語言客戶端 SDK。
便捷運維
可運維:消息回溯、死信隊列、監(jiān)控告警。
易診斷:多維度查詢、全鏈路消息軌跡。
高安全:多租戶資源隔離、實例限流、主子賬號授權(quán)。
高性能
低延遲:毫秒級端到端延遲。
抗堆積:海量消息堆積能力。
高吞吐:千萬級高并發(fā)處理能力。
可擴展:可根據(jù)業(yè)務(wù)需求彈性伸縮。
高可用
高可用:99.9% 服務(wù)可用性。
高可靠:99.99999% 數(shù)據(jù)可靠性。
同步機制、重試機制、數(shù)據(jù)持久化。
應(yīng)用場景
異步解耦 |
通過生產(chǎn)消費模型解耦上下游業(yè)務(wù)系統(tǒng),可提升業(yè)務(wù)連續(xù)性。上游應(yīng)用作為生產(chǎn)方,將比較耗時且不需要即時(同步)返回結(jié)果的操作作為消息放入消息隊列;下游應(yīng)用作為消費者進行消息訂閱和消費。只要保證消息格式不變,消息的發(fā)送方和接收方并不需要直接連接,任何一方的系統(tǒng)故障都不會對其他應(yīng)用產(chǎn)生影響。 |
分布式事務(wù)的數(shù)據(jù)一致性 |
應(yīng)用解耦后還需要確保數(shù)據(jù)的最終一致性,利用消息隊列事務(wù)消息和消息的可靠傳遞機制,可以在實現(xiàn)系統(tǒng)解耦的同時,保證最終的數(shù)據(jù)一致性。 |
API 網(wǎng)關(guān)
API 網(wǎng)關(guān)(API Gateway)是一個 API 管理平臺,幫助企業(yè)統(tǒng)一管理對內(nèi)外開放的 API ,為網(wǎng)絡(luò)隔離的系統(tǒng)間提供高性能、高安全性、高可靠性的通信,同時保障內(nèi)部系統(tǒng)的安全性;用于滿足企業(yè)對外部合作伙伴開放業(yè)務(wù)、企業(yè)自身混合云互通、企業(yè)內(nèi)網(wǎng)異構(gòu)應(yīng)用集成的需求,幫助客戶更好的進行場景和業(yè)務(wù)的創(chuàng)新。
產(chǎn)品架構(gòu)
產(chǎn)品優(yōu)勢
跨云/跨域互通
支持對混合云和多業(yè)務(wù)域之間的網(wǎng)絡(luò)互通,實現(xiàn) API 的統(tǒng)一管理。
弱網(wǎng)優(yōu)化
針對移動端的特性,優(yōu)化弱網(wǎng)下的數(shù)據(jù)傳輸通信協(xié)議,提高網(wǎng)絡(luò)通信質(zhì)量和效率。
異構(gòu)集成
支持不同語言和不同技術(shù)棧實現(xiàn)的業(yè)務(wù)系統(tǒng)之間進行無縫集成。
多種客戶端接入支持
支持移動端(iOS,Android),也支持非移動端小程序(H5,Web,后端應(yīng)用)。
端到端全鏈路跟蹤
支持從客戶端發(fā)起的請求到后端服務(wù)所有節(jié)點的端到端的鏈路跟蹤。
超強的安全能力
支持多種身份校驗和數(shù)據(jù)加密方式(例如 CORS、SSL),以保障數(shù)據(jù)傳輸?shù)陌踩浴?/p>
應(yīng)用場景
前后端分離場景 |
|
異構(gòu)系統(tǒng)集成場景 |
|
混合云場景 |
|
分布式事務(wù)
分布式事務(wù)(Distributed Transaction-eXtended,簡稱 DTX)是一款金融級分布式事務(wù)中間件,用來保障在大規(guī)模分布式環(huán)境下業(yè)務(wù)活動的最終一致性。在螞蟻集團內(nèi)部被廣泛地應(yīng)用于交易、轉(zhuǎn)賬、紅包等核心資金鏈路,服務(wù)于億級用戶的資金操作。分布式事務(wù)可以與服務(wù)框架(如 SOFABoot、Spring Cloud、Dubbo)、數(shù)據(jù)源(如數(shù)據(jù)訪問代理 ODP、RDS、MySQL、OceanBase)、以及消息隊列等中間件產(chǎn)品配合使用,輕松實現(xiàn)服務(wù)鏈路級事務(wù)、跨庫事務(wù)和消息事務(wù)等各種組合。
產(chǎn)品架構(gòu)
產(chǎn)品優(yōu)勢
支持多種接入模式
SOFAStack 分布式事務(wù)隨著業(yè)務(wù)的多樣性發(fā)展而演變沉淀了多種接入模式,針對科技金融下多種業(yè)務(wù)場景靈活適配。
TCC 模式:TCC(Try-Confirm-Cancel)是一種高性能的分布式事務(wù)接入方案,該模式提供了更多的靈活性,幾乎可滿足任何您能想到的事務(wù)場景。TCC 模式提供自定義補償型事務(wù)、自定義資源預(yù)留型事務(wù)、消息事務(wù)等場景,用戶可以介入兩階段提交的過程,以達到特殊場景下的自定義優(yōu)化及特殊功能的實現(xiàn)。
FMT 模式:為了解決 TCC 模式的易用性問題,分布式事務(wù)推出了框架管理事務(wù)模式(Framework-Managed Transactions,簡稱 FMT)。FMT 是一種無侵入的分布式事務(wù)解決方案,該模式解決了分布式事務(wù)的易用性問題,最大的特點是易于使用、快速接入以及對業(yè)務(wù)代碼無侵入。
Saga 模式:Saga 是一種補償協(xié)議,在 Saga 模式下,分布式事務(wù)內(nèi)有多個參與者,每一個參與者都是一個沖正補償服務(wù),需要用戶根據(jù)業(yè)務(wù)場景實現(xiàn)其正向操作和逆向回滾操作。
金融級品質(zhì)的保障
金融級容災(zāi)保障:提供同城以及異地等多種模式以及多種級別的容災(zāi)能力,以業(yè)界最高規(guī)格的標準來保障客戶業(yè)務(wù)的連續(xù)性。
無與倫比的性能:相比傳統(tǒng)二階段模式,減少持有鎖時間,大幅提升性能。特有的性能推進模式(Performance Bursting Mode)可以大幅提升吞吐量,曾在 2019 年雙十一活動中支撐 54.4 萬筆/秒的交易操作。
使用簡潔易于接入:螞蟻金融科技(螞蟻集團)多年沉淀的實操經(jīng)驗使產(chǎn)品具備了快速靈活的接入能力,易于使用與運維。
兼容性保障:分布式事務(wù)是一個抽象的基于 Service 層的概念,與底層事務(wù)實現(xiàn)無關(guān),也就是說在分布式事務(wù)的范圍內(nèi),無論是關(guān)系型數(shù)據(jù)庫 MySQL、Oracle,還是 KV 存儲 MemCache,或是列存數(shù)據(jù)庫 HBase,只要將對它們的操作包裝成分布式事務(wù)的參與者,就可以接入到分布式事務(wù)中。
應(yīng)用場景
支付與轉(zhuǎn)賬 |
金融行業(yè)常見的支付、轉(zhuǎn)賬、賬務(wù)等業(yè)務(wù)場景對于吞吐量有很高的要求。SOFAStack 分布式事務(wù)在各類大促中的優(yōu)異表現(xiàn)證明了性能不會成為瓶頸。 |
財富理財 |
這類場景中往往涉及的金額較大,所以對于產(chǎn)品的穩(wěn)定性要求非常高。SOFAStack 分布式事務(wù)擁有金融級的品質(zhì),可為業(yè)務(wù)的持續(xù)性與穩(wěn)定性保駕護航。 |
保險與監(jiān)管報送 |
參與方多、業(yè)務(wù)復(fù)雜度高是該類業(yè)務(wù)的典型特征。SOFAStack 分布式事務(wù)歷經(jīng)十多年的演進歷程,足以靈活應(yīng)對各種場景,滿足事務(wù)一致性要求,保證與各類業(yè)務(wù)完美結(jié)合。 |
數(shù)據(jù)訪問代理
數(shù)據(jù)訪問代理(Open Database Proxy,簡稱 ODP)能夠解決海量請求下的數(shù)據(jù)訪問瓶頸和數(shù)據(jù)庫的容災(zāi)問題,提供水平拆分、平滑擴縮容、讀寫分離的在線分布式數(shù)據(jù)庫服務(wù),為海量數(shù)據(jù)訪問提供低消耗、高性能、高可用的輕量級解決方案。
產(chǎn)品架構(gòu)
產(chǎn)品優(yōu)勢
分庫分表
支持 RDS/OceanBase/MySQL 的分庫分表。在創(chuàng)建分布式數(shù)據(jù)庫后,只需選擇拆分鍵,數(shù)據(jù)訪問代理就可以按照拆分鍵生成拆分規(guī)則,實現(xiàn)數(shù)據(jù)水平拆分。
透明讀寫分離
通過使用數(shù)據(jù)訪問代理的只讀實例或 MySQL 備機實現(xiàn)讀寫分離,幫助應(yīng)用解決事務(wù)、只讀實例或者備機失效、指定主備訪問等細節(jié)問題。對應(yīng)用無侵入,在數(shù)據(jù)訪問代理控制臺即可完成讀寫分離相關(guān)操作。
數(shù)據(jù)存儲平滑擴容
當出現(xiàn)數(shù)據(jù)存儲容量和訪問量瓶頸時,數(shù)據(jù)訪問代理支持在線存儲容量擴展;擴容無需應(yīng)用改造,擴容進度支持可視化跟蹤。
服務(wù)升降配
數(shù)據(jù)訪問代理實例可以通過改變資源數(shù)量實現(xiàn)服務(wù)能力的彈性擴展。
全局唯一數(shù)字序列
數(shù)據(jù)訪問代理支持分布式全局唯一且有序遞增的數(shù)字序列,滿足業(yè)務(wù)在使用分布式數(shù)據(jù)庫下對主鍵或唯一鍵以及特定場景的需求。
數(shù)據(jù)庫賬號權(quán)限體系
數(shù)據(jù)訪問代理支持類單機 MySQL 賬號和權(quán)限體系,確保不同角色使用的賬號操作安全。
分布式事務(wù)支持
數(shù)據(jù)訪問代理結(jié)合中間件分布式事務(wù)套件,可以支持分布式事務(wù),保證分布式數(shù)據(jù)庫數(shù)據(jù)一致性。
應(yīng)用場景
海量數(shù)據(jù)讀寫 |
提供靈活的數(shù)據(jù)拆分機制,代碼侵入性低,可以非常方便地實現(xiàn)數(shù)據(jù)的水平拆分與擴容,從而解決數(shù)據(jù)庫單機瓶頸的問題。 |
金融級數(shù)據(jù)容災(zāi) |
基于螞蟻集團內(nèi)部多年的金融級數(shù)據(jù)容災(zāi)場景,針對不同業(yè)務(wù)場景提供了多種機房級數(shù)據(jù)容災(zāi)解決方案,保障數(shù)據(jù)的穩(wěn)定性與業(yè)務(wù)的連續(xù)性。 |
數(shù)據(jù)庫流量分配 |
提供了基于規(guī)則的流量分發(fā)機制,通過部署多個數(shù)據(jù)庫實例(如一寫多讀)的方式來滿足大量查詢業(yè)務(wù)的需求。 |
分布式鏈路跟蹤
分布式鏈路跟蹤(Distributed System Tracing,簡稱 DST)是一款面向分布式架構(gòu)、微服務(wù)架構(gòu)和云原生架構(gòu)的應(yīng)用可觀察性的金融級解決方案,幫助用戶厘清應(yīng)用間復(fù)雜的調(diào)用關(guān)系,迅速定位故障或者緩慢節(jié)點。
產(chǎn)品架構(gòu)
產(chǎn)品優(yōu)勢
分布式跨應(yīng)用追蹤
追蹤每個交易的完整鏈路,按不同服務(wù)(應(yīng)用)接口建立調(diào)用時間序列,收集鏈路上每個服務(wù)的性能數(shù)據(jù),按服務(wù)追蹤交易性能問題。
多維度鏈路查詢
根據(jù) Trace ID 按不同條件(錯誤、超時等)檢索調(diào)用鏈,分析鏈路信息,查詢各場景下的調(diào)用鏈集合。
多視角鏈路展示
提供鏈路圖、鏈路詳情、時序圖、時間軸等,全方位可視化地展示系統(tǒng)性能。
業(yè)務(wù)日志關(guān)聯(lián)查詢
自定義配置應(yīng)用系統(tǒng)的業(yè)務(wù)日志,自動關(guān)聯(lián)業(yè)務(wù)報錯和摘要信息,快速定位問題及跟蹤業(yè)務(wù)信息。
應(yīng)用場景
問題的分析和快速定位 |
在分布式場景下,服務(wù)調(diào)用錯綜復(fù)雜,問題分析與定位非常困難。分布式鏈路跟蹤系統(tǒng)能迅速定位到有問題的服務(wù),協(xié)助快速解決問題。
|
應(yīng)用性能和架構(gòu)的優(yōu)化 |
在調(diào)用關(guān)系拓撲中能對各個應(yīng)用的調(diào)用次數(shù)和耗時情況進行查看和分析,找到負載較高和負載較少的應(yīng)用,對資源進行一個合理的利用。
|
運維管理
SOFAStack CAFE(Cloud Application Fabric Engine)云應(yīng)用引擎,提供應(yīng)用管理、發(fā)布部署、運維編排、監(jiān)控分析、容災(zāi)應(yīng)急等全生命周期管理的 PaaS 平臺產(chǎn)品,滿足金融場景中經(jīng)典架構(gòu)和云原生架構(gòu)的運維需求,幫助傳統(tǒng)架構(gòu)平滑過渡,保障金融技術(shù)風(fēng)險。
應(yīng)用場景
統(tǒng)一的應(yīng)用運行平臺 |
通過平臺來解決大規(guī)模運維中發(fā)布、監(jiān)控和審計的難題,并集成云原生的各種功能,例如容器、Serverless 和 Mesh 等,來提高運維效率。 |
金融級高可用架構(gòu)平臺支撐 |
提供同城雙活、單元化、異地多活的 PaaS 平臺支撐。 |
經(jīng)典架構(gòu)向云原生架構(gòu)升級 |
滿足金融基礎(chǔ)架構(gòu)向從容器到云原生容器化的落地路徑,降低向新興架構(gòu)和運維模式的轉(zhuǎn)型技術(shù)風(fēng)險。 |
單元化應(yīng)用服務(wù)
單元化應(yīng)用服務(wù)(LDC Hybrid Cloud,簡稱 LHC)在云原生基礎(chǔ)設(shè)施之上,在多機房、多地域的 Kubernetes 多集群場景,提供應(yīng)用管理、發(fā)布運維、流量調(diào)撥、配置同步等能力。LHC 旨在提供從單 Kubernetes 集群向多活聯(lián)邦集群演進的能力,提供具備容災(zāi)能力的同城雙活、 兩地三中心及更多機房級多活容災(zāi)場景。并可以配合 SOFAStack 各中間件產(chǎn)品、OceanBase 分布式數(shù)據(jù)庫,形成單元化異地多活架構(gòu)解決方案。
產(chǎn)品架構(gòu)
產(chǎn)品優(yōu)勢
金融級發(fā)布
發(fā)布過程安全可靠,可重試,可灰度,可回滾,可溯源。
支持虛擬機和容器的混合發(fā)布,提供從虛擬機到容器的過渡方案。
運行時監(jiān)控
業(yè)務(wù)自定義大盤隨時關(guān)注業(yè)務(wù)動態(tài)。
實時監(jiān)控應(yīng)用基礎(chǔ)指標,如 PV、Service(應(yīng)用服務(wù)被調(diào)用)、SAL(調(diào)用外部服務(wù))等。
全面收集基礎(chǔ)資源指標,如 CPU、內(nèi)存、IO 流量等。
微服務(wù)框架
深度集成螞蟻 SOFA Mesh 做異構(gòu)語言的服務(wù)注冊發(fā)現(xiàn)及通信。
網(wǎng)絡(luò)模式
支持 VPC 和 Overlay 兩種網(wǎng)絡(luò)模式。
支持負載均衡類型的 Service 和 Ingress。
高可用和容災(zāi)
支持同城雙活、兩地三中心容災(zāi)方案。
支持升級至螞蟻集團沉淀多年的單元化高可用容災(zāi)方案。
應(yīng)用場景
LHC 服務(wù)于云原生模式下,通過一套應(yīng)用 PaaS 平臺,提供統(tǒng)一的應(yīng)用、資源管理,以及發(fā)布運維視圖,實現(xiàn)多集群管理、跨集群應(yīng)用運維發(fā)布、資源管理、流量管理。
同城雙活(active-active) |
在同一個地域 Region,建立兩個或更多可用區(qū)下的多個 Kubernetes 集群。 |
兩地三中心 |
|
異地多活(Multi-region active-active) |
數(shù)據(jù)層做分片(Sharding),不同的 AZ 可以劃分為更多的邏輯單元(Logic Data Center),處理不同的數(shù)據(jù)分片。 盡量保證數(shù)據(jù)訪問的鏈路從接入層到應(yīng)用層再到數(shù)據(jù)層不會出現(xiàn)跨可用區(qū)的調(diào)用。這種架構(gòu)下,可以做到任意數(shù)量地域的多活。 |
異構(gòu)基礎(chǔ)設(shè)施下的混合云 |
通過 Kubernetes 屏蔽掉底層 IaaS 的差異性,可充分利用公有云上的資源,將業(yè)務(wù)同時在專有云和公有云上進行部署,并進行統(tǒng)一運維管控。在該場景下,可以幫助金融客戶達到以下目的:
|
經(jīng)典應(yīng)用服務(wù)
經(jīng)典應(yīng)用服務(wù)(Classic Application Service,簡稱 CAS)以應(yīng)用為核心視圖,對應(yīng)用的版本、發(fā)布包、資源等進行可視化、自動化管理。經(jīng)典應(yīng)用服務(wù)提供自動化、智能化的應(yīng)用全生命周期 DevOps 支持,提升效率、降低成本、減少人為錯誤,讓開發(fā)人員專注于業(yè)務(wù)邏輯本身。
產(chǎn)品架構(gòu)
產(chǎn)品優(yōu)勢
以應(yīng)用為核心視角的 DevOps
提供應(yīng)用全生命周期的 DevOps 自動化支持,將傳統(tǒng)的以 IT 資源為核心的管理視角轉(zhuǎn)換成以應(yīng)用、業(yè)務(wù)為核心視角,使用戶可以專注于業(yè)務(wù)價值的同時,提升研發(fā)效率、降低人為出錯的可能。
可定制的自動化運維
以自定義的技術(shù)棧方案,為用戶提供可定制的自動化運維,提升了云平臺的靈活性和對用戶存量系統(tǒng)的兼容支持性,方便用戶在平臺上使用自己熟悉的、非 SOFAStack 原生提供的技術(shù)框架。
強大的發(fā)布部署能力
提供分組發(fā)布、Beta 發(fā)布、灰度發(fā)布、單機房發(fā)布、藍綠發(fā)布等多種靈活的部署策略,從各種需求層面,支持可視化、自動化、可重試、可回滾的發(fā)布部署。
靈活的運維管道能力
提供錄入,執(zhí)行用戶自定義的運維命令和腳本通道,方便用戶做自定義的運維指令操作。
應(yīng)用場景
傳統(tǒng)運維能力支持 |
傳統(tǒng)企業(yè)的大部分核心業(yè)務(wù)仍然未進行容器化,仍然使用傳統(tǒng)代碼包的方式進行虛擬機/物理機發(fā)布,CAS 支持傳統(tǒng)運維方式向容器化運維平滑演進。 |
解耦 IaaS 與 PaaS |
在經(jīng)典運維場景,CAS 也支持阿里云的 IaaS 以及華為云的 IaaS 場景,后續(xù)的其他供應(yīng)商 IaaS 正在持續(xù)集成適配中。讓用戶可以無需對底座有強依賴關(guān)系,真正做到 IaaS 與 PaaS 的解耦。 |
CICD 的集成 |
提供全面的應(yīng)用生命周期 API,供上游 CI 平臺進行集成,形成 CICD 閉環(huán)。 |
容器應(yīng)用服務(wù)
容器應(yīng)用服務(wù)(Application Kubernetes Service,簡稱 AKS)全面集成 Kubernetes,提供完整的集群管控、認證授權(quán)、容器網(wǎng)絡(luò)、持久卷存儲等方面的平臺能力。在兼顧標準化一致性的 Kubernetes 能力的同時,亦將源自實踐的應(yīng)用全生命周期的發(fā)布部署能力通過產(chǎn)品化的形式交付。
產(chǎn)品架構(gòu)
產(chǎn)品優(yōu)勢
金融級發(fā)布
發(fā)布過程安全可靠,可重試,可灰度,可回滾,可溯源。
支持虛擬機和容器的混合發(fā)布,提供從虛擬機到容器的過渡方案。
運行時監(jiān)控
業(yè)務(wù)自定義大盤隨時關(guān)注業(yè)務(wù)動態(tài)。
實時監(jiān)控應(yīng)用基礎(chǔ)指標,如 PV、Service(應(yīng)用服務(wù)被調(diào)用)、SAL(調(diào)用外部服務(wù))等。
全面收集基礎(chǔ)資源指標,如 CPU、內(nèi)存、IO 流量等。
微服務(wù)框架
深度集成螞蟻 SOFA Mesh 做異構(gòu)語言的服務(wù)注冊發(fā)現(xiàn)及通信。
支持原生部署 Istio 做 Service Mesh 提供微服務(wù)能力。
網(wǎng)絡(luò)模式
支持 VPC 和經(jīng)典網(wǎng)絡(luò)兩種網(wǎng)絡(luò)模式。
高可用和容災(zāi)
支持經(jīng)典的同城雙活、兩地三中心容災(zāi)方案。
支持阿里云沉淀多年的單元化高可用容災(zāi)方案。
應(yīng)用場景
使用 SOFA 技術(shù)棧的傳統(tǒng)研發(fā)運維體系 |
這類體系的應(yīng)用使用 SOFABoot 進行開發(fā)或直接使用 SOFA Mesh,系統(tǒng)間關(guān)系復(fù)雜,有依賴關(guān)系,并且深度使用了 SOFAStack 產(chǎn)品,需要和現(xiàn)有 PaaS 的發(fā)布部署能力做無縫對接:
說明 該場景下,您需在 AKS 中創(chuàng)建應(yīng)用服務(wù),使用 SOFABoot 運行時鏡像作為基礎(chǔ)鏡像構(gòu)建應(yīng)用鏡像,以原地升級方式進行發(fā)布單級別的部署,就可使應(yīng)用服務(wù)在 AKS 上運行,與虛擬機提供的服務(wù)進行交互,并與現(xiàn)有 SOFAStack 產(chǎn)品做無縫對接。 |
使用 SOFA 技術(shù)棧的輕量級研發(fā)運維體系 |
這類體系的應(yīng)用使用 SOFABoot 進行開發(fā)或者使用 SOFA Mesh,和 SOFAStack 產(chǎn)品有緊密結(jié)合。這類應(yīng)用的特點為:
說明 該場景下,您只需在 AKS 中創(chuàng)建應(yīng)用服務(wù),使用 SOFABoot 運行時鏡像作為基礎(chǔ)鏡像構(gòu)建應(yīng)用鏡像,以原地升級方式進行部署管理,即可使應(yīng)用服務(wù)在 AKS 上運行,并和現(xiàn)有 SOFAStack 產(chǎn)品無縫對接。 |
使用云原生技術(shù)體系 |
這類體系的應(yīng)用通常采用傳統(tǒng) Spring 或者 SpringBoot 技術(shù)棧,配合 Eureka,ZooKeeper 做服務(wù)注冊與發(fā)現(xiàn),并配套 CNCF 生態(tài)的監(jiān)控,鏈路工具,自成一體。這類的應(yīng)用的特點為:
說明 該場景下,您只需在 AKS 中創(chuàng)建應(yīng)用服務(wù),使用 SOFABoot 運行時鏡像作為基礎(chǔ)鏡像構(gòu)建應(yīng)用鏡像,以原地升級方式進行部署管理,即可使應(yīng)用服務(wù)在 AKS 上運行,并和現(xiàn)有 SOFAStack 產(chǎn)品無縫對接。 |
業(yè)務(wù)實時監(jiān)控
實時監(jiān)控服務(wù)(Real-time Monitoring Service,簡稱 RMS)是一款具有可視化監(jiān)測能力的金融級監(jiān)控產(chǎn)品。
基于日志、指標、鏈路等海量數(shù)據(jù)進行多維聚合,向用戶提供業(yè)務(wù)監(jiān)控、應(yīng)用監(jiān)控、云原生監(jiān)控、基礎(chǔ)資源監(jiān)控、日志查詢分析、分布式鏈路等多角度的可視化監(jiān)測功能,有豐富的可視化大盤,并提供了告警訂閱功能。
該服務(wù)可以幫助運維、研發(fā)、SRE (Site Reliability Engineer)等快速地發(fā)現(xiàn)問題、定位問題、分析問題、解決問題,為線上系統(tǒng)可用率提供有效保障。
經(jīng)過螞蟻場景歷練,為大規(guī)模和復(fù)雜業(yè)務(wù)場景提供全方位的可觀測性和洞察分析能力。
產(chǎn)品架構(gòu)
產(chǎn)品優(yōu)勢
全方位實時監(jiān)控
提供業(yè)務(wù)、應(yīng)用、基礎(chǔ)資源、云原生等各種視角的監(jiān)控能力,可實現(xiàn)關(guān)鍵指標秒級、普通指標分鐘級的監(jiān)控,具有高可靠、高時效、低延遲的特點。
靈活的報警規(guī)則
可根據(jù)業(yè)務(wù)特征、時間段、重要程度等維度設(shè)置報警規(guī)則,實現(xiàn)不誤報、不漏報。
便捷的自定義配置
具有豐富的自定義產(chǎn)品配置功能,可便捷、高效地進行產(chǎn)品、報警配置。
開放的技術(shù)棧配置
可實現(xiàn) Kubernetes、SOFA 技術(shù)棧應(yīng)用部署即監(jiān)控,通過簡單技術(shù)棧配置,即可接入并監(jiān)控非標業(yè)務(wù)應(yīng)用。
可視化大盤
豐富的可視化大盤,幫助您定制個性化的監(jiān)控大盤。
分布式鏈路
提供應(yīng)用拓撲和鏈路查詢功能,觀測應(yīng)用及服務(wù)之間的復(fù)雜調(diào)用關(guān)系、性能指標、出錯信息與關(guān)聯(lián)日志,從而實現(xiàn)故障根因分析、服務(wù)治理、應(yīng)用開發(fā)調(diào)試、性能管理、性能調(diào)優(yōu)、架構(gòu)管控、故障定責(zé)等運維開發(fā)工作。
日志查詢和日志關(guān)聯(lián)
提供日志查詢和日志關(guān)聯(lián)功能。用戶不僅可以對日志執(zhí)行查詢操作,還可以進行歷史查詢和上下文查詢,以及查看 Error 指標關(guān)聯(lián)的錯誤日志和鏈路關(guān)聯(lián)業(yè)務(wù)日志,更加方便高效地進行問題分析定位。
低資源占用
在可靠傳輸大量監(jiān)控數(shù)據(jù)時,保證對宿主機的 CPU、內(nèi)存等資源的極低占用率。
高可用
提供萬臺設(shè)備的分鐘級監(jiān)控部署能力,故障自動恢復(fù),集群可伸縮。
穩(wěn)定高效的時序和數(shù)據(jù)存儲
在線持續(xù)聚合數(shù)據(jù),保證數(shù)據(jù)容量可控,提供智能分級存儲、存放策略。
應(yīng)用場景
立體化運維 |
深度對接 Kubernetes、SOFA 等技術(shù)棧應(yīng)用服務(wù),一站式收集基礎(chǔ)設(shè)施、中間件、應(yīng)用運行時數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù),通過指標監(jiān)控、日志分析、鏈路追蹤、告警訂閱等功能,對應(yīng)用性能、運行狀態(tài)和資源使用等提供立體化運維分析,及時發(fā)現(xiàn)并定位應(yīng)用、資源及平臺的問題。
|
問題分析與快速定位 |
在分布式場景下,服務(wù)調(diào)用錯綜復(fù)雜,問題分析與定位非常困難,分布式鏈路跟蹤系統(tǒng)能迅速定位到有問題的服務(wù),協(xié)助快速解決問題節(jié)點。
|
應(yīng)用性能優(yōu)化 |
在調(diào)用關(guān)系拓撲中,可以對各個應(yīng)用的調(diào)用次數(shù)以及耗時情況進行分析,找到負載較高以及負載較少的應(yīng)用,從而對資源進行合理利用。
|
高階運維
TRaaS 技術(shù)風(fēng)險防控平臺,是以螞蟻內(nèi)部 SRE 長期實踐方法論和內(nèi)部工具沉淀為依托,形成的解決用戶上云和分布式改造過程中,可觀測、故障應(yīng)急、容災(zāi)、混沌工程、資金安全、壓測等運維問題的平臺產(chǎn)品。
高可用管理平臺
高可用管理平臺(High Availability Service,HAS)是以容災(zāi)為主的高可用管控平臺產(chǎn)品,可實現(xiàn)容災(zāi)方案的端到端整體能力,從客戶業(yè)務(wù)到中間件、PaaS 以及 IaaS 整體的容災(zāi)切換及恢復(fù)、容災(zāi)規(guī)劃、容災(zāi)模擬演練等能力,并包含整體機房及容災(zāi)狀態(tài)的監(jiān)控能力、容災(zāi)大盤展示、環(huán)境巡檢、風(fēng)險應(yīng)急等。
HAS 提供容災(zāi)服務(wù)視圖、預(yù)案編排能力、切換和恢復(fù)能力,支持多機房部署架構(gòu)下的機房級別一鍵容災(zāi)切換和恢復(fù)。
產(chǎn)品架構(gòu)
產(chǎn)品優(yōu)勢
螞蟻技術(shù)風(fēng)險管理體系方法論+平臺工具完整落地
通過高可用管理平臺工具,可以輸出螞蟻多年積累點的技術(shù)風(fēng)險防控內(nèi)容,并在此基礎(chǔ)上助力用戶建設(shè)符合用戶實際情況的技術(shù)風(fēng)險防控體系,提升用戶整體技術(shù)風(fēng)險防控水平。
技術(shù)風(fēng)險防控效率有效提升
通過高可用管理平臺技術(shù)風(fēng)險防控能力,自動化、標準化、例行化日常運維,降低操作復(fù)雜度,運維結(jié)果清晰可見,實現(xiàn)風(fēng)險事件的閉環(huán)管理。
通過日常巡檢主動感知業(yè)務(wù)運行風(fēng)險,在對業(yè)務(wù)造成影響前及時處理。
自動化故障診斷和標準化應(yīng)急預(yù)案快速定位并恢復(fù)故障,減少因故障引起的業(yè)務(wù)中斷時間。
故障演練主動檢驗應(yīng)用高可用能力。
支持螞蟻產(chǎn)品雙中心容災(zāi)切換,滿足監(jiān)管合規(guī)需求。
技術(shù)風(fēng)險防控內(nèi)容庫快速更新
阿里云、螞蟻技術(shù)風(fēng)險團隊基于域內(nèi)、域外技術(shù)風(fēng)險防控經(jīng)驗,共建日常巡檢、故障診斷、應(yīng)急預(yù)案內(nèi)容庫,用戶可享受最新的技術(shù)風(fēng)險防控內(nèi)容。
金融級容災(zāi)
容災(zāi)等級最高可達 5 級。
容災(zāi)能力豐富,支持容災(zāi)大屏監(jiān)控告警、容災(zāi)仿真演練、容災(zāi)巡檢等能力。
經(jīng)過支付寶和網(wǎng)商銀行規(guī)模驗證。
全鏈路容災(zāi)
支持從客戶應(yīng)用到中樞態(tài)的全鏈路容災(zāi)能力,實現(xiàn)端到端整體容災(zāi),全鏈路監(jiān)控和運維,無需多平臺對接。包含用戶應(yīng)用、中間件、PaaS、IaaS 全鏈路多層容災(zāi)。
多場景容災(zāi)
支持金融行業(yè)的全部容災(zāi)場景:
同城雙活
異地主備
兩地三中心
LDC 單元化
應(yīng)用場景
日常風(fēng)險防控 |
在日常的運維場景中,通過多功能模塊的聯(lián)動使用,自動化執(zhí)行日常運維腳本,實現(xiàn)定期可控的日常巡檢運維;同時不斷更新優(yōu)化日常巡檢、故障診斷、應(yīng)急預(yù)案等內(nèi)容的建設(shè),不斷豐富和完善應(yīng)用技術(shù)風(fēng)險防控體系,簡化日常應(yīng)用運維操作。 |
故障演練 |
為不斷提升產(chǎn)品高可用能力,通過高可用管理平臺的故障演練模塊,設(shè)計并規(guī)劃演練計劃和恢復(fù)方案,繼而在演練過程中不斷發(fā)現(xiàn)、解決容災(zāi)預(yù)案存在的問題。以此,降低產(chǎn)品使用過程中故障發(fā)生概率,提高故障恢復(fù)效率,進而實現(xiàn)產(chǎn)品高可用性的有效提升。 |
機房級容災(zāi) |
|
全鏈路壓測
全鏈路壓測(Loadcenter)為企業(yè)提供涵蓋性能壓測、壓測報告輸出以及壓測風(fēng)險防控的一站式壓測服務(wù)。結(jié)合螞蟻集團多年的線上全鏈路壓測經(jīng)驗,為您提供高仿真、低成本、高風(fēng)險識別的在線壓測體驗。
產(chǎn)品架構(gòu)
產(chǎn)品優(yōu)勢
復(fù)雜的場景建模能力
支持多種流量模型,可快速導(dǎo)入配置流量。
支持模板化腳本及自定義開發(fā)腳本,滿足不同復(fù)雜度的業(yè)務(wù)場景壓測需求。
強大的報告分析能力
壓測記錄存檔、集中管理。
結(jié)合實時監(jiān)控服務(wù),壓測結(jié)果中記錄標準應(yīng)用監(jiān)控數(shù)據(jù)及業(yè)務(wù)自定義監(jiān)控數(shù)據(jù),可快捷地找出存在瓶頸的應(yīng)用及相關(guān)性能指標。
報告對比分析,追蹤應(yīng)用性能基線演進。
穩(wěn)定的壓力輸出能力
壓力機橫向擴容,秒級動態(tài)調(diào)整壓力,可滿足千萬級 TPS 壓測需求。
支持內(nèi)網(wǎng)接口壓測
壓力機資源池支持公有和租戶私有兩種模式。公有模式下,您無需自備壓力機,可隨時執(zhí)行壓測;私有模式下,使用您的壓力機,可節(jié)省帶寬成本并降低網(wǎng)絡(luò)延時,同時支持內(nèi)部接口級測試,無需暴露在公網(wǎng),更安全。
支持多種協(xié)議
支持常規(guī)的 HTTP/HTTPS 及 SOFARPC 協(xié)議。
提供基于 Java 語言的自定義開發(fā)腳本模式,可自行擴展私有協(xié)議。
可靠的生產(chǎn)壓測風(fēng)險防控能力
與多個金融科技產(chǎn)品打通,整合應(yīng)用監(jiān)控、業(yè)務(wù)監(jiān)控以及運維能力,發(fā)現(xiàn)風(fēng)險可自動停止壓測。
結(jié)合金融科技 SOFA 中間件產(chǎn)品,使用影子全鏈路壓測方案,可進行壓測流量和正常流量的隔離,讓您可以在生產(chǎn)環(huán)境進行壓測。
應(yīng)用場景
全鏈路壓測適用于任何有壓測或者模擬流量需求的應(yīng)用場景。
新系統(tǒng)上線測試 |
新系統(tǒng)上線前,根據(jù)預(yù)期的業(yè)務(wù)模型對系統(tǒng)進行壓力和負載測試,測試系統(tǒng)是否存在性能問題以及預(yù)期容量是否能夠應(yīng)對上線后的業(yè)務(wù)壓力。 |
原系統(tǒng)基線回歸 |
定期對線上系統(tǒng)進行恒定場景的性能回歸,觀察系統(tǒng)的性能是否存在變化,及時發(fā)現(xiàn)迭代、技術(shù)升級帶來的系統(tǒng)性能衰減。 |
系統(tǒng)容量評估 |
在開展運營活動之前,對系統(tǒng)容量進行壓測評估,根據(jù)業(yè)務(wù)場景持續(xù)加壓,評估系統(tǒng)容量水位,以便提前進行優(yōu)化和擴容,如有限流措施,也可以通過壓測來進行驗證。 |
系統(tǒng)故障演練 |
利用持續(xù)的壓測流量來驗證系統(tǒng)異常時業(yè)務(wù)是否會受到影響。可以利用壓測流量配合故障注入演練、機房容災(zāi)演練,觀察業(yè)務(wù)影響程度以及恢復(fù)能力。 |
資金安全監(jiān)控
資金安全監(jiān)控平臺是一個通過旁路方式,對業(yè)務(wù)流程中資金流向進行實時分析和實時告警、從技術(shù)上保障資金安全的實時核對平臺,旨在保障資金在流經(jīng)業(yè)務(wù)系統(tǒng)時,不會出現(xiàn)資金流失的問題。
產(chǎn)品架構(gòu)
產(chǎn)品優(yōu)勢
對生產(chǎn)系統(tǒng)無侵入,旁路采集核對數(shù)據(jù)。
規(guī)則可配置,無需編碼;規(guī)則隨時可以新增或修改,滿足多種核對需求。
支持實時、準實時、T+1、T+H 等多種不同核對時效,滿足您對于資損風(fēng)險監(jiān)控時效性的不同需求。
管理功能豐富,提供核對大盤、覆蓋率度量等管控能力。
支持短信、郵件、釘釘?shù)韧ㄖ溃蔀楹诵臉I(yè)務(wù)提供即時監(jiān)控、即時應(yīng)急保障。
提供資損風(fēng)險監(jiān)控覆蓋的度量功能,并配備專家咨詢服務(wù),將多年積累的資損防控經(jīng)驗帶給云上用戶。
應(yīng)用場景
業(yè)務(wù)護航 |
幫助您階段性地或定期梳理涉及資金鏈路的核心業(yè)務(wù)——通過配置核對規(guī)則,對各類數(shù)據(jù)作相互核對,或?qū)?shù)據(jù)內(nèi)容作邏輯檢查,確保核心業(yè)務(wù)運行無誤。 |
變更風(fēng)險檢查 |
變更發(fā)布前,添加變更業(yè)務(wù)表與關(guān)聯(lián)表的核對規(guī)則,或者變更業(yè)務(wù)表數(shù)據(jù)的檢查規(guī)則,確保變更上線后不存在資損風(fēng)險監(jiān)控盲點。 |
歷史數(shù)據(jù)掃雷 |
批量檢查存量業(yè)務(wù)的歷史數(shù)據(jù)是否已存在差異,及時分析差異原因并修復(fù)漏洞,追回資損。 |
數(shù)據(jù)質(zhì)量監(jiān)控 |
數(shù)據(jù)缺漏也可能間接引發(fā)資損。您可以配置核對規(guī)則來檢查數(shù)據(jù)完整性,對數(shù)據(jù)質(zhì)量進行監(jiān)控,及時發(fā)現(xiàn)故障。 |