運(yùn)維管理
SOFAStack CAFE(Cloud Application Fabric Engine)云應(yīng)用引擎,提供應(yīng)用管理、發(fā)布部署、運(yùn)維編排、監(jiān)控分析、容災(zāi)應(yīng)急等全生命周期管理的 PaaS 平臺(tái)產(chǎn)品,滿足金融場景中經(jīng)典架構(gòu)和云原生架構(gòu)的運(yùn)維需求,幫助傳統(tǒng)架構(gòu)平滑過渡,保障金融技術(shù)風(fēng)險(xiǎn)。
應(yīng)用場景
統(tǒng)一的應(yīng)用運(yùn)行平臺(tái) |
通過平臺(tái)來解決大規(guī)模運(yùn)維中發(fā)布、監(jiān)控和審計(jì)的難題,并集成云原生的各種功能,例如容器、Serverless 和 Mesh 等,來提高運(yùn)維效率。 |
金融級高可用架構(gòu)平臺(tái)支撐 |
提供同城雙活、單元化、異地多活的 PaaS 平臺(tái)支撐。 |
經(jīng)典架構(gòu)向云原生架構(gòu)升級 |
滿足金融基礎(chǔ)架構(gòu)向從容器到云原生容器化的落地路徑,降低向新興架構(gòu)和運(yùn)維模式的轉(zhuǎn)型技術(shù)風(fēng)險(xiǎn)。 |
單元化應(yīng)用服務(wù)
單元化應(yīng)用服務(wù)(LDC Hybrid Cloud,簡稱 LHC)在云原生基礎(chǔ)設(shè)施之上,在多機(jī)房、多地域的 Kubernetes 多集群場景,提供應(yīng)用管理、發(fā)布運(yùn)維、流量調(diào)撥、配置同步等能力。LHC 旨在提供從單 Kubernetes 集群向多活聯(lián)邦集群演進(jìn)的能力,提供具備容災(zāi)能力的同城雙活、 兩地三中心及更多機(jī)房級多活容災(zāi)場景。并可以配合 SOFAStack 各中間件產(chǎn)品、OceanBase 分布式數(shù)據(jù)庫,形成單元化異地多活架構(gòu)解決方案。
產(chǎn)品架構(gòu)
產(chǎn)品優(yōu)勢
金融級發(fā)布
發(fā)布過程安全可靠,可重試,可灰度,可回滾,可溯源。
支持虛擬機(jī)和容器的混合發(fā)布,提供從虛擬機(jī)到容器的過渡方案。
運(yùn)行時(shí)監(jiān)控
業(yè)務(wù)自定義大盤隨時(shí)關(guān)注業(yè)務(wù)動(dòng)態(tài)。
實(shí)時(shí)監(jiān)控應(yīng)用基礎(chǔ)指標(biāo),如 PV、Service(應(yīng)用服務(wù)被調(diào)用)、SAL(調(diào)用外部服務(wù))等。
全面收集基礎(chǔ)資源指標(biāo),如 CPU、內(nèi)存、IO 流量等。
微服務(wù)框架
深度集成螞蟻 SOFA Mesh 做異構(gòu)語言的服務(wù)注冊發(fā)現(xiàn)及通信。
網(wǎng)絡(luò)模式
支持 VPC 和 Overlay 兩種網(wǎng)絡(luò)模式。
支持負(fù)載均衡類型的 Service 和 Ingress。
高可用和容災(zāi)
支持同城雙活、兩地三中心容災(zāi)方案。
支持升級至螞蟻集團(tuán)沉淀多年的單元化高可用容災(zāi)方案。
應(yīng)用場景
LHC 服務(wù)于云原生模式下,通過一套應(yīng)用 PaaS 平臺(tái),提供統(tǒng)一的應(yīng)用、資源管理,以及發(fā)布運(yùn)維視圖,實(shí)現(xiàn)多集群管理、跨集群應(yīng)用運(yùn)維發(fā)布、資源管理、流量管理。
同城雙活(active-active) |
在同一個(gè)地域 Region,建立兩個(gè)或更多可用區(qū)下的多個(gè) Kubernetes 集群。 |
兩地三中心 |
|
異地多活(Multi-region active-active) |
數(shù)據(jù)層做分片(Sharding),不同的 AZ 可以劃分為更多的邏輯單元(Logic Data Center),處理不同的數(shù)據(jù)分片。 盡量保證數(shù)據(jù)訪問的鏈路從接入層到應(yīng)用層再到數(shù)據(jù)層不會(huì)出現(xiàn)跨可用區(qū)的調(diào)用。這種架構(gòu)下,可以做到任意數(shù)量地域的多活。 |
異構(gòu)基礎(chǔ)設(shè)施下的混合云 |
通過 Kubernetes 屏蔽掉底層 IaaS 的差異性,可充分利用公有云上的資源,將業(yè)務(wù)同時(shí)在專有云和公有云上進(jìn)行部署,并進(jìn)行統(tǒng)一運(yùn)維管控。在該場景下,可以幫助金融客戶達(dá)到以下目的:
|
經(jīng)典應(yīng)用服務(wù)
經(jīng)典應(yīng)用服務(wù)(Classic Application Service,簡稱 CAS)以應(yīng)用為核心視圖,對應(yīng)用的版本、發(fā)布包、資源等進(jìn)行可視化、自動(dòng)化管理。經(jīng)典應(yīng)用服務(wù)提供自動(dòng)化、智能化的應(yīng)用全生命周期 DevOps 支持,提升效率、降低成本、減少人為錯(cuò)誤,讓開發(fā)人員專注于業(yè)務(wù)邏輯本身。
產(chǎn)品架構(gòu)
產(chǎn)品優(yōu)勢
以應(yīng)用為核心視角的 DevOps
提供應(yīng)用全生命周期的 DevOps 自動(dòng)化支持,將傳統(tǒng)的以 IT 資源為核心的管理視角轉(zhuǎn)換成以應(yīng)用、業(yè)務(wù)為核心視角,使用戶可以專注于業(yè)務(wù)價(jià)值的同時(shí),提升研發(fā)效率、降低人為出錯(cuò)的可能。
可定制的自動(dòng)化運(yùn)維
以自定義的技術(shù)棧方案,為用戶提供可定制的自動(dòng)化運(yùn)維,提升了云平臺(tái)的靈活性和對用戶存量系統(tǒng)的兼容支持性,方便用戶在平臺(tái)上使用自己熟悉的、非 SOFAStack 原生提供的技術(shù)框架。
強(qiáng)大的發(fā)布部署能力
提供分組發(fā)布、Beta 發(fā)布、灰度發(fā)布、單機(jī)房發(fā)布、藍(lán)綠發(fā)布等多種靈活的部署策略,從各種需求層面,支持可視化、自動(dòng)化、可重試、可回滾的發(fā)布部署。
靈活的運(yùn)維管道能力
提供錄入,執(zhí)行用戶自定義的運(yùn)維命令和腳本通道,方便用戶做自定義的運(yùn)維指令操作。
應(yīng)用場景
傳統(tǒng)運(yùn)維能力支持 |
傳統(tǒng)企業(yè)的大部分核心業(yè)務(wù)仍然未進(jìn)行容器化,仍然使用傳統(tǒng)代碼包的方式進(jìn)行虛擬機(jī)/物理機(jī)發(fā)布,CAS 支持傳統(tǒng)運(yùn)維方式向容器化運(yùn)維平滑演進(jìn)。 |
解耦 IaaS 與 PaaS |
在經(jīng)典運(yùn)維場景,CAS 也支持阿里云的 IaaS 以及華為云的 IaaS 場景,后續(xù)的其他供應(yīng)商 IaaS 正在持續(xù)集成適配中。讓用戶可以無需對底座有強(qiáng)依賴關(guān)系,真正做到 IaaS 與 PaaS 的解耦。 |
CICD 的集成 |
提供全面的應(yīng)用生命周期 API,供上游 CI 平臺(tái)進(jìn)行集成,形成 CICD 閉環(huán)。 |
容器應(yīng)用服務(wù)
容器應(yīng)用服務(wù)(Application Kubernetes Service,簡稱 AKS)全面集成 Kubernetes,提供完整的集群管控、認(rèn)證授權(quán)、容器網(wǎng)絡(luò)、持久卷存儲(chǔ)等方面的平臺(tái)能力。在兼顧標(biāo)準(zhǔn)化一致性的 Kubernetes 能力的同時(shí),亦將源自實(shí)踐的應(yīng)用全生命周期的發(fā)布部署能力通過產(chǎn)品化的形式交付。
產(chǎn)品架構(gòu)
產(chǎn)品優(yōu)勢
金融級發(fā)布
發(fā)布過程安全可靠,可重試,可灰度,可回滾,可溯源。
支持虛擬機(jī)和容器的混合發(fā)布,提供從虛擬機(jī)到容器的過渡方案。
運(yùn)行時(shí)監(jiān)控
業(yè)務(wù)自定義大盤隨時(shí)關(guān)注業(yè)務(wù)動(dòng)態(tài)。
實(shí)時(shí)監(jiān)控應(yīng)用基礎(chǔ)指標(biāo),如 PV、Service(應(yīng)用服務(wù)被調(diào)用)、SAL(調(diào)用外部服務(wù))等。
全面收集基礎(chǔ)資源指標(biāo),如 CPU、內(nèi)存、IO 流量等。
微服務(wù)框架
深度集成螞蟻 SOFA Mesh 做異構(gòu)語言的服務(wù)注冊發(fā)現(xiàn)及通信。
支持原生部署 Istio 做 Service Mesh 提供微服務(wù)能力。
網(wǎng)絡(luò)模式
支持 VPC 和經(jīng)典網(wǎng)絡(luò)兩種網(wǎng)絡(luò)模式。
高可用和容災(zāi)
支持經(jīng)典的同城雙活、兩地三中心容災(zāi)方案。
支持阿里云沉淀多年的單元化高可用容災(zāi)方案。
應(yīng)用場景
使用 SOFA 技術(shù)棧的傳統(tǒng)研發(fā)運(yùn)維體系 |
這類體系的應(yīng)用使用 SOFABoot 進(jìn)行開發(fā)或直接使用 SOFA Mesh,系統(tǒng)間關(guān)系復(fù)雜,有依賴關(guān)系,并且深度使用了 SOFAStack 產(chǎn)品,需要和現(xiàn)有 PaaS 的發(fā)布部署能力做無縫對接:
說明 該場景下,您需在 AKS 中創(chuàng)建應(yīng)用服務(wù),使用 SOFABoot 運(yùn)行時(shí)鏡像作為基礎(chǔ)鏡像構(gòu)建應(yīng)用鏡像,以原地升級方式進(jìn)行發(fā)布單級別的部署,就可使應(yīng)用服務(wù)在 AKS 上運(yùn)行,與虛擬機(jī)提供的服務(wù)進(jìn)行交互,并與現(xiàn)有 SOFAStack 產(chǎn)品做無縫對接。 |
使用 SOFA 技術(shù)棧的輕量級研發(fā)運(yùn)維體系 |
這類體系的應(yīng)用使用 SOFABoot 進(jìn)行開發(fā)或者使用 SOFA Mesh,和 SOFAStack 產(chǎn)品有緊密結(jié)合。這類應(yīng)用的特點(diǎn)為:
說明 該場景下,您只需在 AKS 中創(chuàng)建應(yīng)用服務(wù),使用 SOFABoot 運(yùn)行時(shí)鏡像作為基礎(chǔ)鏡像構(gòu)建應(yīng)用鏡像,以原地升級方式進(jìn)行部署管理,即可使應(yīng)用服務(wù)在 AKS 上運(yùn)行,并和現(xiàn)有 SOFAStack 產(chǎn)品無縫對接。 |
使用云原生技術(shù)體系 |
這類體系的應(yīng)用通常采用傳統(tǒng) Spring 或者 SpringBoot 技術(shù)棧,配合 Eureka,ZooKeeper 做服務(wù)注冊與發(fā)現(xiàn),并配套 CNCF 生態(tài)的監(jiān)控,鏈路工具,自成一體。這類的應(yīng)用的特點(diǎn)為:
說明 該場景下,您只需在 AKS 中創(chuàng)建應(yīng)用服務(wù),使用 SOFABoot 運(yùn)行時(shí)鏡像作為基礎(chǔ)鏡像構(gòu)建應(yīng)用鏡像,以原地升級方式進(jìn)行部署管理,即可使應(yīng)用服務(wù)在 AKS 上運(yùn)行,并和現(xiàn)有 SOFAStack 產(chǎn)品無縫對接。 |
業(yè)務(wù)實(shí)時(shí)監(jiān)控
實(shí)時(shí)監(jiān)控服務(wù)(Real-time Monitoring Service,簡稱 RMS)是一款具有可視化監(jiān)測能力的金融級監(jiān)控產(chǎn)品。
基于日志、指標(biāo)、鏈路等海量數(shù)據(jù)進(jìn)行多維聚合,向用戶提供業(yè)務(wù)監(jiān)控、應(yīng)用監(jiān)控、云原生監(jiān)控、基礎(chǔ)資源監(jiān)控、日志查詢分析、分布式鏈路等多角度的可視化監(jiān)測功能,有豐富的可視化大盤,并提供了告警訂閱功能。
該服務(wù)可以幫助運(yùn)維、研發(fā)、SRE (Site Reliability Engineer)等快速地發(fā)現(xiàn)問題、定位問題、分析問題、解決問題,為線上系統(tǒng)可用率提供有效保障。
經(jīng)過螞蟻場景歷練,為大規(guī)模和復(fù)雜業(yè)務(wù)場景提供全方位的可觀測性和洞察分析能力。
產(chǎn)品架構(gòu)
產(chǎn)品優(yōu)勢
全方位實(shí)時(shí)監(jiān)控
提供業(yè)務(wù)、應(yīng)用、基礎(chǔ)資源、云原生等各種視角的監(jiān)控能力,可實(shí)現(xiàn)關(guān)鍵指標(biāo)秒級、普通指標(biāo)分鐘級的監(jiān)控,具有高可靠、高時(shí)效、低延遲的特點(diǎn)。
靈活的報(bào)警規(guī)則
可根據(jù)業(yè)務(wù)特征、時(shí)間段、重要程度等維度設(shè)置報(bào)警規(guī)則,實(shí)現(xiàn)不誤報(bào)、不漏報(bào)。
便捷的自定義配置
具有豐富的自定義產(chǎn)品配置功能,可便捷、高效地進(jìn)行產(chǎn)品、報(bào)警配置。
開放的技術(shù)棧配置
可實(shí)現(xiàn) Kubernetes、SOFA 技術(shù)棧應(yīng)用部署即監(jiān)控,通過簡單技術(shù)棧配置,即可接入并監(jiān)控非標(biāo)業(yè)務(wù)應(yīng)用。
可視化大盤
豐富的可視化大盤,幫助您定制個(gè)性化的監(jiān)控大盤。
分布式鏈路
提供應(yīng)用拓?fù)浜玩溌凡樵児δ埽^測應(yīng)用及服務(wù)之間的復(fù)雜調(diào)用關(guān)系、性能指標(biāo)、出錯(cuò)信息與關(guān)聯(lián)日志,從而實(shí)現(xiàn)故障根因分析、服務(wù)治理、應(yīng)用開發(fā)調(diào)試、性能管理、性能調(diào)優(yōu)、架構(gòu)管控、故障定責(zé)等運(yùn)維開發(fā)工作。
日志查詢和日志關(guān)聯(lián)
提供日志查詢和日志關(guān)聯(lián)功能。用戶不僅可以對日志執(zhí)行查詢操作,還可以進(jìn)行歷史查詢和上下文查詢,以及查看 Error 指標(biāo)關(guān)聯(lián)的錯(cuò)誤日志和鏈路關(guān)聯(lián)業(yè)務(wù)日志,更加方便高效地進(jìn)行問題分析定位。
低資源占用
在可靠傳輸大量監(jiān)控?cái)?shù)據(jù)時(shí),保證對宿主機(jī)的 CPU、內(nèi)存等資源的極低占用率。
高可用
提供萬臺(tái)設(shè)備的分鐘級監(jiān)控部署能力,故障自動(dòng)恢復(fù),集群可伸縮。
穩(wěn)定高效的時(shí)序和數(shù)據(jù)存儲(chǔ)
在線持續(xù)聚合數(shù)據(jù),保證數(shù)據(jù)容量可控,提供智能分級存儲(chǔ)、存放策略。
應(yīng)用場景
立體化運(yùn)維 |
深度對接 Kubernetes、SOFA 等技術(shù)棧應(yīng)用服務(wù),一站式收集基礎(chǔ)設(shè)施、中間件、應(yīng)用運(yùn)行時(shí)數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù),通過指標(biāo)監(jiān)控、日志分析、鏈路追蹤、告警訂閱等功能,對應(yīng)用性能、運(yùn)行狀態(tài)和資源使用等提供立體化運(yùn)維分析,及時(shí)發(fā)現(xiàn)并定位應(yīng)用、資源及平臺(tái)的問題。
|
問題分析與快速定位 |
在分布式場景下,服務(wù)調(diào)用錯(cuò)綜復(fù)雜,問題分析與定位非常困難,分布式鏈路跟蹤系統(tǒng)能迅速定位到有問題的服務(wù),協(xié)助快速解決問題節(jié)點(diǎn)。
|
應(yīng)用性能優(yōu)化 |
在調(diào)用關(guān)系拓?fù)渲校梢詫Ω鱾€(gè)應(yīng)用的調(diào)用次數(shù)以及耗時(shí)情況進(jìn)行分析,找到負(fù)載較高以及負(fù)載較少的應(yīng)用,從而對資源進(jìn)行合理利用。
|