云原生可觀測服務(wù)內(nèi)容說明
1. 服務(wù)概述
1.1 服務(wù)說明
云原生可觀測服務(wù)是在客戶系統(tǒng)上云、用云過程中,提供以阿里云產(chǎn)品體系為主,開源生態(tài)組件為輔的統(tǒng)一可觀測方案設(shè)計、驗證與落地的專家服務(wù)。該服務(wù)基于客戶現(xiàn)實情況,以及可觀測治理目標,為客戶提供統(tǒng)一可觀測平臺設(shè)計與落地、業(yè)務(wù)指標梳理與提取、應(yīng)用及基礎(chǔ)設(shè)施指標梳理及提取、決策支撐大盤設(shè)計與繪制、告警梳理與落地的技術(shù)服務(wù)。
云原生可觀測服務(wù)包含 3 個版本,客戶可以結(jié)合自身業(yè)務(wù)需求進行購買,注意,任何未在本SOW中定義的工作內(nèi)容或方案均不包含在本項目的交付范圍中。
云原生可觀測服務(wù) (必選,基礎(chǔ)版與標準版 2 選 1;實施支持版按需購買)
基礎(chǔ)版
基礎(chǔ)咨詢服務(wù):基于客戶現(xiàn)狀及治理訴求進行方案設(shè)計與落地,整體設(shè)計與落地基于阿里云 Arms、Prometheus、Grafana、SLS的原生能力。基礎(chǔ)版覆蓋基礎(chǔ)設(shè)施以及應(yīng)用,不包含業(yè)務(wù)層可觀測能力以及任何需要定制開發(fā)的工作。
包含基于以上方案的技術(shù)驗證工作,確保設(shè)定的技術(shù)方案具備落地能力。
包含上述方案的實施工作,整體方案可落地,且符合客戶預(yù)期。
標準版
標準咨詢服務(wù):基于客戶現(xiàn)狀及治理訴求進行方案設(shè)計與落地,整體設(shè)計與落地基于阿里云 Arms、Prometheus、Grafana、SLS的原生能力。標準版覆蓋基礎(chǔ)設(shè)施、應(yīng)用以及業(yè)務(wù)可觀測。適用于對在業(yè)務(wù)可觀測訴求比較強的客戶。
包含基于以上方案的技術(shù)驗證工作,確保設(shè)定的技術(shù)方案具備落地能力。
包含上述方案的實施工作,整體方案可落地,且符合客戶預(yù)期。
實施支持版
如果客戶需要阿里云團隊提供基礎(chǔ)版或標準版 SoW 以外的可觀測能力建設(shè),或基于可觀測能力建設(shè)結(jié)果的衍生能力建設(shè),包括但不限于:CI/CD Pipeline 觀測能力建設(shè)、彈性架構(gòu)改造、容量規(guī)劃等,可購買實施支持版服務(wù),根據(jù)項目實際工作量來評估需要購買服務(wù)包的數(shù)量。
本服務(wù)包以遠程服務(wù)為主,可結(jié)合項目需求與客戶實際情況進行調(diào)整。
如客戶有額外的集成需求,或項目范圍大于標準版,結(jié)合實際情況進行溝通。
2. 服務(wù)范圍
以下服務(wù)范圍按照3個版本分類,分別是云原生可觀測服務(wù)基礎(chǔ)版,云原生可觀測服務(wù)標準版,云原生可觀測服務(wù)_實施支持版,不同版本類型服務(wù)范圍如下。
2.1 云原生可觀測服務(wù)基礎(chǔ)版服務(wù)范圍
云原生可觀測服務(wù)基礎(chǔ)版內(nèi)容如下:
可觀測現(xiàn)狀調(diào)研與目標評估
通過遠程信息收集及現(xiàn)場溝通的方式,對客戶的業(yè)務(wù)現(xiàn)狀及應(yīng)用系統(tǒng)進行全面調(diào)研,了解客戶對于業(yè)務(wù)及應(yīng)用的長期規(guī)劃。
調(diào)研客戶現(xiàn)行監(jiān)控告警架構(gòu)、業(yè)務(wù)目標調(diào)研、技術(shù)架構(gòu)調(diào)研、運維體系調(diào)研、監(jiān)控目標指定、應(yīng)用彈性現(xiàn)狀調(diào)研。
可觀測方案設(shè)計
基于調(diào)研與評估的結(jié)果,為客戶設(shè)計可觀測方案,包含:
基于阿里云 ARMS、Prometheus、Grafana 產(chǎn)品能力囊括指標、鏈路追蹤數(shù)據(jù)的采集、存儲和分析使用的統(tǒng)一可觀測性平臺設(shè)計。
針對ACK 部署架構(gòu)應(yīng)用以及 ECS 部署架構(gòu)應(yīng)用,指標、鏈路追蹤數(shù)據(jù)的接入方案設(shè)計。
應(yīng)用指標設(shè)計:根據(jù)應(yīng)用情況,設(shè)計應(yīng)用指標,用于反應(yīng)應(yīng)用健康度,并暴露應(yīng)用運行時信息,包括但不限于PV/UV/QPS,應(yīng)用健康度、應(yīng)用接口健康情況、JVM 運行情況、慢 sql 、異常等指標。并設(shè)計相對應(yīng)的指標數(shù)據(jù)聚合方案等。1、 覆蓋應(yīng)用需滿足 ARMS手動安裝探針,使用組件需滿足ARMS應(yīng)用監(jiān)控支持的Java組件和框架。
基礎(chǔ)設(shè)施指標設(shè)計:根據(jù)基礎(chǔ)設(shè)施使用情況,設(shè)計基礎(chǔ)設(shè)施指標,用于反應(yīng)基礎(chǔ)設(shè)施的健康程度。包括但不限于ACK 各層指標,ECS 等云產(chǎn)品指標。并設(shè)計相應(yīng)的指標聚合方案。
大盤展示方案設(shè)計:根據(jù)具體的可視化展示需求,以及上述定義的指標數(shù)據(jù),設(shè)計從決策層到實施層,不同維度的大盤展示方案,用于支撐決策并提速問題排查。
告警方案設(shè)計:依據(jù)業(yè)務(wù)情況,針對核心指標進行告警方案設(shè)計,并通過系列手段,提高告警信噪比。
方案不包含如下內(nèi)容:
基礎(chǔ)設(shè)施及應(yīng)用指標、日志、鏈路追蹤數(shù)據(jù)采集方案均只基于阿里云 Arms、SLS 原生能力,如 Arms、SLS 等云產(chǎn)品不支持,則不在本期交付范圍內(nèi),例如對 Ruby、PHP 等非 Arms 能支持的應(yīng)用指標采集,或 Arms 所不支持的Java、組件版本指標采集等,均不在本次交付范圍內(nèi)。
如有全球應(yīng)用觀測需求,涉及到合規(guī)問題,需要客戶側(cè)提供專業(yè)合規(guī)支持,數(shù)據(jù)傳輸報備等合規(guī)相關(guān)工作內(nèi)容不在本項目范圍內(nèi)。
由于全鏈路觀測業(yè)務(wù)相關(guān)性極強,定制化程度高,且設(shè)計、實施成本不可預(yù)測,本項目不承諾進行全鏈路觀測設(shè)計和實施,鏈路追蹤能力基于 Arms產(chǎn)品提供的原生能力來建設(shè)。
大數(shù)據(jù)應(yīng)用可觀測不在本項目范圍內(nèi)。
日志數(shù)據(jù)的采集、存儲、分析和使用不在本項目范圍內(nèi)。
業(yè)務(wù)指標以及需要通過自實現(xiàn)采集器進行獲取的指標的采集、存儲、聚合規(guī)則等設(shè)計內(nèi)容不在本項目范圍內(nèi)。
一切其他不在本 SoW 描述服務(wù)范圍內(nèi)的工作均不在本服務(wù)包交付范圍中。
技術(shù)驗證
對確認的方案進行技術(shù)驗證,滿足可落地性的需求。
對技術(shù)驗證的結(jié)果進行記錄。
方案實施工作:
可觀測架構(gòu)配置與落地
基于可觀測性方案設(shè)計,進行統(tǒng)一可觀測架構(gòu)所需資源的拉起和配置工作。
指標、鏈路追蹤數(shù)據(jù)接入支持工作,(具體操作由客戶側(cè)團隊執(zhí)行):1、 進行非生產(chǎn)環(huán)境的數(shù)據(jù)接入支持工作,并和客戶一起產(chǎn)出接入操作手冊。2、 進行生產(chǎn)環(huán)境的數(shù)據(jù)接入支持工作。
基于方案設(shè)計,進行指標的聚合規(guī)則編寫。
大盤配置工作,基于方案設(shè)計,基于非生產(chǎn)環(huán)境數(shù)據(jù),進行可視化大盤配置工作,并在生產(chǎn)環(huán)境數(shù)據(jù)接入后,完成非生產(chǎn)數(shù)據(jù)源到生產(chǎn)數(shù)據(jù)源的切換。
告警配置,報警規(guī)則配置和報警渠道對接。
實施不包含:
實施服務(wù)僅覆蓋1-2 個典型架構(gòu)應(yīng)用,旨在快速看到可觀測落地效果,并在實施過程中完成知識傳遞,本服務(wù)不承諾完成所有客戶應(yīng)用的實施。如有額外數(shù)量的應(yīng)用可觀測性實施接入需求,需額外購買實施支持版以彌補工作量。
實施工作僅針對符合阿里云云原生觀測能力的應(yīng)用,比如 Java 應(yīng)用且組件版本受 Arms 支持,如有需要使用開源組件支撐的應(yīng)用,比如 PHP 應(yīng)用等,需要實施支持版或通過標準版進行覆蓋。
一切客戶生產(chǎn)環(huán)境的操作不在實施范圍內(nèi),包括但不限于生產(chǎn)環(huán)境的agent 安裝、配置等。
客戶應(yīng)用以及三方產(chǎn)品的開發(fā)、改造和配置等工作不在實施范圍內(nèi)。
本項目實施均基于阿里云產(chǎn)品以及開源工具原生采集指標。涉及到自定義指標采集器設(shè)計和實現(xiàn)等工作不在本項目范圍內(nèi)。不在范圍內(nèi)的內(nèi)容包括但不限于從數(shù)據(jù)庫、日志等原始數(shù)據(jù)中提取,通過代碼實現(xiàn)自定義指標采集器進行編寫和設(shè)計。
由甲方原因?qū)е碌倪M度不符合預(yù)期,乙方不承擔延期責任。
乙方按照項目需要通過現(xiàn)場或遠程方式進行詳細調(diào)研以及咨詢方案設(shè)計,并產(chǎn)出最終結(jié)果。
乙方不負責提供除阿里云官方文檔、項目交付范圍內(nèi)文檔之外的任何技術(shù)文檔。
乙方不負責甲方業(yè)務(wù)系統(tǒng)規(guī)劃、架構(gòu)設(shè)計、上云改造、應(yīng)用過程中的任何實施與維護責任。
乙方不負責非阿里云平臺以外(第三方軟件、應(yīng)用系統(tǒng))問題處理、技術(shù)的支持和答疑工作。
2.2 云原生可觀測服務(wù)標準版服務(wù)范圍
云原生可觀測服務(wù)基礎(chǔ)版內(nèi)容如下:
可觀測現(xiàn)狀調(diào)研與目標評估
通過遠程信息收集及現(xiàn)場溝通的方式,對客戶的業(yè)務(wù)現(xiàn)狀及應(yīng)用系統(tǒng)進行全面調(diào)研,了解客戶對于業(yè)務(wù)及應(yīng)用的長期規(guī)劃。
調(diào)研客戶現(xiàn)行監(jiān)控告警架構(gòu)、業(yè)務(wù)目標調(diào)研、技術(shù)架構(gòu)調(diào)研、運維體系調(diào)研、監(jiān)控目標指定、應(yīng)用彈性現(xiàn)狀調(diào)研。
可觀測方案設(shè)計
基于調(diào)研與評估的結(jié)果,為客戶設(shè)計可觀測方案,包含:
基于阿里云 ARMS、Prometheus、Grafana 以及 SLS產(chǎn)品能力輔以O(shè)penTelemetry 開源組件能力,囊括指標、鏈路追蹤數(shù)據(jù)、日志數(shù)據(jù)的采集、存儲和分析使用的統(tǒng)一可觀測性平臺設(shè)計。
針對ACK 部署架構(gòu)應(yīng)用以及 ECS 部署架構(gòu)應(yīng)用,指標、鏈路追蹤以及日志數(shù)據(jù)的接入方案設(shè)計。
業(yè)務(wù)指標設(shè)計:根據(jù)業(yè)務(wù)需求和現(xiàn)狀,設(shè)計1-2個核心業(yè)務(wù)指標,并依據(jù)業(yè)務(wù)指標數(shù)據(jù)來源,設(shè)計相對應(yīng)的日志改造方案、指標聚合方案等。
應(yīng)用指標設(shè)計:根據(jù)應(yīng)用情況,設(shè)計應(yīng)用指標,用于反應(yīng)應(yīng)用健康度,并暴露應(yīng)用運行時信息,包括但不限于PV/UV/QPS,應(yīng)用健康度、應(yīng)用接口健康情況、JVM 運行情況、慢 sql 、異常等指標。并設(shè)計相對應(yīng)的指標數(shù)據(jù)聚合方案等。
基礎(chǔ)設(shè)施指標設(shè)計:根據(jù)基礎(chǔ)設(shè)施使用情況,設(shè)計基礎(chǔ)設(shè)施指標,用于反應(yīng)基礎(chǔ)設(shè)施的健康程度。包括但不限于ACK 各層指標,ECS 等云產(chǎn)品指標。并設(shè)計相應(yīng)的指標聚合方案。
大盤展示方案設(shè)計:根據(jù)具體的可視化展示需求,以及上述定義的指標數(shù)據(jù),設(shè)計從決策層到實施層,不同維度的大盤展示方案,用于支撐決策并提速問題排查。
告警方案設(shè)計:依據(jù)業(yè)務(wù)情況,針對核心指標進行告警方案設(shè)計,并通過系列手段,提高告警信噪比。
方案不包含如下內(nèi)容:
如有全球應(yīng)用觀測需求,涉及到合規(guī)問題,需要客戶側(cè)提供專業(yè)合規(guī)支持,數(shù)據(jù)傳輸報備等合規(guī)相關(guān)工作內(nèi)容不在本項目范圍內(nèi)。
由于全鏈路觀測業(yè)務(wù)相關(guān)性極強,定制化程度高,且設(shè)計、實施成本不可預(yù)測,本項目不承諾進行全鏈路觀測設(shè)計和實施,鏈路追蹤能力基于 Arms產(chǎn)品提供的原生能力來建設(shè)。
大數(shù)據(jù)應(yīng)用可觀測不在本項目范圍內(nèi)。
方案設(shè)計可能引入如 OpenTelemetry、Nginx Exporter、Kong Exporter等開源工具來進行三方組件指標采集,方案設(shè)計將基于開源工具現(xiàn)有能力進行,針對開源工具的新功能開發(fā)、新需求跟進、變更、問題兜底等工作內(nèi)容均不在該項目范圍內(nèi)。
日志數(shù)據(jù)的采集、存儲、分析和使用不在本項目范圍內(nèi)。
業(yè)務(wù)指標以及需要通過自實現(xiàn)采集器進行獲取的指標的采集、存儲、聚合規(guī)則等設(shè)計內(nèi)容不在本項目范圍內(nèi)。
技術(shù)驗證
對確認的方案進行技術(shù)驗證,滿足可落地性的需求。
對技術(shù)驗證的結(jié)果進行記錄。
方案實施工作:
1-2個典型應(yīng)用的可觀測架構(gòu)配置與落地:
基于可觀測性方案設(shè)計,進行統(tǒng)一可觀測架構(gòu)所需資源的拉起和配置工作。
指標、鏈路追蹤數(shù)據(jù)接入支持工作,(具體操作由客戶側(cè)團隊執(zhí)行):1、 進行非生產(chǎn)環(huán)境的數(shù)據(jù)接入支持工作,并和客戶一起產(chǎn)出接入操作手冊。2、 進行生產(chǎn)環(huán)境的數(shù)據(jù)接入支持工作。
基于方案設(shè)計,進行指標的聚合規(guī)則編寫。
基于業(yè)務(wù)監(jiān)控需要,進行自定義指標采集器設(shè)計與編寫,業(yè)務(wù)指標如果涉及到從數(shù)據(jù)庫、日志等原始數(shù)據(jù)中提取,通過代碼實現(xiàn)自定義指標采集器進行編寫和設(shè)計。
大盤配置工作,基于方案設(shè)計,基于非生產(chǎn)環(huán)境數(shù)據(jù),進行可視化大盤配置工作,并在生產(chǎn)環(huán)境數(shù)據(jù)接入后,完成非生產(chǎn)數(shù)據(jù)源到生產(chǎn)數(shù)據(jù)源的切換。
告警配置,報警規(guī)則配置和報警渠道對接。
實施不包含:
實施服務(wù)覆蓋1-2 個典型架構(gòu)應(yīng)用,旨在快速看到可觀測落地效果,并在實施過程中完成知識傳遞,本服務(wù)不承諾完成所有客戶應(yīng)用的實施。如有額外數(shù)量的應(yīng)用可觀測性實施接入需求,需額外購買實施支持版以彌補工作量。
一切客戶生產(chǎn)環(huán)境的操作不在實施范圍內(nèi),包括但不限于生產(chǎn)環(huán)境的agent 安裝、配置等。
客戶應(yīng)用以及三方產(chǎn)品的開發(fā)、改造和配置等工作不在實施范圍內(nèi)。
本項目實施均基于阿里云產(chǎn)品以及開源工具原生采集指標。涉及到自定義指標采集器設(shè)計和實現(xiàn)等工作不在本項目范圍內(nèi)。不在范圍內(nèi)的內(nèi)容包括但不限于從數(shù)據(jù)庫、日志等原始數(shù)據(jù)中提取,通過代碼實現(xiàn)自定義指標采集器進行編寫和設(shè)計。
由甲方原因?qū)е碌倪M度不符合預(yù)期,乙方不承擔延期責任。
乙方按照項目需要通過現(xiàn)場或遠程方式進行詳細調(diào)研以及咨詢方案設(shè)計,并產(chǎn)出最終結(jié)果。
乙方不負責提供除阿里云官方文檔、項目交付范圍內(nèi)文檔之外的任何技術(shù)文檔。
乙方不負責甲方業(yè)務(wù)系統(tǒng)規(guī)劃、架構(gòu)設(shè)計、上云改造、應(yīng)用過程中的任何實施與維護責任。
乙方不負責非阿里云平臺以外(第三方軟件、應(yīng)用系統(tǒng))問題處理、技術(shù)的支持和答疑工作。
2.3 云原生可觀測服務(wù)_實施支持版
基于可觀測能力建設(shè)結(jié)果,評估額外工作量,進行工作量實施支持,工作內(nèi)容可能包括但不限于:
CI/CD pipeline 可觀測能力設(shè)計與落地。包括 CI/CD pipeline 構(gòu)建數(shù)據(jù)采集、接入、大盤繪制,告警設(shè)計與配置等。
彈性架構(gòu)能力設(shè)計與落地。包括基于 ECS 部署架構(gòu)以及基于 ACK 部署架構(gòu)的應(yīng)用層無狀態(tài)彈性架構(gòu)能力的設(shè)計與落地,以及基于阿里云云原生數(shù)據(jù)庫serverless 能力的數(shù)據(jù)庫層彈性架構(gòu)設(shè)計與落地。
應(yīng)用可觀測體系接入實施。基礎(chǔ)版與標準版承諾完成 1-2 個典型應(yīng)用的接入,如需阿里云服務(wù)團隊協(xié)助進行更多應(yīng)用接入,可通過實施支持版來彌補工作量。
客戶可根據(jù)實際服務(wù)范圍采購多個實施服務(wù)包。
本服務(wù)不包含:
實施支持版不承諾提供任何額外書面交付物。
乙方服務(wù)過程中不負責甲方應(yīng)用的部署、應(yīng)用代碼的改造、數(shù)據(jù)代碼改造、數(shù)據(jù)遷移等具體的實施工作,具體的實施工作由甲方執(zhí)行,在實施過程中乙方只負責阿里云側(cè)云上環(huán)境設(shè)置與集成,并協(xié)助甲方解決阿里云產(chǎn)品使用相關(guān)的問題。
由甲方原因?qū)е碌倪M度不符合預(yù)期,乙方不承擔延期責任。
3. 前提條件
客戶應(yīng)提前至少15個工作日申請該服務(wù),以便于阿里云評估客戶業(yè)務(wù)目標及時間計劃可行,確認是否承接該服務(wù)申請。
如客戶的申請涉及大批量資源需求,建議客戶提前一個月申請,具體視供應(yīng)鏈評估情況協(xié)商。
客戶應(yīng)及時向乙方提供所有需要的合理的文檔、信息、數(shù)據(jù)、圖表以及必要的系統(tǒng)權(quán)限、遠程訪問通道以使乙方可以提供服務(wù)。且所有這些資料將受到本協(xié)議項下的保密條款的約束。甲方同意向乙方已披露的或?qū)⒁兜乃行畔⑹钦鎸崱蚀_并且不會產(chǎn)生誤導(dǎo)。
云原生可觀測服務(wù)基礎(chǔ)版和云原生可觀測服務(wù)標準版,乙方的辦公地點不受項目約束,服務(wù)的提供方式主要以:電話、釘釘、郵件等方式。
本項目交付過程中,實施主體為甲方,乙方主要提供方案設(shè)計及技術(shù)驗證過程中的問題處理,具體的云原生可觀測實施動作需要由甲方進行。
乙方將在正常業(yè)務(wù)時間,即星期一到星期五的正常業(yè)務(wù)時間,即北京時間上午 9:00 到下午 6:00(國家法定節(jié)假日除外)提供本項目的交付服務(wù)。
雙方在項目實施期間采用雙方同意的通訊方式,由雙方的項目經(jīng)理負責傳遞本項目所需的書面信息,可選擇的通訊方式包括:釘釘,互聯(lián)網(wǎng)、FAX、電子郵件等。
所有項目交付物為中文(簡體),工作語言為中文。所有交付作品采用Microsoft Office(包括PPT,WORD,Excel,Visio)格式,并以電子拷貝方式提交。
甲方與乙方應(yīng)須按雙方事先達成一致的工作計劃、人員資源計劃與系統(tǒng)確定的工作起止日期投入項目工作。如遇到甲方相關(guān)業(yè)務(wù)系統(tǒng)迭代延期上線,相關(guān)項目進度將會產(chǎn)生順延,乙方對此不承擔責任。
如需引入第三方,甲乙雙方應(yīng)分別負責同各自第三方簽訂合同。乙方不對甲方的其他分包商或廠商(除乙方的分包商外)的行為負責、亦不對由其造成的延遲負責;甲方不對乙方的其他分包商或廠商(除甲方的分包商外)的行為負責、亦不對由其造成的延遲負責。
任何一方均不對本合同項下的特殊、附帶、或間接損害或后果性經(jīng)濟損害(包括利潤或節(jié)省金額損失)負責,即便該方已被告知該等損害賠償?shù)目赡苄浴?/p>
4.分工界面
4.1 客戶與阿里云
客戶購買云原生可觀測服務(wù)(基礎(chǔ)版+標準版),經(jīng)過阿里云審核及交流后確認服務(wù)成立,
針對該服務(wù)期限內(nèi),雙方商定并確認具體業(yè)務(wù)目標及范圍。
具體分工界面見下表:
服務(wù)類型 | 階段 | 任務(wù)名稱 | 任務(wù)明細 | 客戶 | 阿里云 |
云原生可觀測服務(wù) | 現(xiàn)狀調(diào)研 | 業(yè)務(wù)目標調(diào)研 | 1、著重分析用戶的技術(shù)架構(gòu)和業(yè)務(wù)目標,收集當前的技術(shù)信息,運維體系,監(jiān)控現(xiàn)狀和目標。 2、通過調(diào)研明確現(xiàn)狀以及監(jiān)控需求,確定項目計劃和目標 | A/S/C/I | R/I |
技術(shù)架構(gòu)調(diào)研 | A/S/C/I | R/I | |||
運維體系調(diào)研 | A/S/C/I | R/I | |||
監(jiān)控目標指定 | A/S/C/I | R/I | |||
方案設(shè)計 | 可觀測方案設(shè)計 | 1、根據(jù)調(diào)研現(xiàn)狀與建設(shè)目標,對云上可觀測性架構(gòu)進行設(shè)計,該工作項為整個項目提出總體的目標與愿景 2、方案包含內(nèi)容如下: a. 統(tǒng)一可觀測性平臺設(shè)計 b. 數(shù)據(jù)的接入方案設(shè)計 C. 業(yè)務(wù)指標設(shè)計 d. 應(yīng)用指標設(shè)計 e. 基礎(chǔ)設(shè)施指標設(shè)計 f. 大盤展示方案設(shè)計 g. 告警方案設(shè)計 | A/S/C/I | R/I | |
技術(shù)驗證 | 方案落地驗證 | 1、對確認的方案進行技術(shù)驗證,滿足可落地性的需求 2、對技術(shù)驗證的結(jié)果進行記錄 | A/R/I | S/C/I | |
可觀測性配置落地 | 可觀測性架構(gòu)改造 | 1、基于可觀測性方案設(shè)計,進行統(tǒng)一可觀測架構(gòu)所需資源的拉起和配置工作。 2、指標、鏈路追蹤數(shù)據(jù)接入支持工作,(具體操作由客戶側(cè)團隊執(zhí)行): a. 進行非生產(chǎn)環(huán)境的數(shù)據(jù)接入支持工作,并和客戶一起產(chǎn)出接入操作手冊。 b. 進行生產(chǎn)環(huán)境的數(shù)據(jù)接入支持工作。 3、基于方案設(shè)計,進行指標的聚合規(guī)則編寫, 4、大盤配置工作 5、告警配置,報警規(guī)則配置和報警渠道對接。 | A/R/I | S/C/I | |
日志接入 | |||||
觀測大盤配置 | |||||
監(jiān)控告警配置 |
責任簡稱:R-Responsible執(zhí)行人,A-Accountable負責人,C-Consulted征求意見人,I-Informed被告知人,S-Support負責配合“R”完成指標的工作。
4.1.1 客戶
客戶指定一名具備合適技能和經(jīng)驗的項目經(jīng)理作為與阿里云溝通的主要聯(lián)系人,代表客戶直接負責項目實施的計劃、協(xié)調(diào)、監(jiān)督與控制以及升級問題與風險,同時全權(quán)代表客戶在本項目的各個方面做出決策。
根據(jù)項目情況,由甲方項目經(jīng)理協(xié)調(diào)各方資源主導(dǎo)可觀測調(diào)研以及技術(shù)驗證工作。
項目開始由甲方提供可觀測相關(guān)的資料和規(guī)范文檔,并明確說明執(zhí)行要求。
4.1.2 阿里云
指派一名有經(jīng)驗的技術(shù)經(jīng)理執(zhí)行云原生可觀測服務(wù)項目管理,并引入、管理乙方項目組人員,與甲方項目經(jīng)理溝通。
通過現(xiàn)狀調(diào)研了解客戶系統(tǒng)的基本架構(gòu)、業(yè)務(wù)使用場景、技術(shù)組件和開發(fā)框架等信息,并對可觀測現(xiàn)狀及目標進行評估
基于現(xiàn)狀調(diào)研設(shè)計云原生可觀測治理方案。
配合甲方進行可觀測技術(shù)方案驗證,協(xié)助解決技術(shù)驗證過程中遇到的各類問題。
4.1.3 完工標準
云原生可觀測服務(wù)基礎(chǔ)版完工標準
云原生可觀測方案設(shè)計完成并經(jīng)過甲方確認,包含覆蓋應(yīng)用以及基礎(chǔ)設(shè)施的統(tǒng)一可觀測架構(gòu)、指標設(shè)計、大盤設(shè)計、告警設(shè)計四部分內(nèi)容。
方案內(nèi)容落地客戶環(huán)境 1-2 個應(yīng)用。
產(chǎn)出交付物:《云原生可觀測基礎(chǔ)版方案》
云原生可觀測服務(wù)標準版完工標準
云原生可觀測方案設(shè)計完成并經(jīng)過甲方確認,包含覆蓋業(yè)務(wù)、應(yīng)用和基礎(chǔ)設(shè)施的統(tǒng)一可觀測架構(gòu)、指標設(shè)計、大盤設(shè)計、告警設(shè)計四部分內(nèi)容。
方案內(nèi)容落地客戶環(huán)境 1-2 個應(yīng)用。
產(chǎn)出交付物:《云原生可觀測標準版方案》
云原生可觀測實施支持服務(wù)完工標準
該服務(wù)為實施支持版服務(wù),依據(jù)實際項目溝通的實施支持內(nèi)容進行完工標準的確認。
4.2 服務(wù)目錄
服務(wù)內(nèi)容:云原生可觀測服務(wù)針對客戶的業(yè)務(wù)目標,包含以下服務(wù):
服務(wù)名稱 | 階段名稱 | 子階段名稱 | 基礎(chǔ)版服務(wù)包 | 標準版服務(wù)包 | 可觀測增補包 |
可觀測架構(gòu)治理服務(wù) | 需求調(diào)研 | 基礎(chǔ)設(shè)施調(diào)研 | 包含 | 包含 | 用于增補基礎(chǔ)版或者標準版范圍外的可觀測需求,如 CI/CD pipeline 觀測、負責的大盤繪制、復(fù)雜的自定業(yè)務(wù)指標義采集器實現(xiàn)等需求。 |
技術(shù)架構(gòu)調(diào)研 | 包含 | 包含 | |||
運維體系調(diào)研 | 包含 | 包含 | |||
監(jiān)控目標調(diào)研 | 包含 | 包含 | |||
業(yè)務(wù)目標調(diào)研 | 包含 | ||||
方案設(shè)計 | 可觀測技術(shù)架構(gòu)設(shè)計 | 包含 | 包含 | ||
數(shù)據(jù)采集方案 | 包含 | 包含 | |||
基礎(chǔ)設(shè)施觀測方案 | 包含 | 包含 | |||
應(yīng)用觀測方案 | 包含 | 包含 | |||
業(yè)務(wù)觀測方案 | 包含 | ||||
大盤展示方案 | 包含 | 包含 | |||
告警方案設(shè)計 | 包含 | 包含 | |||
方案驗證 | 基于設(shè)計方案的技術(shù)驗證 | 包含 | 包含 | ||
實施 | 基于方案設(shè)計實施可觀測實施落地 | 包含 | 包含 |
5. 服務(wù)SLA
提供云原生可觀測服務(wù)
在服務(wù)期間內(nèi)向客戶提供方案技術(shù)驗證支持群以及按需的現(xiàn)場保障
按對應(yīng)服務(wù)規(guī)格提供《云原生可觀測基礎(chǔ)方案》、《云原生可觀測標準方案》
6. 服務(wù)流程
云原生可觀測服務(wù)流程
7. 驗收標準
7.1 驗收分項清單
階段名稱 | 子階段名稱 | 任務(wù)名稱 | 子任務(wù)名稱 | 交付物名稱 |
項目調(diào)研 | 項目調(diào)研階段 | 現(xiàn)狀調(diào)研和評估 | 業(yè)務(wù)目標調(diào)研 | 無 |
技術(shù)架構(gòu)調(diào)研 | ||||
運維體系調(diào)研 | ||||
監(jiān)控目標指定 | ||||
應(yīng)用彈性現(xiàn)狀調(diào)研 | ||||
數(shù)據(jù)庫現(xiàn)狀調(diào)研 | ||||
方案設(shè)計 | 可觀測性方案設(shè)計 | 可觀測性架構(gòu)設(shè)計 | 可觀測性架構(gòu)設(shè)計 | 《可觀測性設(shè)計方案》 |
彈性架構(gòu)改造方案設(shè)計 | 彈性架構(gòu)方案設(shè)計 | 彈性架構(gòu)方案設(shè)計 | 《基于 ACK的彈性架構(gòu)方案》 《數(shù)據(jù)庫彈性架構(gòu)方案》 | |
方案落地驗證 | 方案落地驗證 | 技術(shù)驗證 | 方案落地驗證 | 無 |
改造實施 | 可觀測性配置落地 | 可觀測性架構(gòu)改造 | 可觀測性架構(gòu)改造 | 《可觀測性實施方案》 |
日志接入 | 針對各服務(wù)及需求范圍內(nèi)的日志進行接入 | |||
觀測大盤配置 | 基于監(jiān)控指標、日志信息、應(yīng)用信息配置監(jiān)控大盤,指標滿足設(shè)計需求 | |||
監(jiān)控告警配置 | 報警規(guī)則配置,報警渠道對接 | |||
彈性架構(gòu)改造支持 | 彈性架構(gòu)改造支持 | 彈性架構(gòu)改造支持 | 無 | |
護航與驗收 | 項目驗收 | 系統(tǒng)驗收 | 完成驗收 | 《系統(tǒng)驗收報告》 |
7.2 驗收標準
乙方項目交付過程中提供云原生可觀測方案設(shè)計與實施工作,并將關(guān)鍵信息記錄在文檔內(nèi),因此文檔類交付成果應(yīng)著重文檔實質(zhì)內(nèi)容的驗收,確認乙方提交內(nèi)容符合甲方需求。
若甲方業(yè)務(wù)流程要求在乙方提交交付成果前需進行各類內(nèi)部評審,甲方應(yīng)在約定的驗收時點前推動并及時完成其內(nèi)部所需評審和匯報。
文檔內(nèi)容經(jīng)過評審會,若需要修改,乙方修改后提請甲方進行驗收,由甲方指定的代表進行簽收確認。驗收在公共云服務(wù)系統(tǒng)頁面上點擊驗收確認按鈕。
7.3 驗收計劃
根據(jù)《7.1驗收分項清單》所列示各階段的交付內(nèi)容與交付物,本項目將按照以下驗收計劃進行項目驗收,甲方同意根據(jù)此驗收計劃對乙方的交付物進行驗收。
云原生可觀測服務(wù)基礎(chǔ)版驗收計劃
編號 | 驗收里程碑 | 驗收內(nèi)容 | 驗收完成標志 |
1 | 《云原生可觀測基礎(chǔ)版方案》設(shè)計與驗證完成 | 《云原生可觀測基礎(chǔ)版方案》 | 甲方在線確認驗收方案 |
云原生可觀測服務(wù)標準版驗收計劃
編號 | 驗收里程碑 | 驗收內(nèi)容 | 驗收完成標志 |
1 | 《云原生可觀測標準版方案》設(shè)計與驗證完成 | 《云原生可觀測標準版方案》 | 甲方在線確認驗收方案 |
8.完成標志
客戶驗收完成。