云上成本管理框架
“云成本管理與優化”不是一蹴而就的項目,是一個涵蓋企業上云用云全生命周期,關系到企業內部管理機制的體系化工程,是一個反復迭代和持續運營的過程。
根據FinOps官網《What is FinOps》的描述,“FinOps 是一種不斷發展的云財務管理學科和文化實踐,通過幫助工程師、財務、技術和業務團隊協作制定數據驅動的支出決策,使組織能夠獲得最大的業務價值。”
FinOps 是“Finance”和“DevOps”的合成詞,強調業務團隊與工程師團隊之間的溝通和協作。
FinOps通過Inform、Optimize、Operate三個生命周期階段實現云成本的可視、優化與持續運營,鼓勵實踐6大FinOps原則,將眾多FinOps能力劃分為6大領域,最終通過Crawl(爬行)、Walk(行走)、Run(奔跑)3個程度來衡量實踐的成熟度。
“FinOps”在行業中常見的別名有 “云成本管理(cloud cost management)”、“云成本優化(cloud cost optimization) ”、 “云財務管理(cloud financial management)”等。
阿里云云成本管理與優化框架
阿里云在FinOps核心理念基礎上,融合自身實踐經驗,提出更加細化落地的本土化“云上成本管理實施框架”,供企業客戶參考實施。
云上成本管理貫穿上云用云全生命周期
從企業上云及用云的歷程看,大致可以分為用云計劃、用云執行、監控分析、成本優化等階段,成本管理貫穿各個階段,每個階段的關注點各有不同。
用云計劃階段:場景包括企業首次上云、增量上云、存量復購。
做好組織規劃:包括企業上云的組織架構梳理、賬號體系規劃、權限體系規劃、企業權益(如優惠、信控)的規劃、資金結算關系的規劃。
做好財務規劃:包括預算編制與規劃、財務資產規劃(如現金、代金券)、成本規劃(如成本權責、分攤規則)、對云服務商的計費方式進行了解和選型(如按量付費、節省計劃、搶占式實例、資源包等)。
做好資源規劃:包括標簽規劃、資源容量規劃、資源配額規劃。
用云執行階段:場景包括采購執行、用云管云規則執行(包括財務規則設置、資源配額設置等)、商務履約執行(包括對賬、充值、開票等)。在用云執行階段,從財務管理和資源管理兩個視角做好成本管理。
財務管理視角:要做好資金、賬單、發票的統一管理,并借助云服務商提供的企業級財務管理能力,實現跨組織多賬號的統一結算管理和財務資產管理,為了后續監控分析的成本可看清,要通過財務單元做好成本分賬規則的設置。
資源管理視角:選擇合適的技術選型和資源規格進行采購,可以借助云服務商提供的資源保障和容量預定等能力確保資源的有效獲取,并通過配額設置實現企業云資源采購管控。
監控分析階段:對應FinOps的Inform階段,主要解決成本分攤與成本可視化問題。
成本分攤:借助平臺能力和前序階段配置的分攤規則實現成本的有效分攤(包括攤銷、分賬等),是監控、分析甚至優化的前提。
成本監控:通過多種監控手段對成本和資源數據進行監控,并有效預警通知給相關人員,監控手段通常分為兩類,基于業務規則(比如基于預算、成本金額、資源使用率等人為設定閾值的預警)和基于人工智能算法(比如無需人為設定閾值、由算法智能識別的異常檢測等)。
成本可視化:通過監控預警感知到成本變化時,借助多種可視化工具進行成本分析,找到問題點或優化機會,常見的可視化分析工具包括各類成本或資源報表、預算與實際的對比分析、多維成本統計分析工具等,也可借助成本預測算法觀察未來趨勢。
成本優化階段:對應FinOps的Optimize階段,主要通過計費方式優化、資源使用優化和架構優化來落地執行。
計費方式優化:云服務商通常提供多種計費方式,通過切換不同的計費方式,可以獲取到更低的實際折扣、或提升權益資產的使用效率,從而實現成本節約。常見的如按量付費搭配節省計劃,可以通過承諾更長時間的消費,獲取更低價格;購買合適的資源包,也可以抵扣按量付費流量,從而節約成本。可以借助平臺提供的測算工具,對比已購買和未購買的計費方式,切換為更加合適的計費方式。
資源使用優化:優化云資源的使用率,是實現成本優化的有效手段。常見的方法有釋放閑置資源、降配低負載資源、升配高負載資源、彈性擴縮容等,通常借助資源監控工具發現優化機會,并結合業務特性、性能、成本等綜合考慮后謹慎執行。更多策略方法詳見下文。
持續運營:云上成本管理是一個反復迭代和持續運營的過程,企業應持續循環以上四個階段,形成長效運作機制,使云上成本可以有效管控、持續優化。
人員、工具和機制是云上成本管理的關鍵要素
人員是基礎,業務、財務和技術須協同運作
云成本管理團隊是企業實施云成本管理的基礎。云成本管理不是某一個角色或某一個團隊需要做的事情,而是需要多個角色共同參與,打破原有各管一段,各自為戰的傳統 IT 管理方式,各角色長期協作共同努力以達到成本長期治理的目標。云成本管理團隊需要宣傳云成本管理意識和文化,推動云成本管理最佳實踐,確定企業云成本管理的方向,協調企業各部門開展成本管理工作。比如,可以定期舉行成本管理會議, 回顧和復盤成本管理中遇到的一些問題,從而推動持續改進。
企業組建云成本管理團隊需要滿足以下三個條件:
人員構成須跨職能:云成本管理團隊應由企業各個部門如財務部門、IT 部門、運營部門和業務部門等利益相關者共同組成。
知識體系須完備:成本管理團隊需要具有多學科方法,具備項目管理、數據科學、財務分析和軟件/基礎設施開發等能力,可以對照成本優化目標來衡量各部門的執行和交付能力。
管理層須認可與支持:管理層要成為云成本管理理念的倡導者,為云成本管理團隊提供支持,確保按組織確定的優先級開展成本管理活動,確保企業在有效利用云資源的同時,持續創造業務價值。
工具是抓手,監控、分析與調優是必備能力
云成本優化工具是企業實施云成本管理與優化的抓手。云成本管理是一個復雜而耗時的過程,需要將各項能力沉淀到工具。一方面,由于云成本的可變性和多云環境的復雜性,云成本優化基于分析結果和優化策略之上并非所有操作都適合人工完成,企業通過工具可以有效提升對云成本的管理及優化水平。另一方面,成本優化往往是以項目方式實施,由項目制驅動轉為體系化的日常自助優化尤為重要。因此,需要將成本管理的能力沉淀為工具或平臺,構建可度量指標,驅動實際各相關組織自助降本。
機制是保障,成本意識和獎罰機制雙輪驅動
云成本管理相應的長效運營機制在云成本管控中起到關鍵作用,面對云成本特殊的支出模式和賬單結構,企業需要更新一套更加合適的云成本管理流程制度確保優化工作能夠在企業內部精確、高效運轉。云成本管理流程制度包含三個方面:
對企業內部云成本進行權限管控,包含支出采購、 分配修改等。
對企業云資源各采購賬號進行體系管理,包含賬單核算、托管代付等。
對企業各類資源或成本進行統一的配額和預算管理,包含資源開通、支出審批等。
企業可以通過提高成本意識和建立獎懲制度來落實云成本管理制度。 企業內部云成本日常運維的主要動力和保障來源于云成本管理制度,一是云成本管理團隊需要宣傳云成本管理意識和文化,推動云成本管理最佳實踐,確定企業云成本管理的方向,協調企業各部門開展成本管理工作。二是建立 KPI 獎罰制度,云成本管理作為績效考核的項目覆蓋所有相關部門, 根據實際情況合理設置優化目標,如資源閑置率、成本節省額度等,對各部門資源使用進行統一價值量化,按照周期內優化成果進行適當獎罰措施。