監(jiān)控預警
成本監(jiān)控和預警有助于發(fā)現成本問題和成本優(yōu)化機會點,因此企業(yè)應該通過各種監(jiān)控工具對成本數據和資源數據進行有效監(jiān)控,并通過預警的方式通知到相關的運維人員或財務人員,從而對發(fā)現的問題或優(yōu)化機會進行跟蹤處理,避免預期外費用、優(yōu)化資源使用率,實現成本節(jié)約。
管理預算并預警
對云上成本進行預算管理是管控云上成本的有效手段,通過預算編制、預警和預測、滾動調整預算、預實分析和優(yōu)化,建立起基于預算的成本閉環(huán)管理鏈路。
企業(yè)可以使用預算管理工具進行事前的云上成本規(guī)劃與預算編制、事中預算監(jiān)控與預警通知、事后的預實對比分析。比如企業(yè)可以:
基于財務單元、產品、賬號等多種維度對成本進行多維度預算管理。
基于費用預算、使用率與覆蓋率預算、按量編制預算,對云資源產生的消費金額或者抵扣資源的使用率/覆蓋率情況進行預算跟蹤。
使用支持12個月的費用預測工具,為預算編制提供預測建議。
對實際費用和預測費用分別進行預警。
通過設置多條預警,根據不同閾值多次預警。
通過預實對比分析,及時發(fā)現預實差異產生的原因。
開啟異常檢測預警
因預期外的消費導致的費用超支是常見的成本失控情況,應該定期檢查消費項目是否都是基于實際業(yè)務需求。企業(yè)可以使用阿里云提供的異常檢測功能,及時地發(fā)現成本異常,并通過配套提供的根因參考信息,更快速地定位到問題發(fā)生原因,從而解決問題。
異常檢測通過人工智能算法實現,企業(yè)可以自定義異常檢測的靈敏程度,系統(tǒng)智能識別費用波動異常,從而實現自動監(jiān)控、發(fā)現和預警預期外異常費用。
監(jiān)控可用額度并預警
可用額度即用戶賬戶的可用金額,賬戶余額里會扣減掉被凍結或未來扣除的部分。如果是信控用戶,則信控的可用額度也會計算在可用額度內。建議企業(yè)開啟可用額度預警及時獲取可用額度的信息。
監(jiān)控高額消費并預警
企業(yè)應該監(jiān)控高額消費,并及時分析超額原因,使用高額消費預警工具對后付費產品日賬單超過預警閾值時(統(tǒng)計范圍為截止昨日24時的日賬單費用),進行預警。
監(jiān)控資源包使用額度
企業(yè)應該對抵扣資源設置額度預警。系統(tǒng)將根據用戶設置的額度預警提示用戶,以免發(fā)生抵扣資源不足的情況。自然月周期型和動態(tài)月周期型資源包和總量遞減型資源包,報警的規(guī)則如下分別為:
自然月周期型和動態(tài)月周期型資源包依據每周期保有總量,每周期按閾值提醒1次,每周期在用盡時提醒1次。總量遞減型資源包,存續(xù)周期內按閾值提醒1次;
監(jiān)控資源水位
對云資源的資源使用率監(jiān)控可以掌握云資源的消耗水位,對云資源水位過載,資源水位偏低,資源閑置等情況進行及時跟蹤,可以幫助企業(yè)更好的管理云資源的使用。在監(jiān)控的基礎上,企業(yè)可分析以往數據,有效預測云平臺容量未來變化,提前預警。
日常云資源使用監(jiān)控
需要日常建立對云資源水位的監(jiān)控,云上用戶可以使用云監(jiān)控 CMS(Cloud Monitor)的云產品監(jiān)控的能力,實時或者準實時觀測云資源的使用情況,同時也可以設置報警規(guī)則。
云資源高負載運行通常意味著可能需對云資源進行彈性擴容。企業(yè)需要對資源高負載運行的情況進行數據分析,看是否存在資源使用不當的情況,需要進行架構優(yōu)化或者代碼優(yōu)化如果資源消耗是正常的,則可以根據成本計劃階段制定的計劃和標準進行新增資源的審批,財務批準后進行資源擴容。
云資源低負載運行通常意味著低負載資源或者閑置資源,會造成資源的浪費,可以分析之后進行資源的縮容,縮容的操作應避免對業(yè)務產生影響,并在業(yè)務低峰期進行。
設置了計算資源彈性伸縮等規(guī)則的資源變更時間也要進行監(jiān)控,避免因為規(guī)則設置不當導致的過度擴容或者沒有及時的縮容,增加額外的成本。
對于閑置的,長時間沒有使用的計算資源要進行資源關停和釋放,對于不需要的存儲文件,如快照等也可以及時刪除,避免資源的持續(xù)浪費。
根據持續(xù)一段時間周期的監(jiān)控數據,評估可優(yōu)化的資源使用空間,通過監(jiān)控數據,可以觀測到存在忙時及閑時流量特性的場景,可指導企業(yè)采用靈活組合多種計費方式資源以節(jié)省成本。
使用企業(yè)級云監(jiān)控應對復雜的部署和使用場景
企業(yè)借助資源目錄輕松實現企業(yè)跨阿里云賬號資源的統(tǒng)一監(jiān)控。對于混合云場景,建議使用企業(yè)級云監(jiān)控立足云上,高效、低成本解決云下資源的監(jiān)控數據的匯聚,快速構建云上云下一體化監(jiān)控體系。使用智能水位分析報告工具可以使企業(yè)輕松獲取基于阿里云大數據的性能報告,采用人工智能算法深度分析產品使用狀態(tài)。
結合預算計劃監(jiān)控數據和資源監(jiān)控數據進行相關性分析
預算監(jiān)控數據可以幫助我們觀測資金的消耗,并關聯到相關的云產品的具體使用情況,結合云資源的監(jiān)控數據可以分析出資源消耗發(fā)生的時間點,事件,并采取相關的措施。設置預算計劃之后,需要跟蹤計劃周期內云資源開通和使用情況,云資源開通數量或者資源消耗低于預算計劃有可能是系統(tǒng)上線不及預期,或者項目停滯等多種原因,需要根據實際情況變更預算計劃。