成本優化最佳實踐
本文介紹云服務器ECS的成本構成和優勢,并提供成本管理的推薦方案,幫助您通過成本管理節約成本,在保障業務快速發展的同時按照預算支出費用,獲得最大成本收益。
成本構成
傳統企業IT基礎設施的成本構成情況,即總擁有成本TCO(Total Cost of Ownership),包括從產品采購到后期使用、維護的成本。您在評估IT基礎設施的時,實際評估的指標就是每單位IT基礎設施的TCO。對于TCO的核算需要基于您真實的業務部署環境變量,例如機柜租金、機柜使用電費、服務器品牌及價格、是否考慮規避單點失效可能性(雙設備、雙上蓮)等一系列前提條件下,得出TCO=服務器+網絡+IDC支出+其他開銷(人力、公網、額外稅費等)。
在這四大類IDC成本構成中,服務器采購和網絡建設部分都屬于資本性支出(CAPEX),需要您的企業采購后按照一定的周期進行折舊分攤,剩余的IDC支出(租金和電費等)及其他開銷大多數屬于運營成本(OPEX),根據資源使用的時間而持續地產生投入。從企業經營的角度來看,CAPEX一次性投入較大,業務不確定性較強,一次性投入后可再次進行調整的空間有限,如果發生需求變動,可能會導致已經支出的成本浪費。而OPEX支出穩定,比較適合應對業務調整而隨機應變,如果能將企業的CAPEX全部轉換為OPEX,則是企業面對不確定需求的更優解決方案。
云服務器ECS作為阿里云為您提供的云計算服務,為您提供云上計算資源,使用云服務器ECS替代掉您的傳統IT基礎設施,可以幫助您降低CAPEX,提高OPEX占比。一方面可以改善您企業的現金流狀況,另一方面可以提升企業抗風險能力。使用云服務器ECS時,成本主要包括以下兩個方面:
擁有成本:這部分成本涉及使用各類資源和資源包的費用。具體來說,包括但不限于:
實例規格費用
云盤容量費用
鏡像費用
公網帶寬費用
快照費用
運維成本:這部分成本指您在使用云服務器ECS過程中產生的人力成本。可能包括:
系統管理與維護
安全監控與防護
故障排查與修復
軟件更新與配置
上云的成本優勢
自建數據中心時,除硬件、網絡、電力、機房、人力運維成本等直接成本外,還需要考慮升級、擴容等帶來的規模成本,以及備份數據、實現高可用等帶來的風險成本。隨著業務發展擴大數據中心規模時,單位資源成本和數據中心復雜度會不斷增長,而且容錯率低。如果在業務變化時選型失誤,更會增加額外的支出。
相比自建數據中心,使用云上資源時無須投入硬件、物理環境、人力等成本,單位資源成本相對線性,所有資源按需取用,交付便利。除資源成本的優勢外,云上資源還支持多種付費模式,方便進一步優化成本。
成本優化建議
歸集成本
在費用與成本,您可以查看費用賬單中的信息了解消費情況,從多個維度追蹤成本并確定優化對象。
使用賬單的賬單概覽功能,查看賬號消費趨勢、產品消費分布等信息,把握整體消費情況。
使用資源組、標簽等功能,從業務、部門、項目等維度分類資源,以便統計相應成本。
使用賬單的賬單詳情功能,查看詳細的資源消費情況。通過設置的資源組和標簽,可以更細粒度地匯總各類資源的成本。
例如,創建標簽部門:研發
、部門:財務
、部門:IT
,并為ECS實例綁定標簽。在查看賬單詳情時,通過標簽篩選對應部門使用的資源,匯總成本以確定優化對象。
優化資源
發現成本偏高的資源后,您可以從多個角度監控資源的情況,確定成本偏高的原因,然后采取針對性的優化措施。
監控資源的使用情況。
監控資源利用率,評估當前配置是否過高。例如CPU、內存、云盤、帶寬等資源的利用率。
監控閑置的資源,避免浪費。例如升配但未重啟的實例、未匹配實例的預留實例券、未掛載的云盤、未關聯的EIP等。
監控資源使用周期。如果長期使用按量付費實例、云盤等資源,考慮以更實惠的方式購買,例如包年包月、資源包等。
監控資源生命周期,了解包年包月資源的到期日,及時續費。例如包年包月實例、預留實例券、存儲容量單位包等。
選擇合適的實例規格。
實例規格對云服務器ECS成本有較大影響,根據業務場景選擇性價比最佳的實例規格,并調整合適的數量。在滿足業務需求的同時追求高資源利用率,降低成本。
例如針對短視頻場景,目前使用d1ne.14xlarge(10臺),監控ECS實例發現內存使用率合理,但CPU相對空閑。因此可以采取以下方案:
適當降低CPU和內存比,滿足業務需求的同時提高CPU使用率。d1ne.14xlarge實例為1:4,d2s實例為1:4.4。使用d2s.10xlarge(13臺)替換d1ne.14xlarge(10臺),規格從14xlarge降為10xlarge,約節省18%的成本。
更多實例配置選型的介紹,請參見選型最佳實踐。
組合多種付費模式。
不同類型的業務對資源使用周期有不同要求。為每一類業務確定合適的付費模式,靈活組合達到最優效果。
針對穩定業務負載,使用包年包月、預留實例券。
針對有狀態且動態變化的業務負載,使用按量付費。
針對無狀態且可容錯的業務負載,使用搶占式實例。
利用專有宿主機DDH復用ECS實例資源。
針對CPU絕對穩定性要求不嚴苛的場景,例如開發測試環境,使用超分型DDH部署更多同等規格的ECS實例,降低單位部署成本。
部署在DDH上的ECS實例停機時不占用資源,您也可以在生產環境業務流量的低峰期停止部分ECS實例,使用生產環境的空閑資源運行可預期周期的測試任務,例如離線計算、自動化測試等。
升級換代
云服務器ECS的持續升級,加上處理器等硬件的更新換代,提高產品性能的同時,也降低了產品成本。通常情況,新實例規格性價比優于老實例規格。
例如,從g5.2xlarge升級到g6.2xlarge的性能和價格對比如下:
性能 | 價格 |
|
|
為保證您可以及時使用新一代實例規格,建議您:
設計的應用具備魯棒性,在不同實例規格上可以正常運行。
關注阿里云官網中實例規格的發布情況,及時評估是否需要更換。
升級換代示例
按照以下參考替換方案,保證CPU、內存配置相同的前提下,可以提升性能并至少節約15%的實例成本:
當前實例規格族 | 首選推薦 | 備選推薦 |
sn1、sn2 |
|
|
c4 | hfc6、c6 | hfc5、c5 |
ce4 | r6 | r5、se1ne |
cm4 | hfc6 | hfc5、g5 |
n1、n2、e3 |
|
|
|
|
|
具備節約意識
云上資源的一個特點是按需取用,避免了自建數據中心所需的高昂一次性投入。針對按需取用的特點,您需要將成本優化融入到日常工作中,持續推進才能獲得理想的優化成果。下面列舉幾個典型操作,您可以以此為模板進一步細化,形成貼合自身情況的方案。
定期召開成本會議。定期和成本相關方(例如財務、研發等團隊)評審預算執行情況,評估優化成果,改進優化策略。
強制使用標簽。利用標簽按業務、環境、責任人等維度標記資源,便于日常成本追蹤。
分類資源并定制合適的使用方式。例如針對短期項目的開發測試環境,優先選用按量付費實例部署,項目結束后及時釋放實例。
避免資源閑置。定期盤點資源使用情況,明確閑置資源的通知和處置流程。
及時續費。對包年包月資源,提前申請預算,避免到期釋放后重新購買部署增加額外成本。