阿里云系統運維管理(CloudOps Orchestration Service, OOS),是阿里云提供的云上自動化運維服務,能夠自動化管理和執行任務。您可以通過模板來定義執行任務、執行順序、執行輸入和輸出,然后通過執行模板來完成任務的自動化運行。本文介紹如何使用系統運維管理OOS管理ECS。
應用場景
系統運維管理OOS常見的應用場景如下表所示:
場景 | 描述 |
事件驅動的自動化場景 | 當一個事件發生時,觸發一個運維動作。事件驅動場景可以提供主動運維支持,免去中間的人為因素,提高運維效率。 例如,當某臺ECS實例的vCPU使用率達到了85%時,為了防止業務中斷,可以通過系統運維管理OOS自動重啟ECS實例。 |
批量操作 | 批量地執行運維命令,即需要針對多個目標(如ECS實例)進行常規操作,以確保業務的正常和平滑運行,并保持業務的健康狀態。 例如,需要批量檢查ECS實例中的云盤剩余空間,您可以通過名稱匹配、標簽分組、資源組分組等方式選擇需要檢查的ECS實例列表,再使用云助手命令執行云盤檢查,并最終統一查看結果。 |
需要審批的場景 | 在很多場景下都需要使用審批來確保操作是安全并符合預期的。通過在模板中增加審批動作(ACS::Approve)可以在運維動作實際執行前進行人工審批,以確保運維動作執行的必要性,避免浪費和誤操作。 |
定時任務 | 定時執行所定義的運維動作。例如,使OSS定時開關機節省成本、自動定時重啟ECS云服務器等。 |
跨地域的運維場景 | 多地域部署已經成為了高可用(HA)架構的通用架構。隨之而來的跨地域運維卻變得越來越復雜,使用OOS可以幫助您解決跨地域的運維難題。您可以將不同地域的運維操作定義在一個模板內,即可實現跨地域的運維場景。 |
多地域的運維場景 | 當您在使用多個地域資源時,經常需要對它們進行同步操作,以便保持它們的一致性。例如,將對象存儲(OSS)的多個地域的存儲空間(Bucket)進行相同的操作——開啟日志功能。 |
系統運維管理OOS還可作為運維任務的標準化平臺,通過將運維手冊、操作手冊和維護手冊等轉化為模板,來實現運維即代碼(Operations as Code)。有關系統運維管理OOS更多場景詳情,請參見應用場景。
產品優勢
OOS可以幫助您更好地規范、管理和執行自動化運維操作,從而提高整體運維操作的效率、增強運維操作的安全性。系統運維管理具有以下優勢:
可視化的執行過程和執行結果
免費的全托管自動化
高效的批量管理
完備的鑒權和審計
快速模板構建能力
跨地域、多地域的運維能力
標準化運維任務(Operations as Code)
運維權限收斂(委托授權)
有關系統運維管理OOS產品優勢詳情,請參見產品優勢。
常見應用案例
系統運維管理OOS支持多種方式管理云服務器ECS,常見操作場景如下:
更多使用場景,請參見系統運維管理實踐教程。