基于Pod的容量預留為彈性業務形態提供資源確定性保障。GPU Pod容量預留不需要直接綁定集群,您只需要購買時指定Pod規格、可用區、鎖定時間等屬性,ACS會保證在需要資源時,分鐘級啟動相應規格的Pod。通過GPU Pod容量預留,可以保障資源確定性,同時Pod預留價格相比于按量付費Pod更低。本文介紹GPU Pod容量預留的功能和特點。
功能特點
資源確定性:在GPU Pod容量預留生效期間,系統保障資源成功拉起。
降低成本:Pod拉起后按照按量價格收費,Pod銷毀后按照容量預留價格收費,您可以根據業務流量靈活配置Pod拉起和銷毀時間點。
資源靈活性:可以創建多種不同規格的GPU Pod容量預留,以滿足不同業務的需求。
GPU Pod容量預留不支持為BestEffort算力類型的Pod提供保障。
GPU Pod容量預留支持地域、類型等屬性相匹配的節省計劃。
GPU Pod容量預留根據庫存情況反饋創建是否成功。
使用場景
周期性實時業務的資源需求:業務在每天/每周的周期中呈現"潮汐"特征,任務需要保證實時執行和完成。例如實時推理業務等。
偶發性的大量資源需求:業務中存在突發性的實時計算需求,需要保證資源的快速交付和擴容,避免對業務的影響。例如互聯網業務中的熱點事件引發的資源需求等。
使用與計費示例
GPU Pod容量預留是按量付費方式。在容量預留生效期間,支付費用包括:
未使用的容量預留按量費用。
啟動Pod的按量費用。
本文以購買兩個GPU Pod容量預留并分別創建按量付費Pod1和按量付費Pod2的業務場景為例,展示使用流程以及不同階段的計費算法,如下圖所示。
階段1:購買創建容量預留
在容器計算服務控制臺中,選擇資源管理 > 創建GPU資源預留,配置容量預留參數,單擊創建。
配置項 | 說明 |
容量預留名稱 | 用戶自定義容量預留名稱。 |
地域 | 需要預留資源的地域。 |
可用區 | 需要預留資源的可用區。 |
預留類型 | GPU卡型。 |
資源規格 | 容量預留的Pod規格。 |
預留方式 | Pod預留(不可修改)。 |
計費模式 | 按量付費(不可修改)。 |
釋放方式 | 默認釋放容量預留的時間。 |
數量 | 此規格GPU Pod容量預留的數量。 |
對應階段的費用算法如下:
階段 | 費用 | 說明 |
階段1 | 無 | 未創建容量預留 |
階段2-6:容量預留生效期
在生效期內,您可以隨時創建與預留配置相同的Pod實例,系統保證創建成功,同時扣除對應數量的容量預留額度。Pod銷毀后,相應配置的GPU Pod容量預留額度會同時恢復。
對應階段的費用算法如下:
階段 | 費用 |
階段2 | 2×容量預留單價×階段2時長 |
階段3 | 1×容量預留單價×階段3時長+ Pod1按量單價×階段3時長 |
階段4 | Pod1按量單價×階段4時長+ Pod2按量單價×階段4時長 |
階段5 | 1×容量預留單價×階段5時長+ Pod2按量單價×階段5時長 |
階段6 | 2×容量預留單價×階段6時長 |
其中容量預留單價為未使用的容量預留按量費用,Pod1和Pod2的按量單價以Pod啟動后的按量費用計算。
當您創建的Pod規格與預留配置不同時,ACS將采用按量的方式直接進行創建,不會使用當前的容量預留,Pod創建狀態會根據庫存情況實時反饋。
階段7:容量預留到期
容量預留到期后,系統會自動釋放GPU Pod容量預留。