在Serverless集群中提交作業(yè)
創(chuàng)建Serverless集群后,您可以在集群中提交作業(yè),系統(tǒng)會自動創(chuàng)建ECI實例來運行作業(yè)。本文介紹如何在Serverless集群中提交作業(yè)。
背景信息
在Serverless集群中提交作業(yè)后,系統(tǒng)會自動創(chuàng)建ECI實例來運行作業(yè)。一個ECI實例主要包含以下幾部分配置:
規(guī)格:可以指定ECI規(guī)格(直接指定vCPU和內(nèi)存),也可以指定ECS規(guī)格來滿足GPU、增強網(wǎng)絡(luò)能力等特殊需求。兩種方式對應(yīng)的計費方式不同,具體請參見ECI實例計費。
容器:Serverless集群中的ECI實例包含1個容器,部署容器前,您需要將業(yè)務(wù)所需的環(huán)境、數(shù)據(jù)等打包制作成容器鏡像,并上傳到阿里云ACR中。
網(wǎng)絡(luò):一個ECI實例將占用所屬VPC下的交換機的一個彈性網(wǎng)卡資源,默認具備一個內(nèi)網(wǎng)IP地址。如果有連接公網(wǎng)的需求,需要您為VPC綁定NAT網(wǎng)關(guān)。
存儲:默認提供30 GiB的臨時存儲空間,您可以根據(jù)需要增加臨時存儲空間。如果需要持久化存儲,可以掛載NAS或者OSS。
前提條件
已創(chuàng)建Serverless集群。具體操作,請參見創(chuàng)建Serverless集群。
已準備好容器鏡像并上傳至阿里云容器鏡像服務(wù)ACR。
支持ACR個人版和企業(yè)版實例。相關(guān)參考如下:
如果數(shù)據(jù)需要持久化存儲,支持掛載OSS存儲空間和NAS文件系統(tǒng)。
使用NAS時,需創(chuàng)建NAS文件系統(tǒng)和掛載點。具體操作,請參見創(chuàng)建文件系統(tǒng)和添加掛載點。
使用OSS時,需創(chuàng)建OSS Bucket。具體操作,請參見創(chuàng)建存儲空間。
操作步驟
打開作業(yè)頁面。
登錄彈性高性能計算控制臺。
在頂部菜單欄左上角處,選擇地域。
在左側(cè)導(dǎo)航欄,選擇作業(yè)與性能管理>作業(yè)。
在作業(yè)頁面上方的集群下拉列表處,選擇Serverless集群。
單擊提交作業(yè)頁簽。
完成作業(yè)參數(shù)配置,然后單擊提交作業(yè)。
提交作業(yè)時需要配置ECI實例相關(guān)參數(shù)和作業(yè)相關(guān)參數(shù)。系統(tǒng)會根據(jù)配置自動創(chuàng)建ECI實例來運行作業(yè)。
說明如果想要使用類似的參數(shù)提交新的作業(yè),您可以單擊導(dǎo)出作業(yè)配置將當前配置保持到本地文件中。再次提交作業(yè)時,單擊導(dǎo)入作業(yè)配置即可快速導(dǎo)入配置,提供工作效率。
參數(shù)
說明
作業(yè)名
作業(yè)名稱。
交換機
ECI實例所屬交換機。
鏡像 URL
已搭建好環(huán)境的容器鏡像上傳到ACR的鏡像地址,用于部署容器。
啟動job array
是否啟用調(diào)度器的job array功能。
job array功能用于批量提交和管理相似的作業(yè)。啟用后,需配置作業(yè)陣列長度的最小值、最大值和步長。最小值是第一個索引,最大值是最后一個索引,步長為間隔,默認是1。假設(shè)最小值為2,最大值為7,步長為2,則生成的job array包含編號為2,4,6的3個子作業(yè)。
作業(yè)優(yōu)先級
作業(yè)運行的優(yōu)先級,取值范圍0~9,取值越大,優(yōu)先級越高。
臨時存儲
ECI實例增加的臨時存儲空間大小。單位:GiB。
每個ECI實例默認有30 GiB空間可用于臨時存儲,如果無法滿足您的需求,可以自定義增加。增加的空間按照容量大小計費,具體請參見臨時存儲空間計費。
超時時間
作業(yè)的有效期限,超出該時間后,作業(yè)會強制終止。單位為秒。
搶占式策略
是否創(chuàng)建搶占式實例類型的ECI實例。
不使用搶占式實例:默認,使用正常按量付費實例。
設(shè)置上限價格的搶占式實例:自定義設(shè)置每小時最高價格。
系統(tǒng)自動出價,最高按量付費價格:系統(tǒng)自動出價,跟隨當前市場實際價格,最高不會超出按量付費價格。
更多信息,請參見創(chuàng)建搶占式實例。
CPU
采用指定vCPU和內(nèi)存的方式創(chuàng)建ECI實例時,ECI實例的vCPU和內(nèi)存。如果沒有指定,默認創(chuàng)建2 vCPU,4 GiB內(nèi)存的ECI實例。更多信息,請參見指定vCPU和內(nèi)存創(chuàng)建實例。
Memory
GPU
指定GPU規(guī)格創(chuàng)建ECI實例時,需要配置該參數(shù)指定容器內(nèi)使用的GPU數(shù)。
工作路徑
容器工作目錄。默認在此目錄下執(zhí)行命令。
實例規(guī)格
采用指定ECS規(guī)格的方式創(chuàng)建ECI實例,ECI實例對應(yīng)的ECS規(guī)格。更多信息,請參見指定ECS規(guī)格創(chuàng)建實例。
啟動命令
容器啟動命令。格式要求如下:
單個命令不帶參數(shù):直接輸入命令,例如
ls
。單個命令帶參數(shù):命令和參數(shù)之間用半角逗號分隔,例如
ls,l
。多個命令順序執(zhí)行:必須使用Shell執(zhí)行的方式,通過半角逗號分隔命令和參數(shù),通過分號分隔命令,例如
/bin/sh,-c,ls -l;hostname
。
RAM角色
ECI實例綁定的RAM角色。更多信息,請參見使用實例RAM角色。
作業(yè)變量
容器的環(huán)境變量值。
數(shù)據(jù)卷掛載
容器掛載的數(shù)據(jù)卷。支持OSS和NAS。
OSS
Volume Mount Path:掛載到容器的目錄。
OSS Bucket Name:OSS Bucket的名稱。
OSS Endpoint:OSS的接入域名。Bucket和集群屬于相同地域時,請使用內(nèi)網(wǎng)地址;Bucket和集群屬于不同地域時,請使用外網(wǎng)地址。
OSS Path:要掛載的OSS目錄。
RAM Role:使用RAM角色授權(quán)時,對應(yīng)的RAM角色。創(chuàng)建RAM角色時,可信實體類型為阿里云服務(wù),角色類型為普通服務(wù)角色,受信服務(wù)為云服務(wù)器;為角色授權(quán)時,請選擇AliyunOSSFullAccess權(quán)限策略。
NAS
Volume Mount Path:掛載到容器的目錄。
NAS Mount Target:NAS的掛載點地址。
NAS Path:要掛載的NAS目錄。
Mount options:掛載選項。建議使用默認填寫的
nolock,tcp,noresvport
。
作業(yè)依賴
該作業(yè)是否依賴于其他作業(yè)。如果有前后關(guān)聯(lián)關(guān)系,可添加作業(yè)依賴,填寫依賴的作業(yè)ID并選擇依賴關(guān)系。
相關(guān)操作
提交作業(yè)后,您可以查看作業(yè)詳情,以及生成的ECI資源。
在彈性高性能計算控制臺的作業(yè)頁面,選擇目標集群后,單擊作業(yè)列表頁簽。在該頁面可以設(shè)置狀態(tài)、時間段等條件查詢作業(yè)信息。
在彈性容器實例控制臺的容器組頁面,可以查看自動創(chuàng)建的用于運行作業(yè)的ECI實例。