創(chuàng)建PAI-EAS服務(wù)。
接口說(shuō)明
請(qǐng)確保在使用該接口前,已充分了解 EAS 產(chǎn)品的收費(fèi)方式和價(jià)格。
調(diào)試
您可以在OpenAPI Explorer中直接運(yùn)行該接口,免去您計(jì)算簽名的困擾。運(yùn)行成功后,OpenAPI Explorer可以自動(dòng)生成SDK代碼示例。
授權(quán)信息
下表是API對(duì)應(yīng)的授權(quán)信息,可以在RAM權(quán)限策略語(yǔ)句的Action
元素中使用,用來(lái)給RAM用戶或RAM角色授予調(diào)用此API的權(quán)限。具體說(shuō)明如下:
- 操作:是指具體的權(quán)限點(diǎn)。
- 訪問(wèn)級(jí)別:是指每個(gè)操作的訪問(wèn)級(jí)別,取值為寫入(Write)、讀取(Read)或列出(List)。
- 資源類型:是指操作中支持授權(quán)的資源類型。具體說(shuō)明如下:
- 對(duì)于必選的資源類型,用背景高亮的方式表示。
- 對(duì)于不支持資源級(jí)授權(quán)的操作,用
全部資源
表示。
- 條件關(guān)鍵字:是指云產(chǎn)品自身定義的條件關(guān)鍵字。
- 關(guān)聯(lián)操作:是指成功執(zhí)行操作所需要的其他權(quán)限。操作者必須同時(shí)具備關(guān)聯(lián)操作的權(quán)限,操作才能成功。
操作 | 訪問(wèn)級(jí)別 | 資源類型 | 條件關(guān)鍵字 | 關(guān)聯(lián)操作 |
---|---|---|---|---|
eas:CreateService | create | *Service acs:eas:{#regionId}:{#accountId}:service/* |
| 無(wú) |
請(qǐng)求語(yǔ)法
POST /api/v2/services HTTP/1.1
請(qǐng)求參數(shù)
名稱 | 類型 | 必填 | 描述 | 示例值 |
---|---|---|---|---|
body | string | 否 | 請(qǐng)求 body。其中關(guān)鍵請(qǐng)求參數(shù)配置說(shuō)明,請(qǐng)參見(jiàn)下方的表 1. 請(qǐng)求 Body 參數(shù)和表 2. metadata 參數(shù)。更多參數(shù)配置詳情,請(qǐng)參見(jiàn)服務(wù)模型所有相關(guān)參數(shù)說(shuō)明。 | 鏡像部署服務(wù): { "name": "foo", "metadata": { "instance": 2, "memory": 7000, "cpu": 4 }, "containers": [ { "image": "****", "script": "**** --listen=0.0.0.0 --server_port=8000 --headless", "port": 8000 } ], "storage": [ { "oss": { "path": "oss://examplebuket/data111/", "readOnly": false }, "properties": { "resource_type": "model" }, "mount_path": "/data" } ] } 鏡像部署AI-Web應(yīng)用: { "name": "foo", "metadata": { "instance": 1, "memory": 7000, "cpu": 4, "enable_webservice": true }, "containers": [ { "image": "****", "script": "**** --listen=0.0.0.0 --server_port=8000 --headless", "port": 8000 } ], "storage": [ { "oss": { "path": "oss://examplebucket/data111/", "readOnly": false }, "properties": { "resource_type": "model" }, "mount_path": "/data" } ] } 模型+processor部署服務(wù): { "metadata": { "instance": 1, "memory": 7000, "cpu": 4 }, "name": "foo", "model_config": {}, "processor_type": "python", "processor_path": "oss://****", "processor_entry": "a.py", "model_path": "oss://****" } |
Develop | string | 否 | 是否進(jìn)入開(kāi)發(fā)模式。 枚舉值:
| true |
Labels | object | 否 | 用戶自定義標(biāo)簽。 | |
string | 否 | 標(biāo)簽。 | {"key":"value"} | |
WorkspaceId | string | 否 | 工作空間 ID。 | 123456 |
表 1. 請(qǐng)求 Body 參數(shù)
名稱 | 類型 | 是否必選 | 說(shuō)明 |
---|---|---|---|
name | String | 是 | 服務(wù)名稱,在同一個(gè)地域內(nèi)全局唯一。 |
token | String | 否 | 指定用于訪問(wèn)鑒權(quán)的 Token 字符串,若不指定則按generate_token自動(dòng)生成。 |
model_path | String | 否 | 模型相關(guān)的文件,支持 HTTP 和 OSS 兩種格式,HTTP 地址需為 Public 可訪問(wèn)的。若為 OSS 地址,則輸入可以是目錄或者文件;若文件為.tar.gz 、.tar.bz2 、.zip 等壓縮包,會(huì)自動(dòng)解壓。 |
role_arn | string | 否 | model_path或processor_path為 OSS 地址時(shí),需要指定用于 OSS 授權(quán)的 role_arn,role_arn 的獲取參數(shù) Role_ARN。 |
oss_endpoint | String | 否 | model_path或processor_path為 OSS 地址時(shí),需要指定 OSS Bucket 對(duì)應(yīng)的 endpoint。 |
model_entry | String | 否 | 模型的入口文件,若不指定,則使用model_path中的文件名,可以包含任意文件,主文件的路徑會(huì)傳遞給 Processor 中的Load() 函數(shù)。 |
processor_path | String | 是 | Processor 相關(guān)的文件包,支持本地文件和 HTTP 鏈接地址,若文件為.tar.gz 、.tar.bz2 、.zip 等壓縮包,會(huì)自動(dòng)解壓。 |
processor_entry | String | 否 | C、C++、Python 類型必選。Processor 的主文件,其中包含了預(yù)測(cè)所需要Load() 函數(shù)和Process() 函數(shù)的實(shí)現(xiàn)。 |
processor_mainclass | String | 否 | Java 類型必選。Processor 的主文件,JAR 包中的 mainclass。 |
processor_type | String | 是 | processor 實(shí)現(xiàn)的語(yǔ)言,目前已支持 C、C++、Java、Python。 |
metadata | Dict | 否 | 服務(wù)的 meta 信息。詳見(jiàn)下表 2。 |
cloud | Dict | 否 | 目前只有指定機(jī)型部署時(shí)會(huì)用到,傳參的樣式為"cloud":{"computing":{"instance_type": "ecs.gxxxxxx.large"}} 。 |
containers | List | 否 | 自定義鏡像部署。如果 Processor 部署無(wú)法滿足需求,可以使用自定義鏡像部署,詳情請(qǐng)參見(jiàn)服務(wù)部署:自定義鏡像。 |
說(shuō)明
model_path 和 processor_path 為輸入模型數(shù)據(jù)和 processor 數(shù)據(jù)的數(shù)據(jù)來(lái)源,支持 HTTP 和 OSS 兩種數(shù)據(jù)源,使用 test 命令進(jìn)行本地調(diào)試時(shí)支持本地文件和目錄。
- 若使用 HTTP 地址,則需要將相關(guān)文件打包成.tar.gz、.tar.bz2、.zip 等壓縮包,可上傳至 OSS 并生成 HTTP 地址。
- 若使用 OSS 地址,則輸入可以是目錄,也可以是文件。
表 2. metadata 參數(shù)
名稱 | 類型 | 是否必選 | 描述 | 示例值 |
---|---|---|---|---|
instance | Int | 否 | 服務(wù)啟動(dòng)的 Worker 數(shù)目。 | 1 |
cpu | Int | 否 | 每個(gè) Worker 需要的 CPU 數(shù)目。 | 1 |
gpu | Int | 否 | 每個(gè) Worker 需要的 GPU 數(shù)目。 | 0 |
memory | Int | 否 | 每個(gè) Worker 需要的內(nèi)存大小,單位為 MB。 | 1000 |
resource | String | 否 | 服務(wù)所屬的資源組。 | eas-r-aaabbbccc |
rpc.worker_threads | Int | 否 | 每個(gè) Instance 中用于并發(fā)處理請(qǐng)求的線程數(shù)。 | 5 |
rpc.max_queue_size | Int | 否 | 請(qǐng)求處理時(shí)隊(duì)列的最大長(zhǎng)度,隊(duì)列滿時(shí)新請(qǐng)求會(huì)被以 450 狀態(tài)碼丟棄。 | 64 |
rpc.keepalive | Int | 否 | 請(qǐng)求的超時(shí)時(shí)間,單位為毫秒。 | 5000 |
rpc.rate_limit | Int | 否 | 單實(shí)例請(qǐng)求限流的 QPS 值,單實(shí)例 QPS 超出該值后的請(qǐng)求會(huì)被返回 429 丟棄。 | 0 |
release | Bool | 否 | 若為 true,則要?jiǎng)?chuàng)建一個(gè)灰度發(fā)布服務(wù)。 | false |
返回參數(shù)
示例
正常返回示例
JSON
格式
{
"RequestId": "40325405-579C-4D82****",
"ServiceId": "eas-m-aaxxxddf",
"ServiceName": "yourname",
"Status": "Creating",
"Region": "cn-shanghai",
"InternetEndpoint": "http://pai-eas.vpc.cn-shanghai.****",
"IntranetEndpoint": "http://pai-eas.cn-shanghai.****"
}
錯(cuò)誤碼
訪問(wèn)錯(cuò)誤中心查看更多錯(cuò)誤碼。
變更歷史
變更時(shí)間 | 變更內(nèi)容概要 | 操作 |
---|---|---|
2023-09-01 | OpenAPI 入?yún)l(fā)生變更 | 查看變更詳情 |
2023-01-04 | OpenAPI 入?yún)l(fā)生變更 | 查看變更詳情 |