調用SubmitIProductionJob提交智能生產任務。
調試
您可以在OpenAPI Explorer中直接運行該接口,免去您計算簽名的困擾。運行成功后,OpenAPI Explorer可以自動生成SDK代碼示例。
授權信息
下表是API對應的授權信息,可以在RAM權限策略語句的Action
元素中使用,用來給RAM用戶或RAM角色授予調用此API的權限。具體說明如下:
- 操作:是指具體的權限點。
- 訪問級別:是指每個操作的訪問級別,取值為寫入(Write)、讀取(Read)或列出(List)。
- 資源類型:是指操作中支持授權的資源類型。具體說明如下:
- 對于必選的資源類型,用背景高亮的方式表示。
- 對于不支持資源級授權的操作,用
全部資源
表示。
- 條件關鍵字:是指云產品自身定義的條件關鍵字。
- 關聯操作:是指成功執行操作所需要的其他權限。操作者必須同時具備關聯操作的權限,操作才能成功。
操作 | 訪問級別 | 資源類型 | 條件關鍵字 | 關聯操作 |
---|---|---|---|---|
ice:SubmitIProductionJob | create | *全部資源 * |
| 無 |
請求參數
名稱 | 類型 | 必填 | 描述 | 示例值 |
---|---|---|---|---|
Name | string | 否 | 任務名稱,長度不超過 100 字符。 | 測試任務 |
FunctionName | string | 是 | 需要使用的算法功能名稱。取值:
| Cover |
Input | object | 是 | 輸入媒體,支持 OSS 或媒資 ID。 不同算法功能 Input 輸入的文件要求不同,詳見下方補充說明。 | |
Type | string | 是 | 媒體類型:
| OSS |
Media | string | 是 | 輸入媒體,支持 OSS 地址和媒資 ID 兩種。 oss 地址規則為:(兩種形式選一種即可)
| oss://bucket/object |
Output | object | 是 | 輸出媒體,支持 OSS 或媒資 ID。 不同算法功能 Output 輸出的文件不同,詳見下方補充說明。 | |
Type | string | 是 | 媒體類型:
| OSS |
Media | string | 是 | 輸出媒體。當 Type 為 OSS 時填入 OSS 地址,Type 為 Media 時填入媒資 ID。 OSS 地址規則為:(兩種形式選一種即可)
說明
OSS 地址路徑支持占位符,如:oss://example-****/iproduction/{source}-{timestamp}-{sequenceId}.png。當前支持以下幾種占位符:
| oss://bucket/object |
TemplateId | string | 否 | 模板 ID | ****20b48fb04483915d4f2cd8ac**** |
JobParams | string | 否 | 算法作業參數,JSON 對象,不同算法對應參數內容不同。詳見補充說明。 | {"Model":"gif"} |
ScheduleConfig | object | 否 | 任務調度配置信息 | |
PipelineId | string | 否 | 管道 ID | 5246b8d12a62433ab77845074039c3dc |
Priority | integer | 否 | 取值范圍為 1 到 10,數值越小優先級越高。 | 6 |
UserData | string | 否 | 用戶自定義數據,獲取結果時原樣返回。長度不超過 1024 字節。 | {"test":1} |
ModelId | string | 否 | 算法模型 ID。如果為空,則選擇對應功能的默認模型(此參數保持為空即可,一般無需傳入,直接使用默認模型)。 當前有以下算法功能存在非默認模型可供選擇:
|
Input 和 Output 字段說明
Cover
輸入一個視頻文件,輸出若干張圖片(默認 3 張,需要通過占位符區分),格式為 png 或 gif(取決于 JobParams 中參數,生成靜態圖或動態圖)。
VideoDelogo
輸入一個視頻文件,輸出擦除圖標后的視頻(格式為 mp4)。
VideoDetext
輸入一個視頻文件,輸出擦除字幕后的視頻(格式為 mp4)。
CaptionExtraction
輸入一個視頻文件,輸出字幕文件(SRT 格式)。
VideoGreenScreenMatting
輸入一個視頻文件,輸出綠幕摳圖后的視頻(格式為 mp4 或 webm,取決于 JobParams 參數)。
FaceBeauty
輸入一個視頻文件,輸出美顏后的視頻(格式為 mp4)。
VideoH2V
輸入一個視頻文件,輸出橫轉豎后的視頻(格式為 mp4)。
MusicSegmentDetect
輸入一個音頻文件,輸出副歌檢測后的結果信息文件(Json 格式)。
AudioBeatDetection
輸入一個音頻文件,輸出節奏檢測后的結果信息文件(Json 格式)。
AudioQualityAssessment
輸入一個音頻文件,無輸出文件。音質檢測結果放在 QueryIProductionJob 中直接返回。
SpeechDenoise
輸入一個音頻文件,輸出降噪后的音頻(格式為 wav)。
AudioMixing
輸入一個待混音的音頻文件,輸出混音后的音頻(格式為 wav)。混入的音頻文件如何輸入詳見下面的 JobParams 參數。
MusicDemix
輸入一個音頻文件(歌曲),輸出聲伴分離后的兩個音頻(Output 路徑中需要傳入{resultType}占位符,分別代表人聲和背景聲)。
JobParams 的 JSON 字段說明
Cover
- Model:String 類型,智能封面模型,為空時輸出圖片封面,為 gif 時輸出動圖封面。
VideoDelogo
- LogoModel:String 類型,去除的 logo 類型,取值:tv(通用臺標 - 電視臺),internet(通用臺標 - 網絡媒體),該字段可多選,通過逗號分隔。
- Boxes:String 類型,目標 logo 框位置,以左上角為原點的歸一化距離,[xmin, ymin, width, height],目前最多支持兩個目標 logo 框,例如:"[[0, 0, 0.3, 0.3], [0.7, 0, 0.3, 0.3]]"。
VideoDetext
- LimitRegion:list 類型,限定字幕檢測區域,以左上角為原點的歸一化距離,[xmin, ymin, width, height],可支持多個檢測區域,例如:[[0, 0, 0.3, 0.3], [0.7, 0, 0.3, 0.3]]。注意,不設置該參數時,默認檢測區域為視頻下方 30%區域。
- Time:指定全局擦除時間(單位 s),list 類型,包括起始時間和結束時間,[start_time, end_time],例如[[5, 20],表示只擦除視頻的 5~20 秒之間的字幕。
CaptionExtraction
- fps:采樣幀率(可選),整數,取值范圍為[2,10],默認 5。
- roi:字幕框選區域(只對區域內的字幕進行提取),格式:[[top, bottom], [left, right]],為歸一化取值(如下半部分[[0.5, 1], [0, 1]])。不傳此值,默認識別視頻底部 1/4 區域。
- lang:識別語言,ch(中文)、en(英文),ch_ml(中英混合)。默認 ch。
- track:如果傳"main",表示只提取主字幕軌道。不傳時,默認提取區域內出現的所有字幕。
VideoGreenScreenMatting
- bgimage:摳圖后疊加的背景圖片,例如:http://example-image-****.example-location.aliyuncs.com/example/example.jpg。如果不傳該參數,則輸出帶透明通道的 WEBM 視頻。
FaceBeauty
- beauty_params:美顏功能參數,填寫示例: "whiten=20,smooth=50,face_thin=50",詳見參數字段說明
VideoH2V
無
MusicSegmentDetect
無
AudioBeatDetection
無
AudioQualityAssessment
無
SpeechDenoise
輸入音頻要求:格式需為 WAV,采樣率為 16khz 或 48khz。
AudioMixing
- inputs:待混合的音軌文件地址列表,目前只支持一個,例如:{"file":"http://example-bucket-****.oss-cn-shanghai.aliyuncs.com/2.mp4"}
MusicDemix
無
返回參數
示例
正常返回示例
JSON
格式
{
"RequestId": "C1849434-FC47-5DC1-92B6-F7EAAFE3851E",
"JobId": "****20b48fb04483915d4f2cd8ac****"
}
錯誤碼
訪問錯誤中心查看更多錯誤碼。
變更歷史
變更時間 | 變更內容概要 | 操作 |
---|---|---|
2022-07-13 | 新增 OpenAPI | 查看變更詳情 |