LVM-視頻文本生成(DLC)
LVM-視頻文本生成(DLC)組件主要用于生成視頻(僅支持處理MP4格式的視頻)文本。
支持的計算資源
算法說明
通過采樣若干視頻幀,由VideoBLIP模型基于視頻幀生成視頻文本。
輸入/輸出
輸入樁
通過讀OSS數(shù)據(jù)組件,讀取訓練數(shù)據(jù)所在的OSS路徑。
配置此算法參數(shù)視頻數(shù)據(jù)OSS路徑,選擇視頻數(shù)據(jù)所在的OSS目錄,或視頻元數(shù)據(jù)文件。詳情請參見下文中的參數(shù)說明。
使用任意LVM數(shù)據(jù)處理(DLC)組件作為輸入。
輸出樁
輸出結果。詳情請參見下文中的參數(shù)說明。
配置組件
在Designer工作流頁面添加LVM-視頻文本生成(DLC)組件,并在界面右側配置相關參數(shù):
參數(shù)類型 | 參數(shù) | 是否必選 | 描述 | 默認值 | |
字段設置 | 視頻數(shù)據(jù)OSS路徑 | 否 | 首次運行時,若無上游組件,需手動選擇視頻數(shù)據(jù)所在的OSS目錄。運行時會在該路徑的上一級目錄下生成視頻元數(shù)據(jù)文件video_meta.jsonl。后續(xù)處理此視頻數(shù)據(jù)時,也可以直接選擇之前生成的video_meta.jsonl文件。 | 無 | |
輸出文件的OSS路徑 | 是 | 生成結果的存儲目錄。包含以下文件:
| 無 | ||
輸出的文件名 | 是 | 生成結果的文件名。 | result.jsonl | ||
參數(shù)設置 | 生成候選文本數(shù)目 | 是 | 生成的候選文本數(shù)。 | 1 | |
均勻采樣幀數(shù)目 | 是 | 采樣的視頻幀數(shù)。系統(tǒng)會在視頻中根據(jù)視頻時長均勻地采集幀畫面進行分析。 | 3 | ||
執(zhí)行調(diào)優(yōu) | 選擇資源組 | 公共資源組 | 否 | 選擇節(jié)點規(guī)格(CPU或GPU實例規(guī)格)、專有網(wǎng)絡。該算法需使用GPU規(guī)格實例。 | 無 |
專有資源組 | 否 | 選擇CPU核數(shù)、內(nèi)存、共享內(nèi)存、GPU卡數(shù)。 | 無 | ||
最大運行時長 | 否 | 組件最大運行時長,超過這個時間,作業(yè)會被終止。 | 無 |