視頻數(shù)據(jù)過濾打標(biāo)
LVM數(shù)據(jù)處理算法提供了視頻清洗、視頻分類、視頻內(nèi)容清理、視頻基本信息的提取、視頻caption生成的功能。您可以根據(jù)實際需求組合不同的算法,從而過濾出合適的視頻數(shù)據(jù)并生成相應(yīng)的文本描述,方便為后續(xù)的視頻生成模型訓(xùn)練提供優(yōu)質(zhì)的視頻數(shù)據(jù)。本文為您介紹Designer中視頻數(shù)據(jù)過濾打標(biāo)預(yù)置模板的使用說明。
使用限制
視頻數(shù)據(jù)過濾打標(biāo)預(yù)置模板僅支持華東1(杭州)、華東2(上海)、華北2(北京)、華南1(深圳)地域使用。
準(zhǔn)備視頻數(shù)據(jù)
上傳視頻文件至OSS,視頻文件格式要求如下:
視頻文件為MP4格式。
視頻文件名稱不包含中文字符。
創(chuàng)建并運行工作流
進入Designer頁面。
登錄PAI控制臺。
在頂部左上角根據(jù)實際情況選擇地域。
在左側(cè)導(dǎo)航欄選擇工作空間列表,單擊指定工作空間名稱,進入對應(yīng)工作空間。
在左側(cè)導(dǎo)航欄選擇模型開發(fā)與訓(xùn)練 > 可視化建模(Designer),進入Designer頁面。
創(chuàng)建工作流。
在預(yù)置模板頁簽下,選擇業(yè)務(wù)領(lǐng)域 > 多模態(tài)大模型,單擊視頻數(shù)據(jù)過濾打標(biāo)模板卡片上的創(chuàng)建。
配置工作流參數(shù)(或保持默認(rèn)),單擊確定。
在工作流列表,選擇已創(chuàng)建的工作流,單擊進入工作流。
配置工作流。
關(guān)鍵配置如下:
讀OSS數(shù)據(jù)組件:配置組件的OSS數(shù)據(jù)路徑,即準(zhǔn)備視頻數(shù)據(jù)中視頻文件上傳的OSS目錄。
LVM視頻算法組件:分別配置LVM算法組件,詳情請參見視頻預(yù)處理算子。
運行工作流。運行結(jié)束后,查看生成的文件:
video_meta.jsonl文件:運行時會在視頻數(shù)據(jù)OSS路徑的上一級目錄下生成視頻元數(shù)據(jù)文件video_meta.jsonl。
結(jié)果文件:在輸出文件的OSS路徑中查看結(jié)果文件。
關(guān)于結(jié)果文件詳細(xì)說明,請參見視頻預(yù)處理算子中輸出文件的OSS路徑參數(shù)介紹。