LVM數據處理算法提供了視頻清洗、視頻分類、視頻內容清理、視頻基本信息的提取、視頻caption生成的功能。您可以根據實際需求組合不同的算法,從而過濾出合適的視頻數據并生成相應的文本描述,方便為后續的視頻生成模型訓練提供優質的視頻數據。本文為您介紹Designer中視頻數據過濾打標預置模板的使用說明。
使用限制
視頻數據過濾打標預置模板僅支持華東1(杭州)、華東2(上海)、華北2(北京)、華南1(深圳)地域使用。
準備視頻數據
上傳視頻文件至OSS,視頻文件格式要求如下:
視頻文件為MP4格式。
視頻文件名稱不包含中文字符。
創建并運行工作流
進入Designer頁面。
登錄PAI控制臺。
在頂部左上角根據實際情況選擇地域。
在左側導航欄選擇工作空間列表,單擊指定工作空間名稱,進入對應工作空間。
在左側導航欄選擇模型開發與訓練 > 可視化建模(Designer),進入Designer頁面。
創建工作流。
在預置模板頁簽下,選擇業務領域 > 多模態大模型,單擊視頻數據過濾打標模板卡片上的創建。
配置工作流參數(或保持默認),單擊確定。
在工作流列表,選擇已創建的工作流,單擊進入工作流。
配置工作流。
關鍵配置如下:
運行工作流。運行結束后,查看生成的文件:
video_meta.jsonl文件:運行時會在視頻數據OSS路徑的上一級目錄下生成視頻元數據文件video_meta.jsonl。
結果文件:在輸出文件的OSS路徑中查看結果文件。
關于結果文件詳細說明,請參見視頻預處理算子中輸出文件的OSS路徑參數介紹。
相關參考
文檔內容是否對您有幫助?