標注模板
iTAG不僅提供通用模板以滿足各類常見的標注任務需求,還支持用戶根據自身業務場景自定義標注模板。其中,自定義模板可以通過直接創建或導入的方式來生成。
背景信息
iTAG作為智能數據標注平臺,提供了三種不同類型的模板以適應多樣化的標注需求:
官方模板(推薦)
官方模板是由阿里云PAI官方提供的預置標準標注模板。這些模板通常覆蓋了常見的標注場景,如圖文解釋、對話排序、視覺問答、視頻OCR等。您可以直接選用官方模板開展標注工作,無需從零開始設計,簡化了數據標注流程。
更多官方模板詳情,請參見官方模板。
租戶模板
租戶模板是指在iTAG平臺上由同一租戶(即使用同一賬號的企業或團隊)創建并保存的個性化標注模板。這類模板是根據租戶自身的業務場景定制的,可以復用或分享給該租戶下的其他項目成員,以便快速啟動相似類型的數據標注任務,提高標注效率和一致性。
自定義模板
自定義模板支持用戶根據自身業務的獨特需求創建全新的標注規范,您可以在iTAG平臺上自由設計和配置標注模板。對于具有特殊標注要求的任務,自定義模板功能尤為重要,確保了高度靈活與精準的數據標注過程。
創建模板流程
本文以創建官方模板為例進行說明,租戶模板和自定義模板操作同理。
進入智能標注(iTAG)。
登錄PAI控制臺。
在左側導航欄單擊工作空間列表,在工作空間列表頁面中單擊待操作的工作空間名稱,進入對應工作空間。
在左側導航欄,選擇數據準備>智能標注(iTAG)。
單擊前往標注頁面,然后在左側導航欄選擇管理中心>資產管理。
在模板管理頁簽下,單擊新建模板,模板類型選擇官方模板。
根據實際業務需求選擇目標模板后,單擊編輯,進入創建模板頁面。
配置標注模板參數,各模板關鍵信息說明,請參見官方模板。
單擊保存模板,完成配置。您也可以按需進行以下操作:
單擊返回,即可返回到模板選擇頁面。
單擊智能化配置,可配置預標注、UDF等服務。
單擊廢棄配置,可以設置是否允許廢棄樣本。
單擊導入數據集,可以更改需要導入的數據集。
單擊導出模板,可以導出并復制JSON格式的模板。
單擊保存模板,可以保存當前配置完成的模板。
單擊創建任務,可以保存當前配置完成的模板并創建相應任務。
后續操作
創建標注任務
您可以通過以下兩種方式創建標注任務:
在創建模板頁面,單擊右下角的創建任務,輸入模板名稱后單擊保存,在創建任務頁面中配置任務參數,然后單擊確認。
在管理中心>任務管理創建標注任務。相對于在創建模板頁面中創建任務,在任務管理創建標注任務時,系統提供更加完善的參數選項,您可以最大限度地進行自定義配置,詳情請參見創建標注任務。
處理標注任務
具體操作,請參見處理標注任務。
官方模板
iTAG模板市場提供了多個官方模板供您便捷地使用,主要包含大模型和機器學習兩種類型。
下表為您展示部分常用官方模板,其他模板詳情請以控制臺頁面信息為準。
模板名稱 | 類型 | 標簽 | 說明 |
機器學習(視頻) | 視頻幀框選、視頻幀標記、全局題目 | 視頻打點模板可以對視頻內容進行檢測,包括模板提供視頻幀框選(框選打標)、視頻幀標注(針對區間標注)、全局題目(對視頻內容進行題目打標)三個組件功能。 | |
機器學習(視頻) | 視頻OCR | 視頻OCR模板可以在視頻中框選出含文字部分時,自動對框內文字進行識別。 | |
機器學習(圖像) | 圖像語義分割 | 圖像語義分割模板可以將圖片內容進行分割,并配置題目對分割內容進行打標。 | |
大模型(多模態) | 圖生文 | 圖生文模板支持SAM及自研分割算法快速分割圖形,結合LLM文本生成能力,探索智能化標注在AIGC場景下的應用。 | |
大模型(多模態) | 圖文解釋 | 圖文解釋模板用于關聯圖片選區與文本實體。 | |
大模型(大語言模型) | 對話改寫 | 對話改寫模板可以在給定的主題下對該主題進行提問。您可以選擇最合適的機器人回答,并對其進行改寫。 | |
大模型(多模態) | 多模態RLHF標注 | 多模態RLHF標注模板提供多模態RLHF標注的功能,在對話改寫的基礎上,可以接入輸入機器人進行自動問答,也可以在手動問答模式輸入圖片等多模態類型內容。 | |
大模型(多模態) | |||
大模型(大語言模型) | 對話排序 | 對話排序模板可以將對話內容進行分類排序。 | |
大模型(多模態) | VQA對話 | 視覺問答模板可以根據您提供的圖片,對圖片的內容進行問答,問答均可接入機器人UDF。其中,單輪對話指問題和答案不考慮上下文內容;多輪對話指問題和答案會結合上下文產出。 | |
大模型(多模態) | |||
大模型(大語言模型) | 對話分組 | 對話分組模板可以將一系列的對話分為不同的組別,同時支持改寫對話。 | |
大模型(大語言模型) | 智能評分 | 智能評分模板可以對問答內容進行改寫,同時支持針對每道標注的內容配置不同的題目。 |