創(chuàng)建標(biāo)注任務(wù)
創(chuàng)建完成用于數(shù)據(jù)標(biāo)注的數(shù)據(jù)集后,您可以使用iTAG開(kāi)展標(biāo)注任務(wù)。本文為您介紹如何創(chuàng)建標(biāo)注任務(wù)。
前提條件
已開(kāi)通PAI并創(chuàng)建工作空間。具體操作,請(qǐng)參見(jiàn)創(chuàng)建工作空間。
已創(chuàng)建數(shù)據(jù)集。具體操作,請(qǐng)參見(jiàn)創(chuàng)建數(shù)據(jù)集。
使用限制
僅管理員或標(biāo)注管理員可以進(jìn)行標(biāo)注相關(guān)操作。如果您的賬號(hào)沒(méi)有權(quán)限,請(qǐng)聯(lián)系管理員為您的賬號(hào)授予標(biāo)注管理員權(quán)限,操作詳情請(qǐng)參見(jiàn)管理工作空間成員。
創(chuàng)建任務(wù)
進(jìn)入智能標(biāo)注(iTAG)。
登錄PAI控制臺(tái)。
在左側(cè)導(dǎo)航欄單擊工作空間列表,在工作空間列表頁(yè)面中單擊待操作的工作空間名稱(chēng),進(jìn)入對(duì)應(yīng)工作空間。
在左側(cè)導(dǎo)航欄,選擇數(shù)據(jù)準(zhǔn)備>智能標(biāo)注(iTAG)。
創(chuàng)建標(biāo)注任務(wù)。
PAI默認(rèn)使用舊版iTAG創(chuàng)建標(biāo)注任務(wù),如果您需要進(jìn)行大模型數(shù)據(jù)標(biāo)注或使用更豐富的模板,可以選擇使用新版iTAG創(chuàng)建標(biāo)注任務(wù)。
舊版
單擊創(chuàng)建任務(wù),跳轉(zhuǎn)至創(chuàng)建標(biāo)注任務(wù)頁(yè)面。
在舊版標(biāo)注任務(wù)頁(yè)面,配置如下參數(shù)。
參數(shù)
描述
任務(wù)名稱(chēng)
長(zhǎng)度為1~100個(gè)字符,以小寫(xiě)字母、大寫(xiě)字母、數(shù)字或中文開(kāi)頭,可以包含下劃線(_)或短劃線(-)。
輸入數(shù)據(jù)集
選擇在PAI數(shù)據(jù)集管理中已經(jīng)創(chuàng)建的數(shù)據(jù)集。
模板類(lèi)型
支持以下類(lèi)型的模型:
通用模板:平臺(tái)預(yù)置的常用模板。
自定義模板:詳情請(qǐng)參見(jiàn)標(biāo)注模板。
模板
模板類(lèi)型為通用模板時(shí),支持選擇細(xì)分的通用模板類(lèi)型,當(dāng)前支持:
圖像類(lèi)
模板的詳細(xì)應(yīng)用場(chǎng)景,以及此類(lèi)模板的輸入輸出數(shù)據(jù)格式詳情請(qǐng)參見(jiàn)圖像類(lèi)。
圖片OCR:對(duì)圖片框選區(qū)域內(nèi)的文字進(jìn)行OCR。
目標(biāo)檢測(cè):對(duì)圖像中的具體目標(biāo)進(jìn)行定位。
圖像分類(lèi):按照預(yù)設(shè)的標(biāo)簽對(duì)圖像進(jìn)行分類(lèi)標(biāo)記。
PDF:對(duì)PDF進(jìn)行OCR和標(biāo)簽分類(lèi)。
審核摳圖:對(duì)圖片進(jìn)行審核和摳圖任務(wù)。
表格識(shí)別:利用算法預(yù)先對(duì)表格核心元素進(jìn)行識(shí)別,按需進(jìn)行編輯。
文本類(lèi)
模板的詳細(xì)應(yīng)用場(chǎng)景,以及此類(lèi)模板的輸入輸出數(shù)據(jù)格式詳情,請(qǐng)參見(jiàn)文本類(lèi)。
實(shí)體識(shí)別:建立文本實(shí)體之間的關(guān)系。
文本分類(lèi):對(duì)文本按照預(yù)設(shè)標(biāo)簽進(jìn)行分類(lèi)標(biāo)記,支持單標(biāo)簽和多標(biāo)簽分類(lèi)。
實(shí)體關(guān)系:文本實(shí)體之間的關(guān)系,用于知識(shí)圖譜場(chǎng)景。
視頻類(lèi)
模板的詳細(xì)應(yīng)用場(chǎng)景,以及此類(lèi)模板的輸入輸出數(shù)據(jù)格式詳情請(qǐng)參見(jiàn)視頻類(lèi)。
視頻分類(lèi):對(duì)視頻按照預(yù)設(shè)標(biāo)簽進(jìn)行分類(lèi)標(biāo)記,支持單標(biāo)簽和多標(biāo)簽分類(lèi)。
音頻類(lèi)
模板的詳細(xì)應(yīng)用場(chǎng)景,及此類(lèi)模板的輸入輸出數(shù)據(jù)格式詳情請(qǐng)參見(jiàn)語(yǔ)音類(lèi)。
音頻分類(lèi):對(duì)音頻按照預(yù)設(shè)標(biāo)簽進(jìn)行分類(lèi)標(biāo)記,支持單標(biāo)簽和多標(biāo)簽分類(lèi)。
音頻分割:對(duì)音頻數(shù)據(jù)集的內(nèi)容進(jìn)行分割并分段添加標(biāo)簽。
音頻識(shí)別:將音頻內(nèi)容的文字進(jìn)行識(shí)別。
選擇圖像內(nèi)容所在字段
選擇標(biāo)注任務(wù)中的數(shù)據(jù)(圖像/文本/視頻/音頻)內(nèi)容在數(shù)據(jù)集中的對(duì)應(yīng)字段名。
OCR識(shí)別結(jié)果配置
僅當(dāng)在模板選擇圖像類(lèi)中的圖片OCR時(shí),支持配置該參數(shù)。
默認(rèn)選中OCR識(shí)別結(jié)果,表示支持對(duì)圖片框選區(qū)域的文字進(jìn)行OCR。
標(biāo)簽配置
在本標(biāo)注任務(wù)中,需要依次輸入后續(xù)打標(biāo)人員需要識(shí)別、框選并打標(biāo)的標(biāo)簽名稱(chēng),然后按回車(chē)鍵完成添加。
例如,對(duì)圖片中的貓進(jìn)行識(shí)別時(shí),您可以添加標(biāo)簽:“貓”、“美短”、“英短”等,便于后續(xù)的打標(biāo)人員對(duì)樣本進(jìn)行打標(biāo)。
您可以同時(shí)設(shè)置本標(biāo)注任務(wù)中,打標(biāo)人員對(duì)一個(gè)樣本的一次框選打標(biāo)時(shí),可以對(duì)框選的對(duì)象打一個(gè)或多個(gè)標(biāo)簽。
當(dāng)一次框選打標(biāo)只能打一個(gè)標(biāo)簽時(shí),可將該標(biāo)簽設(shè)置為單選。
當(dāng)一次框選打標(biāo)可以打多個(gè)標(biāo)簽時(shí),可將該標(biāo)簽設(shè)置為多選。
例如,對(duì)圖片中的貓進(jìn)行識(shí)別時(shí),如果標(biāo)簽設(shè)置為多選,標(biāo)注人員框選出樣本中的貓后,可以同時(shí)打上標(biāo)簽“貓”、“美短”。
說(shuō)明此處的單選與多選指的是對(duì)一個(gè)樣本的一次框選打標(biāo)過(guò)程中,支持添加一個(gè)或多個(gè)標(biāo)簽,而非對(duì)一個(gè)樣本進(jìn)行多次框選打標(biāo)。
是否開(kāi)啟智能標(biāo)注
具體配置詳情請(qǐng)參見(jiàn)數(shù)據(jù)預(yù)標(biāo)注:智能標(biāo)注配置。
任務(wù)說(shuō)明
標(biāo)注任務(wù)的簡(jiǎn)要說(shuō)明,可鏈接到說(shuō)明文檔,上傳說(shuō)明文檔或圖片,以及手動(dòng)填寫(xiě)文檔說(shuō)明。
子任務(wù)包分配
iTAG會(huì)將所有數(shù)據(jù)集中的標(biāo)注任務(wù)按照指定規(guī)則匯總分配為一個(gè)個(gè)子任務(wù)包。在標(biāo)注任務(wù)處理過(guò)程中,處理人員可以搶單獲取子任務(wù)包,進(jìn)行子任務(wù)包內(nèi)的所有標(biāo)注任務(wù)的處理。
當(dāng)前支持通過(guò)以下規(guī)則來(lái)分配子任務(wù)包:
固定大小:每個(gè)子任務(wù)包中包含的標(biāo)注任務(wù)數(shù)量為固定值。設(shè)置為固定大小時(shí),數(shù)據(jù)集的數(shù)據(jù)量與子任務(wù)包中的任務(wù)數(shù)范圍有如下對(duì)應(yīng)關(guān)系:
當(dāng)數(shù)據(jù)集大小為0~2萬(wàn)條數(shù)據(jù)時(shí),子任務(wù)包大小范圍是1~200條。
當(dāng)數(shù)據(jù)集大小為2萬(wàn)~10萬(wàn)條數(shù)據(jù)時(shí),子任務(wù)包大小范圍是5~200條。
當(dāng)數(shù)據(jù)集大小為10萬(wàn)~50萬(wàn)條數(shù)據(jù)時(shí),子任務(wù)包大小的范圍為25~200條。
當(dāng)數(shù)據(jù)集大小為50萬(wàn)~100萬(wàn)條數(shù)據(jù)時(shí),子任務(wù)包的大小范圍為50~200條。
按導(dǎo)入字段:按照數(shù)據(jù)集中所選字段來(lái)劃分子任務(wù)包,該字段數(shù)值相同的數(shù)據(jù)會(huì)放在同一個(gè)子任務(wù)包中。
定向派單:針對(duì)特定標(biāo)注人員或團(tuán)隊(duì)進(jìn)行劃分子任務(wù)包。
檢查比例
如果您選擇的任務(wù)流程包括檢查環(huán)節(jié)(例如打標(biāo)-檢查、打標(biāo)-檢查-驗(yàn)收),則需要配置在檢查環(huán)節(jié)中,對(duì)標(biāo)注任務(wù)進(jìn)行抽查的比例,默認(rèn)為100%。
人員配置
根據(jù)選擇的任務(wù)流程,配置標(biāo)注人員/組、檢查人員/組、驗(yàn)收人員/組或任務(wù)管理員。您可以與該工作空間下的多個(gè)成員協(xié)作完成標(biāo)注任務(wù)。iTAG中的角色權(quán)限,請(qǐng)參見(jiàn)iTAG概述。
配置完成后,單擊創(chuàng)建。
新版
單擊創(chuàng)建任務(wù),跳轉(zhuǎn)至創(chuàng)建標(biāo)注任務(wù)頁(yè)面。
單擊,進(jìn)入管理中心>任務(wù)管理頁(yè)面。
單擊,然后選擇新版創(chuàng)建,配置相關(guān)參數(shù)。
數(shù)據(jù)選擇
選擇原始數(shù)據(jù)集或標(biāo)注數(shù)據(jù)集,單擊下一步。
預(yù)覽數(shù)據(jù)及內(nèi)容,單擊下一步。
模板選擇
您可以選擇使用已有模板、官方模板、自定義模板或新建模板,并進(jìn)行編輯配置,完成后單擊下一步。
更多模板詳情,請(qǐng)參見(jiàn)標(biāo)注模板。
任務(wù)配置
配置以下參數(shù),完成后單擊創(chuàng)建任務(wù)。
參數(shù)
描述
基本信息
任務(wù)名稱(chēng)
自定義標(biāo)注任務(wù)的名稱(chēng)。長(zhǎng)度為1~100個(gè)字符,以小寫(xiě)字母、大寫(xiě)字母、數(shù)字或中文開(kāi)頭,可以包含下劃線(_)或短劃線(-)。
分發(fā)模式
單人標(biāo)注:搶單模式,每次搶1個(gè)任務(wù)包進(jìn)行回答。
多人投票:每個(gè)任務(wù)包被多人按順序進(jìn)行重復(fù)回答。
任務(wù)流程
分為標(biāo)注、檢查和驗(yàn)收三個(gè)環(huán)節(jié),其中標(biāo)注為必選環(huán)節(jié),檢查和驗(yàn)收為可選環(huán)節(jié)。
人員配置
根據(jù)選擇的任務(wù)流程,配置標(biāo)注人員/組、檢查人員/組、驗(yàn)收人員/組、任務(wù)管理員。您可以與該工作空間下的多個(gè)成員協(xié)作完成標(biāo)注任務(wù)。iTAG中的角色權(quán)限,請(qǐng)參見(jiàn)iTAG概述。
您可以在租戶(hù)配置>人員管理頁(yè)面進(jìn)行設(shè)置。
任務(wù)說(shuō)明
標(biāo)注任務(wù)的簡(jiǎn)要說(shuō)明,可鏈接到說(shuō)明文檔,上傳說(shuō)明文檔或圖片,以及手動(dòng)填寫(xiě)文檔說(shuō)明。
優(yōu)先級(jí)
數(shù)值越大,優(yōu)先級(jí)越高。
業(yè)務(wù)類(lèi)型
業(yè)務(wù)類(lèi)型是對(duì)標(biāo)注任務(wù)進(jìn)行分類(lèi)管理的標(biāo)簽。您可以在租戶(hù)配置>云資源配置頁(yè)面,選擇業(yè)務(wù)類(lèi)型配置然后進(jìn)行設(shè)置。
任務(wù)標(biāo)簽
在標(biāo)注任務(wù)中,可以選擇后續(xù)打標(biāo)人員需要識(shí)別、框選并打標(biāo)的標(biāo)簽名稱(chēng)。您可以在租戶(hù)配置>云資源配置頁(yè)面,選擇標(biāo)簽配置后進(jìn)行設(shè)置。
智能標(biāo)注
標(biāo)注方式
可以選擇不使用,或使用離線預(yù)標(biāo)注結(jié)果、或UDF方式進(jìn)行標(biāo)注。
高級(jí)配置
子任務(wù)包最大跳過(guò)數(shù)量
為子任務(wù)包設(shè)置最大跳過(guò)數(shù)量,超過(guò)指定數(shù)值后,則不能跳過(guò)任務(wù)。
子任務(wù)包超時(shí)廢棄
開(kāi)啟后,當(dāng)任務(wù)包超過(guò)規(guī)定的時(shí)間仍未被領(lǐng)取過(guò),則廢棄此子任務(wù)包。
子任務(wù)包超時(shí)釋放
開(kāi)啟后,當(dāng)任務(wù)包超過(guò)規(guī)定的時(shí)間仍未被領(lǐng)取過(guò),則釋放此子任務(wù)包。
允許標(biāo)注人員釋放任務(wù)包
開(kāi)啟后,允許標(biāo)注人員釋放已領(lǐng)取的任務(wù)。
是否追加數(shù)據(jù)任務(wù)
追加數(shù)據(jù)到已有任務(wù),可以有效避免任務(wù)頻繁創(chuàng)建或任務(wù)過(guò)于零散,只有管理員有權(quán)限進(jìn)行該操作。
接口調(diào)用詳情,請(qǐng)參見(jiàn)AppendAllDataToTask - 追加數(shù)據(jù)。
管理任務(wù)
創(chuàng)建標(biāo)注任務(wù)后,您可以在管理中心>任務(wù)管理頁(yè)面查看任務(wù)狀態(tài)、子任務(wù)包詳情或獲取標(biāo)注結(jié)果等。
區(qū)域 | 任務(wù) | 說(shuō)明 |
① | 子任務(wù)包詳情 | 單擊子任務(wù)包詳情,可對(duì)具體的子任務(wù)包進(jìn)行查看、轉(zhuǎn)派、釋放或廢棄的操作。
|
② | 獲取標(biāo)注結(jié)果 | 單擊獲取標(biāo)注結(jié)果,根據(jù)界面提示將標(biāo)注結(jié)果導(dǎo)出。單擊獲取記錄,可查看導(dǎo)出的進(jìn)度和結(jié)果。 具體操作,請(qǐng)參見(jiàn)導(dǎo)出標(biāo)注結(jié)果數(shù)據(jù)。 |
③ | 下線/上線 | 上線或下線任務(wù)。 |
④ | 復(fù)制任務(wù) | 單擊復(fù)制任務(wù),根據(jù)實(shí)際需求配置任務(wù)名稱(chēng)、數(shù)據(jù)集和任務(wù)模板,即可快速地基于已有的標(biāo)注任務(wù)創(chuàng)建一個(gè)新的相似任務(wù),避免重復(fù)配置。 |
⑤ | 人員分配 | 單擊人員分配,根據(jù)創(chuàng)建標(biāo)注任務(wù)時(shí)配置的不同的任務(wù)流程,配置對(duì)應(yīng)標(biāo)注、檢查或驗(yàn)收人員。 |
⑥ | 刪除 | 單擊刪除,并輸入任務(wù)ID,即可刪除該標(biāo)注任務(wù)。 |
⑦ | 關(guān)注任務(wù) | 單擊關(guān)注任務(wù),即可在PAI控制臺(tái)的iTAG首頁(yè)快速查看和訪問(wèn)該任務(wù)。 |