常見(jiàn)問(wèn)題
NLP自學(xué)習(xí)平臺(tái)常見(jiàn)問(wèn)題。
1、NLP自學(xué)習(xí)平臺(tái)服務(wù)調(diào)用限制
算法類型 | 單模型QPS | 最大請(qǐng)求長(zhǎng)度(字節(jié)) |
文本實(shí)體抽取 | 20 | 暫無(wú)限制 |
文本分類 | 20 | 暫無(wú)限制 |
關(guān)鍵短語(yǔ)抽取 | 20 | 暫無(wú)限制 |
短文本匹配 | 20 | 暫無(wú)限制 |
關(guān)系抽取 | 20 | 暫無(wú)限制 |
簡(jiǎn)歷抽取 | 20 | 暫無(wú)限制 |
商品評(píng)價(jià)解析 | 20 | 暫無(wú)限制 |
情感分析 | 20 | 暫無(wú)限制 |
2、長(zhǎng)度限制
問(wèn):文本實(shí)體抽取預(yù)測(cè)時(shí)文本有沒(méi)有長(zhǎng)度限制?
答:目前沒(méi)有限制,但是過(guò)長(zhǎng)的文本會(huì)導(dǎo)致超時(shí)。建議控制在1000字以內(nèi),超長(zhǎng)的文本可以根據(jù)“\n”或“。”(換行符或句號(hào))對(duì)文本進(jìn)行切分?;蚴褂梦覀兊漠惒筋A(yù)測(cè)接口,該接口支持10000字的預(yù)測(cè),使用文檔:異步預(yù)測(cè)接口使用示例
問(wèn):文本實(shí)體抽取預(yù)測(cè)時(shí)對(duì)長(zhǎng)文本進(jìn)行切分是否會(huì)影響模型預(yù)測(cè)效果?
答:根據(jù)“\n”或“?!保〒Q行符或句號(hào))對(duì)文本進(jìn)行切分,并不會(huì)影響模型預(yù)測(cè)的準(zhǔn)確率。鼓勵(lì)將過(guò)長(zhǎng)的樣本進(jìn)行切分處理后預(yù)測(cè)。
3、子賬號(hào)授權(quán)相關(guān)問(wèn)題
3.1 子賬號(hào)授權(quán)操作步驟
1、在RAM訪問(wèn)控制的權(quán)限管理中新建權(quán)限策略(https://ram.console.aliyun.com/policies)
2、輸入策略腳本配置
NLP自學(xué)習(xí)平臺(tái)腳本策略
{
"Statement": [
{
"Effect": "Allow",
"Action": "nlp-automl:*",
"Resource": "*"
}
],
"Version": "1"
}
3、在人員管理用戶tab中,對(duì)想要授權(quán)的子賬號(hào)進(jìn)行添加權(quán)限操作
4、選擇剛剛創(chuàng)建的自定義權(quán)限策略,即可完成授權(quán)
3.2 子賬號(hào)有哪些權(quán)限
目前被授權(quán)的子賬號(hào)將擁有幾乎全部的平臺(tái)管理權(quán)限(除售賣相關(guān)的操作和查看權(quán)限):
平臺(tái)資源 | 權(quán)限 | 授權(quán)子賬號(hào)是否有對(duì)應(yīng)權(quán)限 |
項(xiàng)目 | all | 是 |
模型 | all | 是 |
數(shù)據(jù) | all | 是 |
監(jiān)控統(tǒng)計(jì) | all | 是 |
售賣相關(guān) | all | 否 |
3.3 其他注意事項(xiàng)
目前只有主賬號(hào)有售賣相關(guān)的操作和查看權(quán)限。
授權(quán)的子賬號(hào)登錄后直接跳轉(zhuǎn)到控制臺(tái)”我的項(xiàng)目”鏈接,未授權(quán)的子賬號(hào)跳轉(zhuǎn)到標(biāo)注中心。
一個(gè)標(biāo)注項(xiàng)目的管理員是:這個(gè)標(biāo)注項(xiàng)目所在項(xiàng)目A的創(chuàng)建人或項(xiàng)目A的授權(quán)賬號(hào)。
主賬號(hào)擁有標(biāo)注任務(wù)的編輯權(quán)限,可以為標(biāo)注任務(wù)增加參加標(biāo)注的子賬號(hào)。
標(biāo)注項(xiàng)目的質(zhì)檢人員是該標(biāo)注項(xiàng)目的管理員。
所有項(xiàng)目和模型的創(chuàng)建用戶ID默認(rèn)是主賬號(hào)ID。
predict接口(內(nèi)部和外部)的發(fā)起調(diào)用時(shí),調(diào)用者ID默認(rèn)是主賬號(hào)。
predict接口推送的sls日志的數(shù)據(jù)中包含著調(diào)用者實(shí)際為主賬號(hào)或子賬號(hào)的信息。
售賣按主賬號(hào)計(jì)算。
若近一周日均調(diào)用量超過(guò)50萬(wàn)的,可與我們聯(lián)系提高QPS,歡迎聯(lián)系銷售經(jīng)理洽談。
4、實(shí)體抽取項(xiàng)目常見(jiàn)問(wèn)題
4.1 標(biāo)注注意事項(xiàng)
實(shí)體抽取項(xiàng)目中,需要對(duì)待標(biāo)注文檔中所有出現(xiàn)的實(shí)體予以標(biāo)注。(建議打開(kāi)左上角的“同值標(biāo)注” 功能 )
某文檔中對(duì)某個(gè)實(shí)體已經(jīng)有過(guò)標(biāo)注了,在另一篇文檔中還需要對(duì)相同實(shí)體進(jìn)行標(biāo)注嗎?
答:需要
被標(biāo)注的實(shí)體中不能出現(xiàn)換行符“\n”或句號(hào)“?!?/b>,否則將不能識(shí)別,但不會(huì)影響訓(xùn)練。
4.2 更高級(jí)的規(guī)則引擎設(shè)置
問(wèn):做實(shí)體抽取任務(wù)時(shí),我的文檔格式比較固定,需要抽取的字段有明確和固定的上下文,有沒(méi)有不需要大量標(biāo)注,又好又快的抽取方案?
答: 有!為了提升實(shí)體抽取模型的表現(xiàn)和效率,我們還開(kāi)放了規(guī)則引擎模塊供用戶選擇(如有需要,請(qǐng)聯(lián)系我們加入白名單,釘釘群號(hào):44619071)。在創(chuàng)建模型時(shí)可以配置。規(guī)則引擎的界面如下:
您可以通過(guò)規(guī)則配置來(lái)配置正則、詞典、任意字符和模型抽出的實(shí)體的組合等“規(guī)則”,并且通過(guò)規(guī)則預(yù)覽可以測(cè)試下您的規(guī)則是否生效。
規(guī)則配置示例:
我有如下裁判文書,需要抽取原告和被告的姓名、性別、出生年月:
原告:橙小二,女,住所地浙江省杭州市余杭區(qū)。\n\n被告:王某某,男,2019年10月1日出生,漢族。
就可以使用規(guī)則引擎來(lái)配置正則表達(dá)式,抽取出這些字段:
新增規(guī)則組->實(shí)體類型選原告->規(guī)則要素選擇正則表達(dá)式->值填入 (?<=原告:)([^,]+)(?=,)
配置好幾個(gè)規(guī)則后,點(diǎn)擊規(guī)則預(yù)覽,則可以檢查剛剛配置的規(guī)則:
4.3 實(shí)體抽取項(xiàng)目常見(jiàn)的抽取字段
平臺(tái)提供常見(jiàn)字段的抽取能力,例如日期、手機(jī)號(hào)碼等,勾選后,您創(chuàng)建的模型將可同時(shí)抽取勾選字段。(由于創(chuàng)建模型需要標(biāo)注數(shù)據(jù),若想直接使用該功能,您可以隨意標(biāo)注10條數(shù)據(jù)訓(xùn)練一個(gè)模型,注意需在高級(jí)設(shè)置中勾選您想使用的通用字段)
入口(實(shí)體抽取項(xiàng)目->模型中心->創(chuàng)建模型->進(jìn)入高級(jí)設(shè)置):
5、購(gòu)買及續(xù)費(fèi)常見(jiàn)問(wèn)題
5.1 續(xù)費(fèi)時(shí)提示模型數(shù)量超變更規(guī)格數(shù)量
在續(xù)費(fèi)頁(yè)面中,如提示模型數(shù)量已超變更規(guī)格數(shù)量,請(qǐng)先在 我的模型頁(yè) 查看模型總量與模型使用量情況,確保已使用量小于等于總量。
若模型使用量大于模型總量(例如:試用時(shí)使用了3個(gè)模型且未刪除,正式付費(fèi)購(gòu)買時(shí),僅購(gòu)買了1個(gè)),您可以:
直接刪除不準(zhǔn)備使用的模型(注意:模型刪除后將無(wú)法恢復(fù))
點(diǎn)擊增加個(gè)數(shù),通過(guò) 變配 的方式,提升模型總量額度
5.2自學(xué)習(xí)平臺(tái)訓(xùn)練模型下數(shù)據(jù)標(biāo)注任務(wù)個(gè)數(shù)有限制嗎?
答:?jiǎn)蝹€(gè)模型下的數(shù)據(jù)標(biāo)注任務(wù)沒(méi)有限制。
5.3可以直接購(gòu)買資源包嗎?
答:資源包是用于模型調(diào)用的,如果你需要模型訓(xùn)練,還需要購(gòu)買模型包月。
5.4自學(xué)習(xí)平臺(tái)套餐用完了會(huì)自動(dòng)扣費(fèi),是否可以關(guān)閉?
自學(xué)習(xí)平臺(tái)是按量計(jì)費(fèi)型產(chǎn)品,開(kāi)通自學(xué)習(xí)平臺(tái)就開(kāi)通了按次調(diào)用后付費(fèi)。
資源包提供了更優(yōu)惠的按次調(diào)用計(jì)費(fèi)價(jià)格,在計(jì)費(fèi)時(shí)進(jìn)行抵扣,超過(guò)資源包的部分仍然是按照后付費(fèi)計(jì)費(fèi)。
目前暫不支持單獨(dú)關(guān)閉后付費(fèi),如需關(guān)閉后付費(fèi),就需要關(guān)閉自學(xué)習(xí)平臺(tái)產(chǎn)品。
計(jì)費(fèi)標(biāo)準(zhǔn)可參考【產(chǎn)品價(jià)格】文檔
6、一般常見(jiàn)問(wèn)題
6.1 阿里云的AccessKeyId和AccessKeySecret是否通用?
阿里云各個(gè)服務(wù)的AccessKeyId和AccessKeySecret是通用的,使用前需先開(kāi)通對(duì)應(yīng)的服務(wù)。
6.2 多個(gè)數(shù)據(jù)集需要購(gòu)買多個(gè)模型嗎?
答:數(shù)據(jù)集數(shù)量和模型無(wú)關(guān),只有需要同時(shí)訓(xùn)練多個(gè)模型才需要購(gòu)買多個(gè)模型。
6.3 如何提高QPS
若近一周日均調(diào)用量超過(guò)50萬(wàn)的,可與我們聯(lián)系提高QPS,加入“阿里云NLP自學(xué)習(xí)平臺(tái)用戶答疑二群”(釘釘群號(hào):44619071)咨詢。