司法裁判文書(事實(shí)認(rèn)定)
司法裁判文書(事實(shí)認(rèn)定)。
司法裁判文書(事實(shí)認(rèn)定):抽取司法裁判文書中事實(shí)認(rèn)定的實(shí)體,屬于自學(xué)習(xí)平臺(tái)模型訓(xùn)練算法服務(wù)。目前該服務(wù)處于試運(yùn)行階段,需要提交申請(qǐng)開(kāi)白名單使用,您可以添加自學(xué)習(xí)平臺(tái)答疑二群(釘釘群號(hào):44619071)詳細(xì)咨詢提交申請(qǐng)。
自學(xué)習(xí)服務(wù)使用前,請(qǐng)確認(rèn)是否已經(jīng)開(kāi)通了NLP自學(xué)習(xí)平臺(tái)服務(wù),開(kāi)通后可購(gòu)買資源包。
NLP自學(xué)習(xí)平臺(tái):開(kāi)通地址
自學(xué)習(xí)平臺(tái)資源包:購(gòu)買地址
一、創(chuàng)建項(xiàng)目
在NLP自學(xué)習(xí)平臺(tái)中【單擊進(jìn)入自學(xué)習(xí)管控臺(tái)】,支持多個(gè)基本項(xiàng)目和應(yīng)用算法。在本教程中,我們將引導(dǎo)您掌握通過(guò)自學(xué)習(xí)平臺(tái)創(chuàng)建一個(gè)“司法裁判文書(事實(shí)認(rèn)定)”的項(xiàng)目。
進(jìn)入“我的項(xiàng)目”或“創(chuàng)建項(xiàng)目”,選擇“司法裁判文書(事實(shí)認(rèn)定)”算法單擊“創(chuàng)建”。在接下拉的頁(yè)面填寫項(xiàng)目名稱和項(xiàng)目描述即可。
二、數(shù)據(jù)準(zhǔn)備
進(jìn)入“我的項(xiàng)目”后,可以在數(shù)據(jù)中心中管理您的數(shù)據(jù),有兩種方式可以創(chuàng)建數(shù)據(jù):
1、創(chuàng)建標(biāo)注任務(wù);2、上傳數(shù)據(jù)集。
2.1創(chuàng)建標(biāo)注任務(wù)
步驟一:上傳待標(biāo)注文檔,添加標(biāo)注人員
創(chuàng)建者和項(xiàng)目管理員默認(rèn)為標(biāo)注人員,同時(shí),您也可以將標(biāo)注任務(wù)分配給您創(chuàng)建的阿里云子賬號(hào),被分配用戶通過(guò)子賬號(hào)的賬號(hào)密碼登錄本平臺(tái),即可參與數(shù)據(jù)標(biāo)注。
子賬號(hào)登錄說(shuō)明:
1、子賬號(hào)登錄頁(yè),登錄:https://signin.aliyun.com/login.htm
2、登錄后,單擊進(jìn)入我的項(xiàng)目-創(chuàng)建標(biāo)注任務(wù)。
注意:目前僅支持UTF-8編碼方式的數(shù)據(jù)文件
步驟二:添加自定義標(biāo)簽
司法裁判文書內(nèi)置10+個(gè)無(wú)需標(biāo)注的實(shí)體標(biāo)簽,模型訓(xùn)練的數(shù)據(jù)標(biāo)注成本低至原本的50%以下。
選擇本次標(biāo)注需要優(yōu)化的預(yù)置字段,并逐個(gè)添加需要標(biāo)注的自定義標(biāo)簽字段名;
步驟三:標(biāo)注數(shù)據(jù)
2.2 上傳數(shù)據(jù)集
由于模型需要通過(guò)標(biāo)注數(shù)據(jù)來(lái)從中學(xué)習(xí)規(guī)律,因此我們首先要準(zhǔn)備好一個(gè)標(biāo)注數(shù)據(jù)集。
對(duì)于用戶已經(jīng)積累了一部分標(biāo)注數(shù)據(jù)的情況,我們需要您按照自學(xué)習(xí)平臺(tái)所支持的輸入格式進(jìn)行組織,并且上傳。
自行上傳的標(biāo)注數(shù)據(jù)為JSON格式,且需要符合以下格式,其中文本的內(nèi)容放在“content”中,而標(biāo)簽的內(nèi)容放在“records”中,records 中key 為實(shí)體名,value 為標(biāo)注內(nèi)容在原文中的偏移量。
{
"id_0001": { // 這是該文檔在您數(shù)據(jù)集里的唯一標(biāo)示
"content": "2021年9月4日15時(shí)許,被告人劉*立醉酒后駕駛一輛牌照號(hào)為浙b**208的小型汽車,行駛至本區(qū)大碶街道壩頭路與鎮(zhèn)大路交叉口附近路段時(shí),與被害人韓*紅駕駛的小型轎車發(fā)生刮擦,造成車輛受損的交通事故。后經(jīng)寧波市公安局北侖分局交通**大隊(duì)認(rèn)定,被告人劉*立承擔(dān)此次事故的全部責(zé)任。寧波市公安局北侖分局交通**大隊(duì)民警到場(chǎng)處理交通事1故時(shí)發(fā)現(xiàn)被告人劉*立有酒后駕車嫌疑,處警民警遂對(duì)劉*立進(jìn)行現(xiàn)場(chǎng)檢測(cè)。經(jīng)檢測(cè),被告人劉*立呼氣酒精含量為212mg/100m1,后經(jīng)血樣檢測(cè),其血樣乙醇濃度為219mg/100m1。案發(fā)后,被告人劉*立與韓*紅就民事賠償問(wèn)題達(dá)成協(xié)議,并已實(shí)際履行。",
"records": {
"作案地點(diǎn)": [{
"span": "解放街上由東往西方向行駛",
"offset": [ //標(biāo)注字段真實(shí)字節(jié)的偏移量,首字節(jié)的偏移量為0。
127,
139
]
}],
"呼氣式血液酒精含量": [{
"span": "106mg/100ml",
"offset": [
212,
223
]
},
}]
}
}
}
三、創(chuàng)建模型
在“模型中心”單擊“創(chuàng)建模型”;
查看模型詳情,單擊模型右側(cè)“查看”按鈕查看模型詳情。
模型詳情頁(yè)
模型測(cè)試
模型訓(xùn)練完成后,可對(duì)訓(xùn)練好的模型進(jìn)行線上測(cè)試模型效果;
平臺(tái)模型測(cè)試
基于平臺(tái)已訓(xùn)練好的模型進(jìn)行文本測(cè)試,可以針對(duì)需要提升的標(biāo)簽準(zhǔn)確率進(jìn)行單獨(dú)訓(xùn)練;