語言模型定制
阿里云智能語音交互對(duì)某些場(chǎng)景(包括通用、教育、司法、醫(yī)療等)進(jìn)行了大量語音識(shí)別訓(xùn)練,提供了高準(zhǔn)確率場(chǎng)景模型。當(dāng)您的語音識(shí)別需求超出預(yù)設(shè)模型范疇,或是希望對(duì)現(xiàn)有的標(biāo)準(zhǔn)模型進(jìn)行個(gè)性化定制時(shí),可以通過自學(xué)習(xí)平臺(tái)的語言模型定制功能,根據(jù)自身業(yè)務(wù)相關(guān)的語料進(jìn)行針對(duì)性訓(xùn)練和優(yōu)化,從而提升語音識(shí)別效果。
功能優(yōu)勢(shì)
通過使用阿里云語音自學(xué)習(xí)工具,您可以在操作界面上傳訓(xùn)練語料文本,并選擇對(duì)應(yīng)領(lǐng)域的語言基礎(chǔ)模型,對(duì)訓(xùn)練語料做模型訓(xùn)練,從而有效提高該場(chǎng)景的語音識(shí)別率。尤其針對(duì)專有名詞和高頻詞匯,有較好的優(yōu)化效果。
定制語言模型的方式
您可以通過定制語言模型或使用POP API創(chuàng)建自學(xué)習(xí)模型方式定制語言模型。具體區(qū)別如下:
使用控制臺(tái)訓(xùn)練和管理自學(xué)習(xí)模型,可以界面化操作,在控制臺(tái)項(xiàng)目功能配置中,單擊切換場(chǎng)景,選擇自學(xué)習(xí)模型,發(fā)布上線后將與Appkey綁定,無需在代碼中設(shè)置。
使用POP API創(chuàng)建的自學(xué)習(xí)模型,需要您在客戶端代碼中調(diào)用SDK的接口設(shè)置自學(xué)習(xí)模型的ID后,該模型才能生效。
應(yīng)用舉例
下載訓(xùn)練語料,以阿里巴巴簡(jiǎn)介為例:
一九九九年九月,馬云帶領(lǐng)下的十八位創(chuàng)始人在杭州的公寓中正式成立了阿里巴巴集團(tuán),集團(tuán)的首個(gè)網(wǎng)站是英文全球批發(fā)貿(mào)易市場(chǎng)阿里巴巴。
一九九九年十月,阿里巴巴集團(tuán)從數(shù)家投資機(jī)構(gòu)融資五百萬美元。
一九九九年十月,阿里巴巴集團(tuán)從數(shù)家投資機(jī)構(gòu)融資五百萬美元。
二零零零年一月,阿里巴巴集團(tuán)從軟銀等數(shù)家投資機(jī)構(gòu)融資兩千萬美元。
二零零零年一月,阿里巴巴集團(tuán)從軟銀等數(shù)家投資機(jī)構(gòu)融資兩千萬美元。
二零零零年九月,阿里巴巴集團(tuán)舉辦首屆西湖論劍,匯聚互聯(lián)網(wǎng)界的商業(yè)和意見領(lǐng)袖討論業(yè)界重要議題。
如果“融資”、“互聯(lián)網(wǎng)”等是業(yè)務(wù)關(guān)鍵詞,可以將含這兩個(gè)詞的句子多復(fù)制幾遍。
訓(xùn)練流程如下:
選擇基礎(chǔ)模型:采用通用模型(具體選擇何種模型可根據(jù)實(shí)際場(chǎng)景進(jìn)行調(diào)整)。
訓(xùn)練語料采集:請(qǐng)將如上訓(xùn)練語料保存至訓(xùn)練文本。如果需要自行設(shè)置訓(xùn)練語料,請(qǐng)根據(jù)標(biāo)點(diǎn)做裁剪,將每句話保存為訓(xùn)練文本中的一行。
操作訓(xùn)練模型:通過自學(xué)習(xí)服務(wù)提交語料并訓(xùn)練之后,采用訓(xùn)練出的模型,能夠有效識(shí)別出訓(xùn)練語料中的詞匯,獲得理想的識(shí)別效果。