本文為您介紹如何在控制臺創建定制模型并應用模型。
前提條件
已開通智能語音交互服務,詳情請參見開通服務。
訓練語料說明
調用限制
該功能免費開放給所有開通智能語音交互免費版和商用版的用戶。
訓練數據為領域相關的文本,與待識別語音數據越接近,優化效果越好。
以文本方式保存,使用
UTF-8(無BOM)
格式編碼,文件大小不超過10 MB。每位用戶最多支持創建10個模型。
一句話或者一個被加強調優的關鍵詞單獨一行,控制每行的長度在500個字符以內。
文本中的數字需要按照發音替換為對應的漢字。例如,“58.9元”需要轉換為“五十八點九元”。
文件中需要至少有一行為句子(大于4個詞)。
只采用逗號(,)、句號(。)、問號(?)和感嘆號(!),句尾需要加標點。像書名號(《》)、雙引號(“”)等標點應去除。
優化建議
對于識別不準確的關鍵詞,可以將含該詞的句子或者關鍵詞(一個關鍵詞在訓練文本中獨占一行)多復制幾行,例如10行。如果效果仍不滿意,可以適當增加復制行數。
需要首先排除關鍵詞識別不準確,不是由發音不清晰或者音頻質量不好造成的。
建議經過識別試錯,謹慎提供訓練語料,避免相同發音的其他內容識別錯誤。
操作步驟
登錄智能語音交互控制臺。
單擊左側導航欄自學習平臺>語言模型定制。
首次使用時請單擊頁面中的免費開通,然后在彈出的對話框中單擊確定。
創建模型。
在語言模型定制頁面的模型頁簽下,單擊創建模型。
在創建模型面板中,輸入定制模型的名稱。
重要不能和已有定制模型的名稱重復。
從全部模型列表中選擇匹配業務需要的基礎模型,定制模型將基于選定的基礎模型進行訓練。
單擊下一步。
上傳語料。
可選擇上傳數據集或者選擇已有數據集(非初次使用定制模型客戶可選擇已有數據集),完成后單擊確定。
上傳語料后,您可以在模型列表中查看您創建的模型,此時模型狀態顯示未訓練。
單擊模型右側操作欄的訓練模型,進行模型訓練。
模型訓練可能需要一定時間,訓練完成后,模型狀態自動更新為模型上線。
單擊模型右側操作欄的自動化測試,創建自動化測試任務。詳情請參見自動化測試。
應用模型。當模型狀態為模型上線時,您就可以在項目中應用該模型。
在左側導航欄選擇全部項目,在我的所有項目頁面,單擊目標項目右側操作欄下的項目功能配置。
在語音識別ASR下,單擊修改配置,選擇語言識別模型,單擊確認使用。
在項目配置頁面的自學習區域,選中您已定制好的模型場景,單擊應用。
說明語言模型定制時選的基礎模型需要和當前項目配置的語音識別模型一致,才會在下拉框中顯示您定制的模型名稱。