本文主要介紹如何通過API管理熱詞。 在通義聽悟的語音轉寫中,如果您的業務領域有部分詞匯默認識別效果不夠好,可以考慮使用熱詞功能,將這些詞添加到熱詞詞表從而改善語音識別效果。
使用須知
目前僅支持中文熱詞識別。
每個用戶默認最多創建10個熱詞詞表。
每個詞表最多包含300個熱詞,每個熱詞長度不超過10個字符。
熱詞必須為UTF-8編碼,不能包含標點、特殊字符。
熱詞對應的權重取值范圍為[-6,5]之間的整數。
文本中的數字需要按照發音替換為對應的漢字。例如:“58.9元”需要替換為“五十八點九元”。
取值大于0會增大該詞語被識別的概率,小于0會減小該詞語被識別的概率。
取值為-6:表示盡量不要識別出該詞語。
取值為2:常用值。
如果效果不明顯可以適當增加權重,但是當權重較大時可能會引起負面效果,導致其他詞語識別不準確。
交互流程
前提條件
AccessKey環境變量設置
需要使用您的AccessKey的Id和secret替換如下命令中的YOUR_ACCESS_KEY_ID和YOUR_ACCESS_KEY_SECRET。
export ALIBABA_CLOUD_ACCESS_KEY_ID=YOUR_ACCESS_KEY_ID &&
export ALIBABA_CLOUD_ACCESS_KEY_SECRET=YOUR_ACCESS_KEY_SECRET
接入步驟
用戶從客戶端提交創建熱詞詞表的請求。
正常情況下,服務端返回創建完成的熱詞詞表PhraseId,用于后續的語音識別任務。
如果調用出錯,響應報文中會給出相關錯誤信息,以及RequestId,您可自行據此排查調用參數,也可以將響應報文通過工單形式提交給我們做進一步排查。
使用熱詞詞表
當提交音視頻文件離線轉寫請求或實時記錄請求時,傳入上一步創建成功的熱詞詞表PhraseId,將PhraseId添加到創建聽悟任務的Transcription參數中從而改善語音識別效果。
參數名 | 類型 | 是否必填 | 說明 |
Transcription.PhraseId | String | 否 | 熱詞詞表ID。 |
根據熱詞詞表的PhraseId獲取該詞表的詳細熱詞以及對應權重信息。
根據熱詞詞表的PhraseId更新對應的詞表信息,包括詞表名稱、詞表描述信息、詞表內的熱詞和對應權重。
根據熱詞詞表的PhraseId刪除對應的詞表。
根據用戶UID列舉出該用戶的所有熱詞詞表,包括詞表PhraseId、詞表名稱以及詞表描述。