本文介紹智能語音交互產品功能的最新動態和相關文檔。
2023年04月~2024年01月
功能分類 | 功能名稱 | 功能描述 | 更新類型 | 文檔鏈接 |
語音識別 | 字幕上屏 | 錄音文件識別、錄音文件識別極速版、錄音文件識別閑時版支持字幕上屏場景。 | 新增 | |
語音識別 | 百煉服務 | 高性價比實時語音識別上線。 | 新增 | |
語音合成 | 輕量化語音合成 | 新增輕量化語音合成音色定制。 | 新增 | |
語音合成 | 百煉服務 | 高性價比語音合成上線。 | 新增 | |
語音識別 | 百煉服務 | 模型服務—錄音文件識別,支持的語種/方言包括:中文普通話、中文方言(粵語、吳語、閩南語、東北話、甘肅話、貴州話、河南話、湖北話、湖南話、寧夏話、山西話、陜西話、山東話、四川話、天津話)、英語、日語、韓語、西班牙語、印尼語、法語、德語、意大利語、馬來語。 | 新增 | |
語音合成 | 小語種音色 | 語音合成新增以下小語種音色:俄語、韓語、越南語、泰語、意大利語、西班牙語、法語、德語、美式英文(男女聲)。 | 新增 | |
語音識別 | 方言 | 新增16k粵中自由說方言模型。 | 新增 | |
語音合成 | 數字人、多情感音色 | 新增7個數字人音色:知小白、知小夏、知小妹、知柜、知碩、艾夏、Cally。 新增2個多情感音色:知鋒、知冰。 | 新增 |
2022年03月~2023年03月
功能分類 | 功能名稱 | 功能描述 | 更新類型 | 文檔鏈接 |
語音識別 | 新增語音分析分類4項新產品規格 | 新產品規格:
| 新增 | |
錄音文件支持MP4格式入參 | 3個服務支持MP4入參:
| 新增 | ||
移動端Android/iOS SDK |
| 新增 | ||
Cpp SDK |
| 新增 | ||
新增 16k 識別能力 | 中英自由說(混合識別)、粵語(繁體)、葡萄牙語、土耳其語、希臘語、爪哇語、孟加拉語、捷克語、烏爾都語、尼泊爾語、蒙古語(外蒙)、烏茲別克語、僧伽羅語、馬拉地語、泰盧固語、旁遮普語、瑞典語、保加利亞語、加泰羅尼亞語、希伯來語、克羅地亞語、豪薩語、緬甸語、老撾語、斯瓦希里語、阿塞拜疆語、波斯語、丹麥語、挪威語、馬拉雅拉姆語、坎納達語。 | 新增 | ||
新增 8k 識別能力 | 粵語(繁體)、越南語、泰語、馬來語、西班牙語。 | 新增 | ||
熱詞添加數量擴充 | 由原來每組128個詞擴充至500個詞。 | 優化 | ||
語音合成 | 增加拼音級音素時間戳 | 語音合成、實時長文本語音合成、異步長文本語音合成服務,新增拼音級音素時間戳。 | 新增 | |
增加逐字時間戳 | 實時長文本語音合成服務新增逐字時間戳功能。 | 優化 | ||
新增多情感音色 | 語音合成、實時長文本語音合成、異步長文本語音合成服務中,新增支持音色:
| 新增 | ||
新增多語種音色 | 語音合成、實時長文本語音合成、異步長文本語音合成服務中,新增支持音色:
| 新增 | ||
新增中文精品音色 | 語音合成、實時長文本語音合成、異步長文本語音合成服務中,新增支持音色:
| 新增 |
2022年03月21日
功能分類 | 功能名稱 | 功能描述 | 更新類型 | 文檔鏈接 |
地域和域名 | 多地域 | 為進一步降低華北和華南用戶的網絡接入時延,智能語音交互產品在當前華東2(上海)地域的基礎上新增華北2(北京)和華南1(深圳)地域。 | 新增 | 新增:地域和域名 相關更新文檔:
|
2022年03月04日
功能分類 | 功能名稱 | 功能描述 | 更新類型 | 文檔鏈接 |
語音識別 | 新增SDK | 新增四種開發語言的SDK,包含C# SDK、Go SDK、Node.js SDK和微信小程序。 | 新增 |
|
語音合成 | 新增SDK | 新增四種開發語言的SDK,包含C# SDK、Go SDK、Node.js SDK和微信小程序。 | 新增 |
2022年02月17日
功能分類 | 功能名稱 | 功能描述 | 更新類型 | 文檔鏈接 |
語音識別 | 優化SDK功能 | 優化C++ SDK功能。 | 優化 | |
語音合成 | 優化SDK功能 | 優化C++ SDK功能。 | 優化 |
2022年02月09日
功能分類 | 功能名稱 | 功能描述 | 更新類型 | 文檔鏈接 |
語音識別 | 錄音文件識別閑時版 |
| 新增 |
2022年01月21日
功能分類 | 功能名稱 | 功能描述 | 更新類型 | 文檔鏈接 |
語音識別 | 錄音文件識別閑時版 | 錄音文件識別閑時版是針對已經錄制完成的錄音文件,進行離線識別的服務。與錄音文件識別區別在于返回時間不同,閑時版為24小時內返回結果。 | 新增 | |
語音合成 | 新增音色-中文 |
| 新增 | |
新增音色-多語種 |
| 新增 |
2021年12月23日
功能分類 | 功能名稱 | 功能描述 | 更新類型 | 文檔鏈接 |
語音識別 | 優化SDK功能 | 優化Python SDK功能。 | 優化 |
|
語音合成 | 優化SDK功能 | 優化Python SDK功能。 | 優化 |
2021年07月30日
功能分類 | 功能名稱 | 功能描述 | 更新類型 | 文檔鏈接 |
語音識別 | 識音石模型 | 識音石模型替換17種通用或領域模型。 | 優化 | 無 |
控制臺 | 管理項目 | 優化項目創建流程,創建后自動引導配置識別模型或合成聲音。 | 優化 | |
自學習-定制語言模型 | 優化語音模型定制流程,加強對數據格式要求的說明,避免引導不清造成的誤操作;細化報錯提示信息,提供建議解決方法。 | 優化 | ||
自動化測試 | 增加測試結果查看的快捷操作按鈕。 | 優化 | ||
產品計費 | 計量計費報表規則說明 | 加強控制臺對計量計費統計結果展示規則(當日用量和費用次日可查看)的說明。 | 優化 | 無 |
2021年07月08日
功能分類 | 功能名稱 | 功能描述 | 更新類型 | 文檔鏈接 |
語音識別 | C++ SDK優化 | 上線C++ SDK 3.0.10用戶文檔。 | 優化 | |
解決C++ SDK處理websocket數據的crash問題。 | 優化 | 無 | ||
俄語識別優化 | 解決俄語識別空格丟失的問題。 | 優化 | 無 | |
語音合成 | 新增聲音 |
| 新增 | |
引擎更新 | 超高清場景聲音支持流式播放。 | 新增 | 無 | |
提升合成服務穩定性。 | 優化 | 無 | ||
英文聲音停頓優化 | 更新英文Abby,Emily和Eric,解決某些句子出現長停頓的問題。 | 優化 | 無 |
2021年06月03日
功能分類 | 功能名稱 | 功能描述 | 更新類型 | 相關鏈接 |
語音識別 | 語義斷句更新 | 實時轉寫在開啟語義斷句后,識別的中間結果默認進行流式itn處理,解決字幕上屏場景中,數字閃現跳變問題(從漢字數字變成阿拉伯數字)。 | 優化 | 無 |
語音合成 | 支持離線語音合成免費試用及自助接入 |
| 新增 | |
模型更新 |
| 新增 | 無 | |
引擎更新 | 支持英文SSML標簽中的say-as標簽 | 新增 | ||
SDK更新 | SDK從原本采樣率只支持8K/16K擴充至可支持24K/48K設置 | 增加 | 無 |
2021年05月13日
功能分類 | 功能名稱 | 功能描述 | 更新類型 | 相關鏈接 |
語音識別 | 識音石V1-端到端中文普通話識別模型 |
| 新增 | |
后處理模型更新 |
| 優化 | 無 | |
VAD模型更新 | common_8k人機噪聲優化版模型發布上線。 | 優化 | 無 | |
角色分離模型更新 |
| 優化 | 無 | |
語音合成 | 新增界面化下載功能 | 在管控臺語音合成配置頁面中,增加了采樣率、格式的調整功能,并增加了下載功能。 | 新增 | |
引擎更新 | 優化超高清場景性能。 | 優化 | 無 | |
模型更新 | 增加知祥、知倩、知楠、知德、知茹、知佳6個超高清場景聲音。 | 新增 | 無 |
2021年03月23日
功能分類 | 功能名稱 | 功能描述 | 更新類型 | 文檔鏈接 |
語音合成 | 新增離線語音合成 | 離線語音合成能力發布。 | 新增 | |
新增超高清合成聲音 | 新增超高清聲音:知琪、知廚。 | 新增 | ||
新增合成聲音 |
| 新增 | ||
優化停頓控制 | 整體升級前端停頓模型,增加后處理規則,客服、小說、新聞、百科等領域的不可接受率有顯著的下降。 | 優化 | 無 | |
詞典及數字符號正則化規則修復 |
| 修復 | 無 | |
語音識別 | 中文普通話模型 | 提升生僻字識別效果;提升8k-通用-電話客服模型對小音量語音的識別效果。 | 優化 | 無 |
中文普通話模型(升級版) |
| 優化 | 無 | |
錄音文件識別(包括極速版)增加對音頻通道選擇的參數 | 對于多通道文件,用戶可通過參數指定需要轉寫的通道,可略過不需要轉寫的通道以節省成本。 | 新增 | ||
錄音文件識別(包括極速版)增加語義斷句功能 | 可通過參數控制是否開啟語義斷句功能。 | 新增 | ||
產品文檔更新 |
| 新增 |
2020年11月27日
功能分類 | 功能名稱 | 功能描述 | 更新類型 | 相關文檔 |
語音識別 | 錄音文件識別極速版 | 錄音文件識別極速版支持全場景的語音識別模型,管控臺支持錄音文件識別極速版的調用量查詢。 | 新增 | |
語音識別對WAV文件的支持優化 | 優化ASR對WAV文件的支持。支持更多格式的WAV文件頭,減少文件頭對識別結果的影響。 | 優化 | 無 | |
錄音文件識別極速版超時 | 錄音文件識別極速版使用16k模型進行8k語音識別時沒有直接返回錯誤,導致超時斷開的問題。 | 修復 | 無 | |
訪問令牌 | 令牌生成機制優化 | 改進令牌生成機制,增加令牌有效期,避免原有“每24小時更新令牌”機制下,可能造成的請求失敗發生。 | 優化 |
2020年08月23日
功能分類 | 功能名稱 | 功能描述 | 更新類型 | 相關文檔 |
語音合成 | 語音合成新增資源和場景配置 |
| 新增 | |
語音識別 | 實時語音識別斷句時長優化 | 實時語音識別默認最大斷句時長由60秒縮短至15秒,方便您進行相關接口調用。 | 優化 | |
語音識別通用模型和客服質檢問題修復 |
| 修復 |
2020年07月23日
功能分類 | 功能名稱 | 功能描述 | 更新類型 | 相關文檔 |
自學習訓練 | 自學習模型開發免費使用 | 自學習模型全面開放免費使用,為您提供零成本個性化語音定制服務,助力業務創新。 | 新增 | |
自學習平臺訓練流程 |
| 新增 | ||
語音合成 | 長文本語音合成 | 長文本RESTful接口集成字幕能力對外正式發布,官網開發文檔上線。 | 新增 | |
SDK | 上線Android/iOS雙端新版SDK |
| 優化 | 無 |
語音識別 | 語音識別問題修復 | 英文后處理效果優化,解決部分情況下,啟用標點后識別結果格式錯誤的問題。 | 修復 | 無 |
2020年07月09日
功能分類 | 功能名稱 | 功能描述 | 更新類型 | 相關文檔 |
語音識別 | 語音識別模型優化 | 一句話識別/實時語音識別/錄音文件識別8K音頻采樣率的英文識別模型更新,在通用測試集字識別準確率沒有下降的情況下,提升模型口音覆蓋的廣度,同時在語言模型上更加通用。 | 優化 | |
語音合成 | 語音合成模型修復 |
| 修復 | 無 |