日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

功能發布記錄

本文介紹智能語音交互產品功能的最新動態和相關文檔。

2023年04月~2024年01月

功能分類

功能名稱

功能描述

更新類型

文檔鏈接

語音識別

字幕上屏

錄音文件識別、錄音文件識別極速版、錄音文件識別閑時版支持字幕上屏場景。

新增

接口說明

語音識別

百煉服務

高性價比實時語音識別上線。

新增

實時語音識別API詳情

語音合成

輕量化語音合成

新增輕量化語音合成音色定制。

新增

個性化人聲定制

語音合成

百煉服務

高性價比語音合成上線。

新增

語音合成

語音識別

百煉服務

模型服務—錄音文件識別,支持的語種/方言包括:中文普通話、中文方言(粵語、吳語、閩南語、東北話、甘肅話、貴州話、河南話、湖北話、湖南話、寧夏話、山西話、陜西話、山東話、四川話、天津話)、英語、日語、韓語、西班牙語、印尼語、法語、德語、意大利語、馬來語。

新增

錄音文件識別API詳情

語音合成

小語種音色

語音合成新增以下小語種音色:俄語、韓語、越南語、泰語、意大利語、西班牙語、法語、德語、美式英文(男女聲)。

新增

接口說明

語音識別

方言

新增16k粵中自由說方言模型。

新增

語音識別

語音合成

數字人、多情感音色

新增7個數字人音色:知小白、知小夏、知小妹、知柜、知碩、艾夏、Cally。

新增2個多情感音色:知鋒、知冰。

新增

語音合成

2022年03月~2023年03月

功能分類

功能名稱

功能描述

更新類型

文檔鏈接

語音識別

新增語音分析分類4項新產品規格

新產品規格:

  1. 聲音事件檢測

  2. 說話人識別

  3. 性別識別

  4. 語種識別

新增

語音分析

錄音文件支持MP4格式入參

3個服務支持MP4入參:

  • 錄音文件識別

  • 錄音文件識別極速版

  • 錄音文件識別閑時版

新增

接口說明

移動端Android/iOS SDK

  1. 支持【長文本語音合成】。

  2. 支持STS安全訪問。

  3. 更高準確率的離線鑒權方案。

  4. iOS支持xcode14。

新增

SDK和API概覽

Cpp SDK

  1. 支持windows x86 x64,支持ue5。

  2. windows C#支持,支持unity。

  3. 支持長文本語音合成。

  4. 支持國有化平臺Linux-Aarch64。

  5. CXX11支持。

  6. 增加錄音文件識別功能。

新增

SDK和API概覽

新增 16k 識別能力

中英自由說(混合識別)、粵語(繁體)、葡萄牙語、土耳其語、希臘語、爪哇語、孟加拉語、捷克語、烏爾都語、尼泊爾語、蒙古語(外蒙)、烏茲別克語、僧伽羅語、馬拉地語、泰盧固語、旁遮普語、瑞典語、保加利亞語、加泰羅尼亞語、希伯來語、克羅地亞語、豪薩語、緬甸語、老撾語、斯瓦希里語、阿塞拜疆語、波斯語、丹麥語、挪威語、馬拉雅拉姆語、坎納達語。

新增

語音識別

新增 8k 識別能力

粵語(繁體)、越南語、泰語、馬來語、西班牙語。

新增

語音識別

熱詞添加數量擴充

由原來每組128個詞擴充至500個詞。

優化

概述

語音合成

增加拼音級音素時間戳

語音合成、實時長文本語音合成、異步長文本語音合成服務,新增拼音級音素時間戳。

新增

語音合成時間戳功能介紹

增加逐字時間戳

實時長文本語音合成服務新增逐字時間戳功能。

優化

語音合成時間戳功能介紹

新增多情感音色

語音合成、實時長文本語音合成、異步長文本語音合成服務中,新增支持音色:

  • 知妙_多情感

  • 知燕_多情感

  • 知貝_多情感

  • 知甜_多情感

  • 知米_多情感

新增

接口說明

新增多語種音色

語音合成、實時長文本語音合成、異步長文本語音合成服務中,新增支持音色:

  • 菲律賓語女聲

  • 越南語女聲

  • 俄語女聲

  • 韓語女聲

  • 美語客服女聲

  • 西班牙女聲

  • 意大利女聲

新增

接口說明

新增中文精品音色

語音合成、實時長文本語音合成、異步長文本語音合成服務中,新增支持音色:

  • 知貓

  • 知媛

  • 知柜

  • 知雅

  • 知碩

  • 知達

  • 知悅

  • 知莎

  • Kelly中國(香港)粵語

新增

接口說明

2022年03月21日

功能分類

功能名稱

功能描述

更新類型

文檔鏈接

地域和域名

多地域

為進一步降低華北和華南用戶的網絡接入時延,智能語音交互產品在當前華東2(上海)地域的基礎上新增華北2(北京)華南1(深圳)地域。

新增

新增:地域和域名

相關更新文檔:

2022年03月04日

功能分類

功能名稱

功能描述

更新類型

文檔鏈接

語音識別

新增SDK

新增四種開發語言的SDK,包含C# SDK、Go SDK、Node.js SDK和微信小程序。

新增

語音合成

新增SDK

新增四種開發語言的SDK,包含C# SDK、Go SDK、Node.js SDK和微信小程序。

新增

2022年02月17日

功能分類

功能名稱

功能描述

更新類型

文檔鏈接

語音識別

優化SDK功能

優化C++ SDK功能。

優化

語音合成

優化SDK功能

優化C++ SDK功能。

優化

C++ SDK

2022年02月09日

功能分類

功能名稱

功能描述

更新類型

文檔鏈接

語音識別

錄音文件識別閑時版

  • 泰米爾(16K)

  • 波蘭語(16K)

  • 烏克蘭語(16K)

  • 羅馬尼亞語(16K)

  • 荷蘭語(16K)

  • 匈牙利語(16K)

  • 高棉語(16K)

  • 菲律賓(16K, 8K)

  • 西班牙(16K, 8K )

  • 印尼(8K)

  • 越南(8K)

新增

語音識別服務支持的方言模型和語種都有哪些?

2022年01月21日

功能分類

功能名稱

功能描述

更新類型

文檔鏈接

語音識別

錄音文件識別閑時版

錄音文件識別閑時版是針對已經錄制完成的錄音文件,進行離線識別的服務。與錄音文件識別區別在于返回時間不同,閑時版為24小時內返回結果。

新增

錄音文件識別閑時版

語音合成

新增音色-中文

  • 治愈童聲杰力豆

  • 東北男聲老鐵

  • 蘿莉女聲知薇

  • 直播女聲老妹

  • 天津男聲艾侃

  • 臺灣女聲 zhiqing

  • 甜美女聲 zhitian

新增

新增音色-多語種

  • 美語女聲 Annie

  • 菲律賓語女聲 Tala

新增

2021年12月23日

功能分類

功能名稱

功能描述

更新類型

文檔鏈接

語音識別

優化SDK功能

優化Python SDK功能。

優化

語音合成

優化SDK功能

優化Python SDK功能。

優化

Python SDK

2021年07月30日

功能分類

功能名稱

功能描述

更新類型

文檔鏈接

語音識別

識音石模型

識音石模型替換17種通用或領域模型。

優化

控制臺

管理項目

優化項目創建流程,創建后自動引導配置識別模型或合成聲音。

優化

管理項目

自學習-定制語言模型

優化語音模型定制流程,加強對數據格式要求的說明,避免引導不清造成的誤操作;細化報錯提示信息,提供建議解決方法。

優化

定制語言模型

自動化測試

增加測試結果查看的快捷操作按鈕。

優化

自動化測試

產品計費

計量計費報表規則說明

加強控制臺對計量計費統計結果展示規則(當日用量和費用次日可查看)的說明。

優化

2021年07月08日

功能分類

功能名稱

功能描述

更新類型

文檔鏈接

語音識別

C++ SDK優化

上線C++ SDK 3.0.10用戶文檔。

優化

解決C++ SDK處理websocket數據的crash問題。

優化

俄語識別優化

解決俄語識別空格丟失的問題。

優化

語音合成

新增聲音

  • 超高清場景:蘿莉童聲-知薇

  • 直播場景:東北老鐵-老鐵、吆喝女聲-老妹

  • 童聲: 治愈男童-杰力豆

新增

語音合成接口說明

引擎更新

超高清場景聲音支持流式播放。

新增

提升合成服務穩定性。

優化

英文聲音停頓優化

更新英文Abby,Emily和Eric,解決某些句子出現長停頓的問題。

優化

2021年06月03日

功能分類

功能名稱

功能描述

更新類型

相關鏈接

語音識別

語義斷句更新

實時轉寫在開啟語義斷句后,識別的中間結果默認進行流式itn處理,解決字幕上屏場景中,數字閃現跳變問題(從漢字數字變成阿拉伯數字)。

優化

語音合成

支持離線語音合成免費試用及自助接入

  • 用戶可以免費試用5個標準版離線語音合成SDK和5個精品版離線語音合成SDK

  • 支持購買商用版SDK,永久授權。

新增

模型更新

  • 增加艾飛、艾倫2個直播-視頻配音聲音

  • 增加知飛、知倫2個超高清場景聲音

  • 增加ava美式英語聲音

新增

引擎更新

支持英文SSML標簽中的say-as標簽

新增

SSML標記語言介紹

SDK更新

SDK從原本采樣率只支持8K/16K擴充至可支持24K/48K設置

增加

2021年05月13日

功能分類

功能名稱

功能描述

更新類型

相關鏈接

語音識別

識音石V1-端到端中文普通話識別模型

  • 識別準確率高:

    基于自研端到端的語音識別框架,中文識別準確率可達業內最高水平。在客服,輸入法,會議等領域識別字錯誤率相比上一代系統相對下降10%~30%。

  • 同時支持實時和離線語音識別,支持8k和16k模型。

  • 識別速度快:

    采用“字”級別建模單元及自研模型推理引擎,并發推理速度相比業內主流推理框架提升10倍以上;服務響應毫秒級延遲。

新增

識音石V1·識音

后處理模型更新

  • 修復英文ITN時間戳問題。

  • 修復ITN離線時間戳的輸出平臺差異的問題。

  • 修復流式ITN尾部多空格的問題。

  • 解決典型缺陷:

    • 二十三十年 -> 二十三十年

    • 一百零二年 -> 102年

    • 文一西路九六九號 ->文一西路969號

優化

VAD模型更新

common_8k人機噪聲優化版模型發布上線。

優化

角色分離模型更新

  • 8k有監督角色分離算法增加并行化模式,單次請求到拿到輸出結果變得更快。

  • 增加對噪聲的魯棒性,進一步減少噪聲干擾導致的單角色輸出缺陷。

優化

語音合成

新增界面化下載功能

在管控臺語音合成配置頁面中,增加了采樣率、格式的調整功能,并增加了下載功能。

新增

給小白的TTS工具——不懂代碼也能合成并下載音頻

引擎更新

優化超高清場景性能。

優化

模型更新

增加知祥、知倩、知楠、知德、知茹、知佳6個超高清場景聲音。

新增

2021年03月23日

功能分類

功能名稱

功能描述

更新類型

文檔鏈接

語音合成

新增離線語音合成

離線語音合成能力發布。

新增

接口說明

新增超高清合成聲音

新增超高清聲音:知琪、知廚。

新增

接口說明

新增合成聲音

  • 新增發音人:粵語女聲佳佳、粵語女聲桃子、日語男聲智也、日語男聲智香、美式英語Annie、印尼語女聲Indah。

  • 文學場景資訊聲音:艾笑、艾樹、艾茹、艾倩。

  • 直播場景:柜姐、Stella等。

新增

接口說明

優化停頓控制

整體升級前端停頓模型,增加后處理規則,客服、小說、新聞、百科等領域的不可接受率有顯著的下降。

優化

詞典及數字符號正則化規則修復

  • 增加詞條,如:“?(yan3),熀(huang3)”。

  • 修復中文多音字的合成發音問題,如:“新冠肺炎、新冠病毒、新冠疫苗”等。

  • 優化數字符號正則化規則,如:“新增對羅馬數字1到10的大小寫”。

  • 增加英式及美式英語部分詞條,如:“EB病毒,iOS”。

  • 印尼語正則化規則及詞典更新。

修復

語音識別

中文普通話模型

提升生僻字識別效果;提升8k-通用-電話客服模型對小音量語音的識別效果。

優化

中文普通話模型(升級版)

  • 提升噪音場景下識別效果。

  • 提升生僻字識別效果。

  • 提升普通話中混雜的口音的識別效果。

  • 提升對鬼畜音頻的識別效果,減少識別結果中的異常重復現象。

  • 提升直播場景下中英混讀的識別效果。

優化

錄音文件識別(包括極速版)增加對音頻通道選擇的參數

對于多通道文件,用戶可通過參數指定需要轉寫的通道,可略過不需要轉寫的通道以節省成本。

新增

接口說明

錄音文件識別(包括極速版)增加語義斷句功能

可通過參數控制是否開啟語義斷句功能。

新增

接口說明

產品文檔更新

  • 關于方言,口音,增加更多通俗易懂的說明。

  • 增加產品應用視頻。

  • 增加錄音文件識別調用QPS的相關說明。

新增

接口說明

2020年11月27日

功能分類

功能名稱

功能描述

更新類型

相關文檔

語音識別

錄音文件識別極速版

錄音文件識別極速版支持全場景的語音識別模型,管控臺支持錄音文件識別極速版的調用量查詢。

新增

接口說明

語音識別對WAV文件的支持優化

優化ASR對WAV文件的支持。支持更多格式的WAV文件頭,減少文件頭對識別結果的影響。

優化

錄音文件識別極速版超時

錄音文件識別極速版使用16k模型進行8k語音識別時沒有直接返回錯誤,導致超時斷開的問題。

修復

訪問令牌

令牌生成機制優化

改進令牌生成機制,增加令牌有效期,避免原有“每24小時更新令牌”機制下,可能造成的請求失敗發生。

優化

通過SDK獲取Token

2020年08月23日

功能分類

功能名稱

功能描述

更新類型

相關文檔

語音合成

語音合成新增資源和場景配置

  • 語音合成的SSML增加資源標簽,可解析“多模態交互使用的離線資源”,并可取代時間戳中每個字的位置信息。

  • 語音合成的RESTful接口支持在管控臺配置說話人、音量、語速和語調參數功能,方便接口調參配置。

  • 語音合成新增文學場景發音人:艾楠、艾顏、艾浩、艾茗,為您提供更多選擇。

新增

接口說明

語音識別

實時語音識別斷句時長優化

實時語音識別默認最大斷句時長由60秒縮短至15秒,方便您進行相關接口調用。

優化

接口說明

語音識別通用模型和客服質檢問題修復

  • 語音識別16k中文通用模型,改善語音活動檢測(Voice Activity Detectio)效果,解決純靜音數據誤檢出語音的問題。

  • 語音識別8k中文客服質檢/8k英文客服質檢/16k韓語模型:語言模型常規更新,修復部分識別有誤的場景。

修復

接口說明

2020年07月23日

功能分類

功能名稱

功能描述

更新類型

相關文檔

自學習訓練

自學習模型開發免費使用

自學習模型全面開放免費使用,為您提供零成本個性化語音定制服務,助力業務創新。

新增

概述

自學習平臺訓練流程

  • 新增推薦最佳基線模型,方便您進行訓練。

  • 結合自動化測試,增加模型可量化的測試指標結果

新增

概述

語音合成

長文本語音合成

長文本RESTful接口集成字幕能力對外正式發布,官網開發文檔上線。

新增

RESTful API

SDK

上線Android/iOS雙端新版SDK

  • Android SDK體積減少34.6%、iOS SDK體積減少17.5%,經歷日億次調用次數考驗,穩定性極強。

  • 完善SDK的狀態管理(開/關音頻、數據推送等),您可以專注業務實現而無需進行復雜的狀態與線程管理。

  • 與全鏈路解決方案保持接口一致。后續可無縫對接喚醒、聲音、對話理解、離線語音合成等智能語音交互場景。

優化

語音識別

語音識別問題修復

英文后處理效果優化,解決部分情況下,啟用標點后識別結果格式錯誤的問題。

修復

2020年07月09日

功能分類

功能名稱

功能描述

更新類型

相關文檔

語音識別

語音識別模型優化

一句話識別/實時語音識別/錄音文件識別8K音頻采樣率的英文識別模型更新,在通用測試集字識別準確率沒有下降的情況下,提升模型口音覆蓋的廣度,同時在語言模型上更加通用。

優化

接口說明

語音合成

語音合成模型修復

  • Abby(發音人名稱):降低漏字率。

  • Wendy(發音人名稱):解決較長文本合成不穩定的問題。

  • 英文場景:解決英文文本出現非標空格導致單詞解析失敗的情況,提高單詞識別準確率。

  • 中文場景:修復多音字和分詞問題。

修復