功能發(fā)布記錄
本文介紹通義聽(tīng)悟產(chǎn)品功能的最新動(dòng)態(tài)和相關(guān)文檔。
2024年9月30日
功能名稱 | 功能說(shuō)明 |
音視頻文件離線轉(zhuǎn)寫(xiě)支持多語(yǔ)種混合識(shí)別 | 音視頻文件離線轉(zhuǎn)寫(xiě)16K新增中英日韓粵德法俄混合說(shuō)。同時(shí)可通過(guò)控制參數(shù)識(shí)別語(yǔ)種,避免中間過(guò)程其他語(yǔ)種亂入的情況。 |
離線轉(zhuǎn)寫(xiě)新增泰語(yǔ) | 自動(dòng)語(yǔ)種識(shí)別新增泰語(yǔ),即能自動(dòng)識(shí)別中/英/日/韓/粵/泰語(yǔ)的音視頻并進(jìn)行對(duì)應(yīng)語(yǔ)種轉(zhuǎn)寫(xiě)(一個(gè)文件僅支持一個(gè)語(yǔ)種);同時(shí)單獨(dú)語(yǔ)種也支持識(shí)別泰語(yǔ)。 |
離線轉(zhuǎn)寫(xiě)效率優(yōu)化 | 降低離線轉(zhuǎn)寫(xiě)的耗時(shí)。 |
2024年8月31日
功能名稱 | 功能說(shuō)明 |
實(shí)時(shí)8K效率優(yōu)化 | 縮短了實(shí)時(shí)8K ASR的轉(zhuǎn)寫(xiě)延遲。 |
服務(wù)質(zhì)檢可返回發(fā)言人 | “服務(wù)質(zhì)檢”返回句子ID可兼容帶入發(fā)言人ID的情況。 |
ITN返回優(yōu)化 | 百分比等標(biāo)點(diǎn)的返回優(yōu)化。 |
實(shí)時(shí)推流的python SDK | 發(fā)布了實(shí)時(shí)推流的PythonSDK。 |
實(shí)時(shí)多語(yǔ)言自由說(shuō)升級(jí) | 新增德法俄語(yǔ)種,即支持實(shí)時(shí)中英日韓粵德法俄混合說(shuō)。同時(shí)可通過(guò)控制參數(shù)識(shí)別語(yǔ)種,避免中間過(guò)程其他語(yǔ)種亂入的情況。 |
實(shí)時(shí)說(shuō)話人分離 | 支持實(shí)時(shí)會(huì)議中的說(shuō)話人分離。 |
發(fā)布節(jié)省計(jì)劃 | 支持預(yù)付費(fèi)節(jié)省計(jì)劃,進(jìn)一步降低使用成本。 |
Appkey維度的出賬 | 出賬細(xì)化到Appkey維度,方便區(qū)分各項(xiàng)目的成本情況。 |
2024年6月30日
功能名稱 | 功能說(shuō)明 |
控制臺(tái)增加用量統(tǒng)計(jì) | 細(xì)化了用量統(tǒng)計(jì)與查詢。 |
實(shí)時(shí)多語(yǔ)言自由說(shuō) | 發(fā)布中英日韓粵語(yǔ)自由說(shuō)。 |
服務(wù)質(zhì)檢 | 新增服務(wù)質(zhì)檢的大模型能力。 |
2024年5月29日
功能名稱 | 功能說(shuō)明 |
價(jià)格大幅下調(diào) | 對(duì)標(biāo)千問(wèn),價(jià)格大幅下調(diào)。 |
2024年5月21日
功能名稱 | 功能說(shuō)明 |
實(shí)時(shí)記錄新增轉(zhuǎn)寫(xiě)語(yǔ)種 | 16K支持識(shí)別中英日韓粵自由說(shuō)。 |
2024年4月24日
功能名稱 | 功能說(shuō)明 |
價(jià)格調(diào)整 | 語(yǔ)音轉(zhuǎn)文字功能統(tǒng)一下調(diào)至0.6元/小時(shí); 大模型每個(gè)能力0.22元/小時(shí),多個(gè)能力調(diào)用時(shí)疊加計(jì)費(fèi); 視頻PPT提取下調(diào)至0.8元/小時(shí); 翻譯價(jià)格也同步下調(diào)。 |
自定義Prompt | 支持對(duì)轉(zhuǎn)寫(xiě)結(jié)果自定義Prompt,根據(jù)自身業(yè)務(wù)需求,應(yīng)用大模型各類能力。 創(chuàng)建大模型任務(wù),支持:聽(tīng)悟-Turbo、聽(tīng)悟-Plus、千問(wèn)-Max三種模型規(guī)格。 |
音視頻文件離線轉(zhuǎn)寫(xiě)支持自動(dòng)語(yǔ)種識(shí)別 | 音視頻文件離線轉(zhuǎn)寫(xiě)支持自動(dòng)語(yǔ)種識(shí)別,可自動(dòng)識(shí)別中/英/日/韓/粵語(yǔ)的音視頻并進(jìn)行對(duì)應(yīng)語(yǔ)種轉(zhuǎn)寫(xiě)(一個(gè)文件僅支持一個(gè)語(yǔ)種)。 用戶上傳文件時(shí),無(wú)需再選擇語(yǔ)種,簡(jiǎn)化用戶操作與技術(shù)對(duì)接流程。 |
2024年3月26日
功能名稱 | 功能說(shuō)明 |
AI模型能力升級(jí) | 新增支持大模型提煉思維導(dǎo)圖的能力,最多4級(jí)深度。支持2萬(wàn)字以內(nèi)的導(dǎo)圖生成(約80分鐘音頻) |
2024年3月22日
功能名稱 | 功能說(shuō)明 |
文本翻譯功能升級(jí) | 支持中、英、日、韓語(yǔ)間的雙向互譯。 |
2024年3月13日
價(jià)格調(diào)整,原先所有AI能力統(tǒng)一計(jì)費(fèi),分解為實(shí)際使用的能力才會(huì)計(jì)費(fèi)(大模型能力調(diào)用多個(gè)時(shí),會(huì)疊加計(jì)費(fèi),如:同時(shí)調(diào)用全文摘要和章節(jié)速覽的費(fèi)用為:0.4+0.4=0.8元/小時(shí))。
同時(shí)費(fèi)用進(jìn)一步下降。
2024年2月22日
大模型能力全面升級(jí);英文和中英混與中文能力對(duì)齊;實(shí)時(shí)多語(yǔ)種和離線兼容性;并提高服務(wù)穩(wěn)定性。
功能名稱 | 功能說(shuō)明 |
大模型版本升級(jí) | 全文摘要、章節(jié)速覽、發(fā)言總結(jié)三項(xiàng)大模型功能,返回字?jǐn)?shù)上限從250字,增加到1000個(gè)字。減少內(nèi)容遺漏、描述更加詳盡。 |
完善英文大模型能力 | 英文支持問(wèn)答提取、場(chǎng)景識(shí)別、口語(yǔ)書(shū)面化。 中英自由說(shuō)支持全文概要、章節(jié)速覽、發(fā)言總結(jié)、待辦事項(xiàng)、問(wèn)答提取 |
實(shí)時(shí)增加韓語(yǔ) | 支持韓語(yǔ)語(yǔ)種識(shí)別和中韓互譯 |
音視頻轉(zhuǎn)寫(xiě)升級(jí) | 新增格式: ○ 音頻:aiff格式。 ○ 視頻:avi、mpeg、3gp、ogg。 修正音視頻時(shí)長(zhǎng)不準(zhǔn)確的問(wèn)題。 |
基礎(chǔ)性能 | 提升服務(wù)穩(wěn)定性。 |
2024年1月8日
通義聽(tīng)悟API服務(wù)升級(jí),開(kāi)放通義千問(wèn)大模型提供的口語(yǔ)書(shū)面化功能。
功能名稱 | 功能說(shuō)明 |
口語(yǔ)書(shū)面化 | 能夠?qū)⒁粢曨l的語(yǔ)音轉(zhuǎn)寫(xiě)結(jié)果進(jìn)行原文改寫(xiě)和潤(rùn)色,便于形成書(shū)面化的語(yǔ)音轉(zhuǎn)寫(xiě)結(jié)果。 |
2023年11月8日
通義聽(tīng)悟API服務(wù)升級(jí),開(kāi)放通義千問(wèn)大模型提供的摘要總結(jié)、要點(diǎn)提煉、PPT抽取及摘要功能。同時(shí)優(yōu)化了API調(diào)用方式,對(duì)接成本更小。
功能名稱 | 功能說(shuō)明 |
章節(jié)速覽 | 能夠?qū)⒁粢曨l內(nèi)容按主題進(jìn)行章節(jié)切分。并總結(jié)章節(jié)標(biāo)題與摘要。 |
全文摘要 | 對(duì)全部?jī)?nèi)容,進(jìn)行摘要總結(jié)。 |
發(fā)言總結(jié) | 在會(huì)議中往往有多人的討論。通義聽(tīng)悟能夠區(qū)分發(fā)言人、幫你總結(jié)出每個(gè)人不同的觀點(diǎn)。發(fā)言總結(jié)功能可以把誰(shuí)在會(huì)議中表達(dá)了什么清晰的整理、呈現(xiàn)出來(lái)。 |
問(wèn)答對(duì)提取 | 會(huì)議中的一問(wèn)一答往往包含著非常關(guān)鍵和重要的信息。通義聽(tīng)悟的問(wèn)題回顧功能,能夠?qū)?huì)議進(jìn)程中的提問(wèn)定位并抽取出來(lái),將大家討論過(guò)的問(wèn)題一一羅列。 |
視頻PPT抽取及摘要 | 可將視頻中呈現(xiàn)的PPT進(jìn)行識(shí)別和提取,同時(shí)對(duì)每頁(yè)P(yáng)PT演講的內(nèi)容進(jìn)行摘要總結(jié)。幫助獲取視頻PPT的資料,并快速理解對(duì)應(yīng)的內(nèi)容。 |
模型能力升級(jí) | 關(guān)鍵詞與待辦事項(xiàng)提取,升級(jí)為大模型。提煉更加聚焦。 |
2023年6月1日
通義聽(tīng)悟全面開(kāi)啟公測(cè)。公測(cè)期用戶可體驗(yàn)所有AI功能,含全文概要、章節(jié)速覽、發(fā)言總結(jié)等高階AI功能。通過(guò)阿里云主賬號(hào)登錄,可享受以下權(quán)益:
每日登錄通義聽(tīng)悟,自動(dòng)獲得轉(zhuǎn)寫(xiě)時(shí)長(zhǎng)。同時(shí)擴(kuò)大存儲(chǔ)與剩余時(shí)長(zhǎng)上限。
每邀請(qǐng)1名好友注冊(cè)并登錄通義聽(tīng)悟賬號(hào),邀請(qǐng)者可獲得額外轉(zhuǎn)寫(xiě)時(shí)長(zhǎng)。
輸入口令即可獲得額外的轉(zhuǎn)寫(xiě)時(shí)長(zhǎng)。
通義聽(tīng)悟綁定阿里云盤(pán)賬號(hào),共享云盤(pán)超大存儲(chǔ)空間。
功能名稱 | 功能說(shuō)明 |
實(shí)時(shí)記錄 | 在任何需要記錄的場(chǎng)合,可打開(kāi)"實(shí)時(shí)記錄"功能,記錄會(huì)議、培訓(xùn)、訪談等場(chǎng)景的對(duì)話信息。語(yǔ)音識(shí)別會(huì)把內(nèi)容精準(zhǔn)的轉(zhuǎn)換為文字。 |
多語(yǔ)言翻譯 | 會(huì)議中哪怕有來(lái)自外國(guó)的參會(huì)人也不是問(wèn)題,通義聽(tīng)悟的翻譯能力能夠?qū)?nèi)容進(jìn)行實(shí)時(shí)多語(yǔ)言翻譯,從而幫助所有人理解掌握會(huì)議內(nèi)容。 |
問(wèn)答回顧 | 會(huì)議中的一問(wèn)一答往往包含著非常關(guān)鍵和重要的信息。通義聽(tīng)悟的問(wèn)題回顧功能,能夠?qū)?huì)議進(jìn)程中的提問(wèn)定位并抽取出來(lái),將大家討論過(guò)的問(wèn)題一一羅列。 |
發(fā)言總結(jié) | 在會(huì)議中往往有多人的討論。通義聽(tīng)悟能夠區(qū)分發(fā)言人、幫你總結(jié)出每個(gè)人不同的觀點(diǎn)。發(fā)言總結(jié)功能可以把誰(shuí)在會(huì)議中表達(dá)了什么清晰的整理、呈現(xiàn)出來(lái)。 |
本地上傳&云盤(pán)導(dǎo)入 | 通過(guò)“上傳音視頻”功能可對(duì)已錄制好的音頻視頻文件進(jìn)行理解分析。 通義聽(tīng)悟已經(jīng)與阿里云盤(pán)打通,存儲(chǔ)在阿里云盤(pán)中的音頻視頻內(nèi)容都可以導(dǎo)入通義聽(tīng)悟進(jìn)行AI的分析和理解。 |
全文概要 | 通過(guò)大語(yǔ)言模型強(qiáng)大的理解能力,提煉出忠實(shí)于原文的摘要,全文概要用兩三百字的篇幅將最重要的信息呈現(xiàn)在你的面前。 |
章節(jié)速覽 | 如果你還想進(jìn)一步深入了解內(nèi)容細(xì)節(jié),通義聽(tīng)悟會(huì)將這段音頻視頻按時(shí)間線分割成章節(jié),向你呈現(xiàn)每一個(gè)章節(jié)的中心思想和主要內(nèi)容。通義聽(tīng)悟全新的體驗(yàn)讓“一目十行”的“閱讀”音視頻成為現(xiàn)實(shí)。 |
2023年3月14日
功能分類 | 功能名稱 | 功能描述 | 更新類型 | 文檔鏈接 |
實(shí)時(shí)記錄接口 | 實(shí)時(shí)接口 |
| 新增 | |
通義聽(tīng)悟界面服務(wù) | 通義聽(tīng)悟網(wǎng)站及微信小程序 |
| 新增 |
2023年2月8日
功能分類 | 功能名稱 | 功能描述 | 更新類型 | 文檔鏈接 |
音視頻文件記錄 | 實(shí)時(shí)接口 |
| 新增 |
2022年12月12日
功能分類 | 功能名稱 | 功能描述 | 更新類型 | 文檔鏈接 |
音視頻文件記錄 | 實(shí)時(shí)接口 |
| 新增 |
2022年10月25日
功能分類 | 功能名稱 | 功能描述 | 更新類型 | 文檔鏈接 |
實(shí)時(shí)記錄 | 實(shí)時(shí)接口 |
| 新增 | |
音視頻文件記錄 | 實(shí)時(shí)接口 |
| 新增 | |
控制臺(tái)配置 | 控制臺(tái)界面 | 開(kāi)通服務(wù)、設(shè)置權(quán)限策略、創(chuàng)建項(xiàng)目、測(cè)試效果 | 新增 |