每日更新av资源网站免费,ww天天女日n久久m,精品久久久久无码

一句話識別功能支持對一分鐘內(nèi)的短語音進行識別，適用于對話聊天、控制口令、語音輸入法、語音搜索等較短的語音識別場景。

使用須知

說明

如需使用Android/iOS SDK，請參見移動端接口說明。

支持的輸入格式：單聲道（mono）、16 bit采樣位數(shù)，包括PCM、PCM編碼的WAV、OGG封裝的OPUS、OGG封裝的SPEEX、AMR、MP3、AAC。
音頻采樣率：8000 Hz、16000 Hz。
時長限制：語音數(shù)據(jù)時長不能超過60s。
音頻文件大小：不超過2 MB。
支持情感分析：目前僅開放中文8k情感識別功能。
設(shè)置返回結(jié)果：
- 是否返回中間識別結(jié)果。
- 是否在后處理中添加標(biāo)點。
- 是否將中文數(shù)字轉(zhuǎn)為阿拉伯?dāng)?shù)字輸出。

設(shè)置多語言識別：在管控臺編輯項目中進行模型選擇，詳情請參見管理項目。

目前支持的語種和方言模型如下：

語種

語言	模型名稱	采樣率	標(biāo)點	ITN	順滑	語義斷句	聲音和文本對齊
英語	通用-英文，教育直播-英文，教育內(nèi)容分析-英文	16k	支持	支持	支持	不支持	支持
英語	電話客服（通用）	8k	支持	支持	支持	不支持	不支持
日語	通用-日語	16k	支持	支持	不支持	不支持	支持
西班牙語	通用-西班牙語	16k	支持	支持	不支持	不支持	不支持
西班牙語	通用-西班牙客服通用	8k	支持	支持	不支持	不支持	不支持
阿拉伯語	通用-阿拉伯語	16k	支持	不支持	不支持	不支持	不支持
哈薩克語	通用-哈薩克語	16k	支持	不支持	不支持	不支持	不支持
韓語	通用-韓語	16k	支持	支持	不支持	不支持	不支持
泰語	通用-泰語	16k	不支持	不支持	不支持	不支持	不支持
泰語	通用-泰語客服通用	8k	不支持	不支持	不支持	不支持	不支持
印尼語	通用-印尼語	16k	支持	支持	不支持	不支持	不支持
印尼語	電話客服（通用）	8k	支持	支持	不支持	不支持	不支持
俄語	通用-俄語	16k	支持	支持	不支持	不支持	不支持
越南語	通用-越南語	16k	支持	支持	不支持	不支持	不支持
越南語	通用-越南語客服通用	8k	支持	支持	不支持	不支持	不支持
法語	通用-法語	16k	支持	支持	不支持	不支持	不支持
德語	通用-德語	16k	支持	支持	不支持	不支持	不支持
意大利語	通用-意大利語	16k	支持	不支持	不支持	不支持	不支持
印地語	通用-印地語	16k	支持	不支持	不支持	不支持	不支持
馬來語	通用-馬來語	16k	支持	不支持	不支持	不支持	不支持
馬來語	通用-馬來語客服通用	8k	支持	不支持	不支持	不支持	不支持
菲律賓語	通用-菲律賓語	16k	支持	支持	不支持	不支持	不支持
菲律賓語	電話客服（通用）	8k	支持	支持	不支持	不支持	不支持
泰米爾語	通用-泰米爾語	16k	支持	不支持	不支持	不支持	不支持
葡萄牙語	通用-葡萄牙語	16k	支持	支持	不支持	不支持	不支持
土耳其語	通用-土耳其語	16k	支持	不支持	不支持	不支持	不支持
波蘭語	通用-波蘭語	16k	支持	不支持	不支持	不支持	不支持
烏克蘭語	通用-烏克蘭語	16k	支持	不支持	不支持	不支持	不支持
羅馬尼亞語	通用-羅馬尼亞語	16k	支持	不支持	不支持	不支持	不支持
荷蘭語	通用-荷蘭語	16k	支持	不支持	不支持	不支持	不支持
希臘語	通用-希臘語	16k	支持	不支持	不支持	不支持	不支持
匈牙利語	通用-匈牙利語	16k	支持	不支持	不支持	不支持	不支持
爪哇語	通用-爪哇語	16k	支持	不支持	不支持	不支持	不支持
孟加拉語	通用-孟加拉語	16k	支持	不支持	不支持	不支持	不支持
緬甸語	通用-緬甸語	16k	支持	不支持	不支持	不支持	不支持
老撾語	通用-老撾語	16k	支持	不支持	不支持	不支持	不支持
斯瓦希里語	通用-斯瓦希里語	16k	支持	不支持	不支持	不支持	不支持
阿塞拜疆語	通用-阿塞拜疆語	16k	支持	不支持	不支持	不支持	不支持
波斯語	通用-波斯語	16k	支持	不支持	不支持	不支持	不支持
僧伽羅語	通用-僧伽羅語	16k	支持	不支持	不支持	不支持	不支持
加泰羅尼亞語	通用-加泰羅尼亞語	16k	支持	不支持	不支持	不支持	不支持
高棉語	通用-高棉語	16k	支持	不支持	不支持	不支持	不支持
希伯來語	通用-希伯來語	16k	支持	不支持	不支持	不支持	不支持
克羅地亞語	通用-克羅地亞語	16k	支持	不支持	不支持	不支持	不支持
豪薩語	通用-豪薩語	16k	支持	不支持	不支持	不支持	不支持
馬拉地語	通用-馬拉地語	16k	支持	不支持	不支持	不支持	不支持
泰盧固語	通用-泰盧固語	16k	支持	不支持	不支持	不支持	不支持
旁遮普語	通用-旁遮普語	16k	支持	不支持	不支持	不支持	不支持
瑞典語	通用-瑞典語	16k	支持	不支持	不支持	不支持	不支持
保加利亞語	通用-保加利亞語	16k	支持	不支持	不支持	不支持	不支持
丹麥語	通用-丹麥語	16k	支持	不支持	不支持	不支持	不支持
挪威語	通用-挪威語	16k	支持	不支持	不支持	不支持	不支持
坎納達語	通用-坎納達語	16k	支持	不支持	不支持	不支持	不支持
馬拉雅拉姆語	通用-馬拉雅拉姆語	16k	支持	不支持	不支持	不支持	不支持
捷克語	通用-捷克語	16k	支持	不支持	不支持	不支持	不支持
烏爾都語	通用-烏爾都語	16k	支持	不支持	不支持	不支持	不支持
尼泊爾語	通用-尼泊爾語	16k	支持	不支持	不支持	不支持	不支持
蒙古語（外蒙）	通用-蒙古語（外蒙）	16k	支持	不支持	不支持	不支持	不支持
烏茲別克語	通用-烏茲別克語	16k	支持	不支持	不支持	不支持	不支持

方言

語言	模型名稱	采樣率	標(biāo)點	ITN	順滑	語義斷句	聲音和文本對齊
粵語	通用-粵語	16k	支持	支持	支持	不支持	支持
	電話客服（通用）	8k	支持	支持	支持	不支持	支持
	粵中自由說	8k	支持	支持	支持	不支持	不支持
粵語（繁體）	通用-粵語（繁體）	8k	支持	不支持	不支持	不支持	不支持
粵語（繁體）	通用-粵語（繁體）	16k	支持	不支持	不支持	不支持	不支持
四川話	通用-四川話	16k	支持	支持	支持	支持	支持
四川話	電話客服（通用）	8k	支持	支持	支持	支持	支持
湖北話	通用-湖北話	16k	支持	支持	支持	支持	支持
湖北話	通用-湖北話	8k	支持	支持	支持	支持	支持
上海話	通用-上海話	16k	支持	支持	支持	支持	不支持
湖南話	通用-湖南話	16k	支持	支持	支持	支持	支持
河南話	通用-河南話	16k	支持	支持	支持	支持	支持
河南話	通用-河南話	8k	支持	支持	支持	支持	支持
浙江話	通用-浙江話	16k	支持	支持	支持	支持	不支持
東北話	通用-東北話	16k	支持	支持	支持	支持	支持
山東話	通用-山東話	16k	支持	支持	支持	支持	支持
天津話	通用-天津話	16k	支持	支持	支持	支持	支持
陜西話	通用-陜西話	16k	支持	支持	支持	支持	支持
山西話	通用-山西話	16k	支持	支持	支持	支持	支持
貴州話	通用-貴州話	16k	支持	支持	支持	支持	支持
云南話	通用-云南話	16k	支持	支持	支持	支持	支持
甘肅話	通用-甘肅話	16k	支持	支持	支持	支持	支持
維吾爾語	通用-維吾爾語	16k	不支持	不支持	不支持	不支持	不支持
維吾爾語	通用-維吾爾語	8k	不支持	不支持	不支持	不支持	不支持
蘇州話	通用-蘇州話	16k	支持	支持	支持	支持	不支持
閩南語	通用-閩南語	16k	支持	支持	支持	支持	不支持
江西話	通用-江西話	16k	支持	支持	支持	支持	支持
寧夏話	通用-寧夏話	16k	支持	支持	支持	支持	支持
廣西話	通用-廣西話	16k	支持	支持	支持	支持	支持
廣西話	通用-廣西話	8k	支持	支持	支持	支持	支持
中文普通話	識音石 V1 - 端到端模型，教育內(nèi)容分析，醫(yī)療內(nèi)容分析，新聞媒體內(nèi)容分析，娛樂視頻內(nèi)容分析，音視頻離線轉(zhuǎn)寫（升級版），新零售領(lǐng)域識別模型，出行領(lǐng)域識別模型	16k	支持	支持	支持	支持	支持
	中英自由說	16k	支持	支持	支持	支持	不支持
	識音石 V1 - 端到端模型	8k	支持	支持	支持	支持	支持

就近地域智能接入

一句話識別支持就近地域智能接入，域名為nls-gateway.aliyuncs.com。

推薦終端用戶使用就近地域接入域名。根據(jù)調(diào)用接口時客戶端所在的地理位置，系統(tǒng)會自動解析到最近的某個具體地域的服務(wù)器。例如在北京地域發(fā)起請求，系統(tǒng)會自動解析到北京地域的服務(wù)器，與指定域名nls-gateway-cn-beijing.aliyuncs.com實現(xiàn)效果一致。

服務(wù)地址

訪問類型	說明	URL
外網(wǎng)訪問（默認上海地域）	所有服務(wù)器均可使用外網(wǎng)訪問URL（SDK中默認設(shè)置了外網(wǎng)訪問URL）。	上海：`wss://nls-gateway-cn-shanghai.aliyuncs.com/ws/v1` 北京：`wss://nls-gateway-cn-beijing.aliyuncs.com/ws/v1` 深圳：`wss://nls-gateway-cn-shenzhen.aliyuncs.com/ws/v1`
ECS內(nèi)網(wǎng)訪問	使用阿里云上海、北京、深圳ECS（即ECS地域為華東2（上海）、華北2（北京）、華南1（深圳）），可使用內(nèi)網(wǎng)訪問URL。 ECS的經(jīng)典網(wǎng)絡(luò)不能訪問AnyTunnel，即不能在內(nèi)網(wǎng)訪問語音服務(wù)；如果希望使用AnyTunnel，需要創(chuàng)建專有網(wǎng)絡(luò)在其內(nèi)部訪問。重要使用內(nèi)網(wǎng)訪問方式，將不產(chǎn)生ECS實例的公網(wǎng)流量費用。關(guān)于ECS的網(wǎng)絡(luò)類型請參見網(wǎng)絡(luò)類型。	上海：`ws://nls-gateway-cn-shanghai-internal.aliyuncs.com:80/ws/v1` 北京：`ws://nls-gateway-cn-beijing-internal.aliyuncs.com:80/ws/v1` 深圳：`ws://nls-gateway-cn-shenzhen-internal.aliyuncs.com:80/ws/v1`

交互流程

說明

所有服務(wù)端的響應(yīng)都會在返回信息的header包含表示本次識別任務(wù)的task_id參數(shù)。
交互流程圖為Java SDK、C++ SDK、iOS SDK、Android SDK的交互流程，不包含RESTful API的交互流程，RESTful API的交互流程圖請參見RESTFUL API。

1.鑒權(quán)

客戶端與服務(wù)端建立WebSocket連接時，使用Token進行鑒權(quán)。關(guān)于Token獲取請參見獲取Token概述。

2.開始識別

客戶端發(fā)起一句話識別請求，服務(wù)端確認請求有效。

其中在請求消息中需要進行參數(shù)設(shè)置，各參數(shù)由SDK中SpeechRecognizer對象的相關(guān)set方法設(shè)置，各參數(shù)含義如下。

參數(shù)	類型	是否必選	說明
appkey	String	是	控制臺創(chuàng)建的項目Appkey。
format	String	否	音頻格式，包括PCM、WAV、OPUS、SPEEX、AMR、MP3、AAC。
sample_rate	Integer	否	音頻采樣率，默認值：16000 Hz。根據(jù)音頻采樣率在管控臺對應(yīng)項目中配置支持該采樣率及場景的模型。
enable_intermediate_result	Boolean	否	是否返回中間識別結(jié)果，默認值：False。
enable_punctuation_prediction	Boolean	否	是否在后處理中添加標(biāo)點，默認值：False。
enable_inverse_text_normalization	Boolean	否	ITN（逆文本inverse text normalization）中文數(shù)字轉(zhuǎn)換阿拉伯?dāng)?shù)字。設(shè)置為True時，中文數(shù)字將轉(zhuǎn)為阿拉伯?dāng)?shù)字輸出，默認值：False。
disfluency	Boolean	否	過濾語氣詞，即聲音順滑。默認值：False（關(guān)閉）。
customization_id	String	否	自學(xué)習(xí)模型ID，具體可參見定制語言模型。
vocabulary_id	String	否	定制泛熱詞ID，具體可參見在控制臺創(chuàng)建熱詞。
enable_voice_detection	Boolean	否	是否啟動語音檢測。開啟后能夠識別出一段音頻中有效語音的開始和結(jié)束，剔除噪音數(shù)據(jù)。默認值：False（不開啟）。
max_start_silence	Integer	否	當(dāng)enable_voice_detection設(shè)置為true時，該參數(shù)生效。表示允許的最大開始靜音時長。建議取值范圍：(0,60000]。單位：毫秒。超出后（即開始識別后多時間沒有檢測到聲音）服務(wù)端將會發(fā)送TaskFailed事件，結(jié)束本次識別。
max_end_silence	Integer	否	當(dāng)enable_voice_detection設(shè)置為true時，該參數(shù)生效。表示允許的最大結(jié)束靜音時長。單位：毫秒，取值范圍：200ms～6000ms。超出時長服務(wù)端會發(fā)送RecognitionCompleted事件，結(jié)束本次識別（需要注意后續(xù)的語音將不會進行識別）。
audio_address	String	否	可通過公網(wǎng)訪問的音頻文件下載鏈接。推薦使用阿里云OSS，具體請參見通過OSS如何獲取訪問URL。
special_word_filter	String（結(jié)構(gòu)為JSON格式）	否	敏感詞過濾功能，支持開啟或關(guān)閉，支持自定義敏感詞。該參數(shù)可實現(xiàn)：不處理（默認，即展示原文）、過濾、*替換為。** 具體調(diào)用說明請見下文的自定義過濾詞調(diào)用示例。說明開啟但未配置敏感詞，則會過濾默認詞表：敏感詞表。

自定義過濾詞調(diào)用示例如下：

            // 以實時轉(zhuǎn)寫為例，
            JSONObject root = new JSONObject();
            root.put("system_reserved_filter", true);

            // 將以下詞語替換成空
            JSONObject root1 = new JSONObject();
            JSONArray array1 = new JSONArray();
            array1.add("開始");
            array1.add("發(fā)生");
            root1.put("word_list", array1);

            // 將以下詞語替換成*
            JSONObject root2 = new JSONObject();
            JSONArray array2 = new JSONArray();
            array2.add("測試");
            root2.put("word_list", array2);

						// 可以全部設(shè)置，也可以部分設(shè)置
            root.put("filter_with_empty", root1);
            root.put("filter_with_signed", root2);

            transcriber.addCustomedParam("special_word_filter", root);

3.發(fā)送數(shù)據(jù)

循環(huán)發(fā)送語音數(shù)據(jù)，持續(xù)接收識別結(jié)果。

若enable_intermediate_result設(shè)置為true，服務(wù)端會持續(xù)多次返回RecognitionResultChanged消息，即中間識別結(jié)果，示例如下：

北京的天
北京的天氣

服務(wù)端返回的響應(yīng)消息：

{
        "header": {
                "namespace": "SpeechRecognizer",
                "name": "RecognitionResultChanged",
                "status": 20000000,
                "message_id": "e06d2b5d50ca40d5a50d4215c7c8****",
                "task_id": "4c3502c7a5ce4ac3bdc488749ce4****",
                "status_text": "Gateway:SUCCESS:Success."
        },
        "payload": {
                "result": "北京的天氣"
        }
}

header對象參數(shù)說明：

參數(shù)	類型	說明
namespace	String	消息所屬的命名空間。
name	String	消息名稱，RecognitionResultChanged表示獲取到中間識別結(jié)果。
status	Integer	狀態(tài)碼，表示請求是否成功，見服務(wù)狀態(tài)碼。
status_text	String	狀態(tài)消息。
task_id	String	任務(wù)全局唯一ID，請記錄該值，便于排查問題。
message_id	String	本次消息的ID。

payload對象參數(shù)說明：

參數(shù)	類型	說明
result	String	中間識別結(jié)果。

重要

最后一次獲取的中間識別結(jié)果與最終的識別的結(jié)果不一定相同，請以RecognitionCompleted消息的最終識別結(jié)果為準(zhǔn)。

若enable_intermediate_result設(shè)置為false，此步驟服務(wù)端不返回任何消息。

4.結(jié)束識別

客戶端發(fā)送停止一句話識別請求，通知服務(wù)端語音數(shù)據(jù)發(fā)送結(jié)束，停止語音識別，服務(wù)端返回最終識別結(jié)果：

{
        "header": {
                "namespace": "SpeechRecognizer",
                "name": "RecognitionCompleted",
                "status": 20000000,
                "message_id": "10490c992aef44eaa4246614838f****",
                "task_id": "4c3502c7a5ce4ac3bdc488749ce4****",
                "status_text": "Gateway:SUCCESS:Success."
        },
        "payload": {
                "result": "北京的天氣。",
                "emo_tag": "neutral",
                "emo_confidence": 0.931
        }
}