本文匯總了您在使用智能語音交互產品過程中的常見問題。
產品公共常見問題主要分為以下幾類:
功能類
性能類
SDK使用類
計費類
功能類
使用阿里云音視頻通信RTC如何調用語音識別服務?
使用阿里云音視頻通信RTC服務可以集成智能語音交互服務,具體請參見語音數據處理。
智能語音交互服務中語音識別和語音合成用到的端口是哪些?
對于HTTP協議,端口號為80;對于HTTPS和Websocket協議,端口號為443。
開通商用或者擴容并發,多久才會在控制臺上顯示?
可用并發路數為實時更新顯示,昨日并發路數為T+1更新。另外,控制臺顯示的計量數據是T+1規則,第二天更新數據。
智能語音交互創建的項目數量有限制嗎?
目前沒有限制。
控制臺一個項目下支持多個基礎模型嗎?
不支持。一個Appkey對應一個模型。
有沒有H5語音喚醒相應的技術和插件?
設備端暫不支持此功能,云端支持。如果是設備端,一般會采用端云結合的方案。設備端側有一個喚醒模型,設備端喚醒后結合云端模型二次確認降低誤喚醒的概率。
如何在阿里云查詢賬號下ASR語音識別服務的使用情況?
您可以在控制臺直觀地查看智能語音交互服務的調用情況,包括時長、次數、并發路數等,根據運營數據判斷當前使用是否合理,并決策是否需要增加或減少相關服務調用量。具體請參見服務用量。
智能語音交互服務有哪些域名?這些域名對應IP地址有哪些?
智能語音交互服務的域名為nls-meta.cn-shanghai.aliyuncs.com
和nls-gateway-cn-shanghai.aliyuncs.com
,端口為80、443,支持HTTPS和Websocket協議。
可通過命令dig nls-gateway-cn-shanghai.aliyuncs.com
或dig nls-meta.cn-shanghai.aliyuncs.com
查看域名對應的IP地址。這些IP地址是動態IP,可能會不定期有更新,需要調用方自行監控。
找不到AccessKey ID和AccessKey Secret在哪里?
請參見開通服務,獲取AccessKey ID和AccessKey Secret。
如何查看UID?
登錄阿里云控制臺。
將鼠標懸浮在右上角用戶頭像上,彈出的面板信息中的賬號ID即為UID。
性能類
ASR語音識別和TTS語音合成超并發會有什么現象?
超并發可能會出現以下情況:
查看日志會有大量超時現象,具體服務狀態碼為40000005,表示請求數量過多。
如果并發量較大時會導致ASR語音識別和TTS語音合成斷開連接。
免費用戶有什么限制?
一句話識別、實時語音識別:最多同時發送2路語音識別。
錄音文件識別:新用戶試用期3個月內,每隔24小時可免費識別2小時時長的文件轉寫服務。免費額度用完后,間隔24小時后可繼續試用。
并發數是如何計算的?
并發數指同一個賬號(阿里云UID)同時在處理的請求數。
一般語音請求的處理都會延續一段時間,例如用戶新建一個語音識別請求,持續發送語音數據給服務端,這時并發數就是1;在這個請求處理的同時,同一用戶又新建了另一個請求,開始發送語音數據,這時服務端同時在處理這個賬號的兩個請求,并發數就變成2。
SDK使用類
智能語音交互是否提供相關的源碼呢?
SDK協議及源碼已經開源,具體請參見Github。目前開源的有C++、Java和Python語言版本。
如有需要研究智能語音交互的協議架構,可以參考Github中的源碼實現。建議您直接使用智能語音交互產品提供的SDK版本進行集成,具體請參見從這里開始。對自行研究協議實現的API很難提供更多支持。
智能語音交互的Android SDK支持在多進程中初始化多個實例嗎?
目前不支持。
語音合成SDK播放聲音有播放完成的監聽嗎,確認下有沒有播放語音模塊?
播放不屬于SDK,SDK只有合成事件。
音頻數據必須連續發送嗎?
音頻數據必須連續發送。
服務端在超過一定時間未接到語音數據(10秒)會超時斷開連接,返回40000004錯誤信息。如果需要再次發送數據,客戶端需要重新發起請求。
音頻數據發送中斷后,為什么還會收到服務器發回的數據?
音頻數據未連續發送超時中斷后,服務器上如果還有之前未處理完的數據,就會繼續返回這些數據的識別結果,但是整個句子的識別已經是錯誤的了。
初始化失敗的可能原因?
請檢查是否使用正確的AccessKey ID、AccessKey Secret生成Access Token,并填入正確Appkey、Access Token、Workspace等必選參數。
開始識別失敗的可能原因?
SDK為單例模式,請確認上一個識別已經結束后再開始新的識別。
為何開始識別后沒有識別結果?
確認如下信息:
初始化成功。
開始識別接口調用成功,且正確使用參數vad_mode。
有音頻狀態回調返回且已正確開啟錄音。
無問題的情況下,若仍然沒有識別結果,則一般會有EVENT_ASR_ERROR事件發生,根據事件攜帶的錯誤碼進行定位。
計費類
實時語音識別最大并發可以買多少路?
試用版免費2路并發,3個月有效期;開通商用后默認200路并發,可單獨擴充并發資源包。
英文的識別,需要購買擴展語言包還是要買路數?
英文識別需要購買擴展包和購買路數。