智能語音交互產品基于語音識別、語音合成、自然語言理解等技術,實現“能聽、會說、懂你”式的智能人機交互體驗,適用于智能客服、質檢、會議紀要、實時字幕等多個企業應用場景。本文為您介紹如何使用智能語音交互,幫助您快速了解其使用流程和具體操作。
入門流程
快速入門文檔介紹使用智能語音服務需要的步驟,幫助您快速開通服務、創建測試項目和調用語音服務。
步驟1:準備賬號
注冊阿里云賬號。
阿里云賬號作為阿里云系統識別的資源消費賬戶,有阿里云所有產品和管理權限。具體操作,請參見注冊阿里云賬號。
個人實名認證。
為了確保您可以正常使用阿里云產品和服務,您需要完成個人實名認證。具體操作,請參見個人實名認證。
(可選)創建并授權RAM用戶。
當您的企業存在多用戶協同訪問資源的場景時,可以創建RAM用戶,使用RAM可以按需為用戶分配最小權限,避免多用戶共享阿里云賬號密碼或訪問密鑰,從而降低企業的安全風險。具體操作,請參見創建RAM用戶。關于RAM用戶的更多信息,請參見什么是訪問控制。
如果使用RAM用戶調用智能語音交互產品,請前往控制臺為RAM用戶授予AliyunNLSFullAccess權限。具體操作,請參見為RAM用戶授權。
說明創建RAM用戶時,請設置登錄密碼,否則無法單獨登錄RAM賬號。
步驟2:創建AccessKey
在調用阿里云API時您需要使用AccessKey完成身份驗證,AccessKey包括AccessKey ID和AccessKey Secret,具體說明如下:
AccessKey ID:用于標識用戶。
AccessKey Secret:用于驗證用戶的密鑰。AccessKey Secret必須保密。
創建阿里云賬號的AccessKey
登錄RAM訪問控制臺,使用阿里云賬號創建AccessKey。具體操作,請參見創建AccessKey。
創建RAM用戶的AccessKey
使用阿里云賬號登錄RAM訪問控制臺,為RAM用戶創建AccessKey。具體操作,請參見創建AccessKey。
RAM用戶的AccessKey Secret只在創建時顯示,不支持查看,請妥善保管。
步驟3:開通服務
如果您是第一次使用智能語音交互,推薦您使用阿里云賬號開通智能語音交互服務。
進入智能語音交互產品首頁,單擊開通并購買,然后在產品開通頁面,選擇服務類型并選中服務協議,單擊立即開通,即可開通智能語音交互服務。
類型 | 說明 |
免費試用版 | 默認全部試用。長文本語音合成、錄音文件識別(閑時版)和錄音文件識別(極速版)無試用版。 新開通服務的用戶可免費試用3個月,支持2路并發(即同時最大2個任務)或每日2小時的錄音文件識別額度。 重要 新用戶試用期3個月內,每隔24小時可免費識別2小時時長的文件轉寫服務。免費額度用完后,間隔24小時后可繼續試用。 |
商用版 | 選擇某個或多個語音服務為商用,開通后按量計費,根據實際使用量從您的阿里云賬戶余額中扣費。更多信息,請參見計費說明。 |
步驟4:管理項目
步驟5:獲取Token
訪問令牌( Token)是調用智能語音交互服務的服務鑒權憑證。
Token在不同項目間、不同進程間、不同線程間都可以共用,Token有效期根據服務端返回為準,過期前必須提前重新獲取Token,建議每天重新獲取。為了安全起見,建議您在服務端集成Token SDK,客戶端從服務端獲取Token。
獲取Token方式 | 建議使用場景 |
僅供測試使用,在控制臺獲取Token。 | |
正式環境使用,通過傳入AccessKey ID和AccessKey Secret,在SDK通過代碼定期自動獲取Token。 | |
若對應的編程語言缺少SDK,或者需要控制依賴組件,可以通過OpenAPI獲取Token。 |
步驟6:集成開發
根據以上幾步獲取到賬號對應的AccessKey ID、AccessKey Secret、服務鑒權Token、以及項目Appkey,必須確保這幾項數值歸屬于同一阿里云賬號或同一RAM用戶。
您可以根據以上信息,通過命令行等方式快速體驗智能語音交互產品能力,具體操作,請參見運行示例。也可以通過SDK和API概覽詳細了解在各類平臺如何將語音識別或語音合成功能集成到您的服務當中。
集成運行 | 說明 |
基于使用阿里云主賬號且從控制臺獲取測試Token來體驗產品。 主要通過控制臺、curl命令行、postman、以及Java SDK等方式快速體驗智能語音交互能力。 | |
RESTful API、移動端、服務端、微信小程序以及WebSocket等多種接入方式。 |