本文檔介紹快速入門體驗,幫助您快速體驗通義聽悟能力。
如果您需要咨詢更多產品問題,歡迎通過釘釘搜索群號78410012058,加入聽悟產品咨詢群聯系我們。
入門流程
準備賬號
注冊阿里云賬號,請參見注冊阿里云賬號。
個人實名認證,請參見個人實名認證。
(僅使用舊版接口或MQ回調才需要該步驟)創建并授權RAM用戶,請參見創建RAM用戶。關于RAM用戶的更多信息,請參見什么是訪問控制。聯系主賬戶在RAM控制臺按以下步驟授權,使用通義聽悟管控臺時需要讀取對象存儲OSS和Rocket MQ的列表。如果RAM子賬戶沒有讀取對象存儲OSS和Rocket MQ的列表的權限,會出現下圖提示:
在RAM控制臺的權限管理 > 權限策略中,創建自定義權限策略,權限策略配置內容如下:
{ "Version": "1", "Statement": [ { "Effect": "Allow", "Action": "oss:ListBuckets", "Resource": "acs:oss:*:*:*" }, { "Effect": "Allow", "Action": "mq:QueryInstanceBaseInfo", "Resource": "acs:mq:*:*:*" } ] }
在RAM控制臺的身份管理 > 用戶中,找到RAM子賬戶,單擊操作列的添加權限,選擇上一步創建的自定義策略,和系統策略中的“AliyunTingwuFullAccess”管理通義聽悟服務(Tingwu)的權限,授予RAM子賬戶。
創建AccessKey
在調用阿里云API時您需要使用AccessKey完成身份驗證。AccessKey包括AccessKey ID和AccessKey Secret,需要一起使用。
RAM用戶的AccessKey Secret只在創建時顯示,不支持查看,請妥善保管。
創建阿里云賬號的AccessKey
登錄RAM訪問控制臺,使用阿里云賬號創建AccessKey。具體操作,請參見創建AccessKey。
創建RAM用戶的AccessKey(可選)
使用阿里云賬號登錄RAM訪問控制臺,為RAM用戶創建AccessKey。具體操作,請參見創建AccessKey
開通服務
登錄通義聽悟控制臺。
在概覽頁單擊立即開通。
在產品開通頁面,選擇服務類型。
選擇試用。新開通服務的用戶可免費試用90天。
選擇商用。開通后按通過接口請求的時長計量計費,通義聽悟API服務會根據實際使用量從您的阿里云賬戶余額中扣費。
說明商用版詳細計費規則,請前往計費說明查看。
服務能力
免費試用期間權益
試用期過后如何繼續使用
實時記錄
實時并發限制:2路。
在服務管理與開通頁面將實時記錄服務升級為商用版。
升級為商用版之后,進入后付費按時長計費模式。
商用版實時并發限制:200路
音視頻文件記錄
上傳文件:每天免費使用額度為2小時(音頻時長)。
當日免費額度用完后,需等待24小時后才可以繼續使用。
在服務管理與開通頁面將音視頻文件記錄服務升級為商用版。
升級為商用版之后,進入后付費按時長計費模式。
創建項目
在通義聽悟控制臺左側導航欄,單擊我的項目。
在我的項目頁,單擊創建項目(如首次創建項目則也可單擊立即創建)。
輸入項目名稱。
選擇回調方式。
如選擇HTTP post協議,需要輸入URL。通義聽悟會向配置的HTTP URL發送post請求,返回的HTTP status為200則檢查通過。
如選擇不設置回調主動輪詢,則需要調用API輪詢接口。
如選擇Rocket MQ 的 HTTP,需要先創建一個Rocket MQ4.0實例,創建以“TOPIC_TINGWU_”開頭的topic。通義聽悟會向配置的RocketMQ通過HTTP協議發送消息,消息寫入成功則檢查通過。
說明通義聽悟API服務的RAM賬號將獲取 Rocket MQ 的服務授權。僅支持Rocket MQ 4.0實例,且topic必須以“TOPIC_TINGWU_”開頭。
選擇HTTP post協議或Rocket MQ回調方式,通義聽悟會向配置的回調地址發送連通性檢查消息:{"Code":"0","Data":{"Test":"checkSyncConf+時間戳"},"Message":"success.","RequestId":"xxxxxx"}。
選擇對象存儲(僅舊版接口需要),如下拉列表中無所需Bucket可單擊右側創建對象存儲bucket。
通義聽悟會向項目配置的OSS Bucket里寫入一個測試文件tingwu/initfile.txt,寫入成功則檢查通過。
說明建議Bucket與項目的Region相同,跨Region會降低數據存儲成功率;通義聽悟將在此Bucket下,按每次請求的以tingwu開頭的object寫入處理結果數據。
選擇MQ回調或設置OSS時,聽悟服務會自動判斷您的子賬號權限。若無授權,請聯系主賬號按本文檔頂部“準備賬號第3步進行操作”。
輸入項目描述(可選)。
測試效果(可選)
開發接入
根據以上幾步獲取到賬號對應的AccessKey ID、AccessKey Secret以及項目Appkey,必須確保這幾項數值歸屬同一阿里云賬號或同一RAM用戶。
開發接入 | 能力說明 |
通過通義聽悟API處理音視頻文件,在轉寫結果的基礎上,分離發言人并進行發言總結,提取章節速覽、要點提煉、摘要總結、口語書面化、PPT提取及摘要等。 | |
實時處理音頻流,轉寫成文字,并支持中、英、日、韓語間的雙向實時互譯,實現實時多語種字幕,確保跨國交流無障礙。在實時記錄結束后,可開啟說話人分離、章節速覽、要點提煉、摘要總結、口語書面化等功能鏈路。 |