智能語音交互服務,是一種人機交互技術,它允許用戶通過語音與機器進行自然的對話和溝通。
接口說明
- SmartCall 需要與智能外呼回調 HTTP 接口聯(lián)合使用,語音平臺發(fā)起呼叫后會把轉換后的語音文本回傳給業(yè)務方,業(yè)務方把下一步的執(zhí)行動作返回給語音平臺。
- 以下字符不可以在智能語音交互 SmartCall 回調中出現(xiàn):
@ = : "" $ { } ^ * ¥
。
調試
您可以在OpenAPI Explorer中直接運行該接口,免去您計算簽名的困擾。運行成功后,OpenAPI Explorer可以自動生成SDK代碼示例。
授權信息
請求參數(shù)
名稱 | 類型 | 必填 | 描述 | 示例值 |
---|---|---|---|---|
CalledShowNumber | string | 是 | 被叫顯號。必須是已購買的號碼。 您可以登錄語音服務控制臺,在語音號碼>真實號管理頁面查看已購買的號碼。 | 0571****5678 |
CalledNumber | string | 是 | 被叫號碼。僅支持中國內地號碼。 | 1590****0000 |
VoiceCode | string | 是 | 智能外呼放音文件。 當放音文件為控制臺上傳的語音文件時:參數(shù) VoiceCode 指定為文件的語音 ID。您可以登錄語音服務控制臺,選擇語音文件管理>智能語音交互放音文件,單擊詳情查看對應的語音 ID。 | 2d4c-4e78-8d2a-afbb06cf****.wav,$name$ |
RecordFlag | boolean | 否 | 通話過程中是否錄音。取值:
| true |
Volume | integer | 否 | 播放用戶音頻的音量。取值范圍:-4~4,建議設置為 1。 | 1 |
Speed | integer | 否 | 參數(shù)暫不支持使用。 | 1 |
AsrModelId | string | 否 | ASR 模型。取值:
說明
調用 SmartCall 接口時需要指定使用的 ASR 模型,建議參數(shù) AsrModelId 和 AsrBaseId 二者選填其一。
| customer_service_8k |
PauseTime | integer | 否 | 停頓時長。用于設置用戶停頓多久表示一句話結束。單位:毫秒,取值范圍:300~1200。 說明
| 800 |
MuteTime | integer | 否 | 靜音時長。用于設置用戶多久不說話通話結束。單位:毫秒,取值范圍:1000~20000。 說明
| 10000 |
ActionCodeBreak | boolean | 否 | 當前返回的媒體文件是否可以被打斷。默認取值為 true,即可被打斷。 如果為 false,即使下一個動作 action_break 為 true,也無法打斷當前放音。 說明
action_code_break 優(yōu)先級高于 action_break。
| true |
OutId | string | 否 | 預留給調用方使用的 ID。 最終會通過在回執(zhí)消息中將此 ID 帶回給調用方。 字符串類型,長度為 1~15 個字節(jié)。 | 342268***** |
DynamicId | string | 否 | 預留給調用方使用的動態(tài)擴展 ID。在回調地址中帶回,用于客戶的開發(fā)標識。 | abcdefgh |
EarlyMediaAsr | boolean | 否 | 早媒體語音識別標識。取值:
說明
設為 true 會記錄通話未接聽的原因。
| true |
VoiceCodeParam | string | 否 | TTS 參數(shù)傳遞字符串,格式為 JSON。必須與 VoiceCode 的 TTS 參數(shù)對應。 | {"name":"喂,你好"} |
SessionTimeout | integer | 否 | 最大通話時長,超時后自動掛斷。單位:秒。 說明
通話時長最長 3600 秒。
| 120 |
ActionCodeTimeBreak | integer | 否 | 基于用戶持續(xù)說話時長打斷。單位:毫秒。 如果當前媒體文件 ActionCodeBreak 為 true,用戶持續(xù)說話可以打斷當前播放。不設置或者為 0,不生效。 | 120 |
TtsStyle | string | 否 | TTS 變量播放時的聲音風格。默認為 xiaoyun。具體風格,請參見下表聲音風格列表。 | xiaoyun |
TtsVolume | integer | 否 | TTS 變量播放的音量。取值范圍:0~100,默認值為 0。 | 10 |
TtsSpeed | integer | 否 | TTS 變量播放時的聲音速度。取值范圍:-200~200,默認值為 0。 | 100 |
TtsConf | boolean | 否 | 是否設置 TTS 聲音參數(shù)。取值:
| true |
AsrBaseId | string | 否 | ASR 基礎模型。取值:
說明
調用 SmartCall 接口時需要指定使用的 ASR 模型,建議參數(shù) AsrModelId 和 AsrBaseId 二者選填其一。
| customer_service_8k |
StreamAsr | integer | 否 | 流式 ASR,根據(jù)用戶說的前幾個字智能判斷語義。取值:
| 1 |
BackgroundFileCode | string | 否 | 用戶和機器人對話時播放的背景語音文件 ID。 您可以登錄語音服務控制臺,選擇語音文件管理>智能語音交互放音文件,單擊詳情按鈕,查看對應的語音 ID。 | 2d4c-4e78-8d2a-afbb06cf****.wav |
BackgroundVolume | integer | 否 | 參數(shù)暫不支持使用。 | 1 |
BackgroundSpeed | integer | 否 | 參數(shù)暫不支持使用。 | 1 |
EnableITN | boolean | 否 | 是否在后處理中執(zhí)行 ITN。默認為 false,即不執(zhí)行。 設置為 true 時,中文數(shù)字將轉為阿拉伯數(shù)字輸出。 | false |
聲音風格
更多聲音風格詳情,請參見聲音風格列表。
返回參數(shù)
示例
正常返回示例
JSON
格式
{
"Code": "OK",
"Message": "OK",
"RequestId": "A90E4451-FED7-49D2-87C8-00700A8C4D0D",
"CallId": "116012854210^10281427****"
}
錯誤碼
訪問錯誤中心查看更多錯誤碼。
變更歷史
變更時間 | 變更內容概要 | 操作 |
---|---|---|
2024-04-18 | OpenAPI 入?yún)l(fā)生變更 | 查看變更詳情 |