時間戳功能介紹
更新時間:
長文本語音異步合成服務(wù)在輸出音頻流的同時,可輸出每次傳入文本中各單句(在句號、問號、嘆號等位置切分)在音頻中的時間位置,即句級別時間戳。該時間信息可用于視頻配音字幕或有聲書播報文字高亮等場景。本文為您介紹時間戳功能。
使用限制
針對長文本語音合成,目前只支持長文本RESTful接口句級時間戳。
參數(shù)設(shè)置
在客戶端將請求參數(shù)enable_subtitle設(shè)置為true,開啟時間戳功能。以RESTful接口為例、其設(shè)置方式如下:
// 長文本TTS RESTful接口支持句級時間戳,默認(rèn)為false,不開啟。
tts.put("enable_subtitle", true);
服務(wù)端響應(yīng)
服務(wù)端返回的帶字幕信息的響應(yīng)sentences
字段。
參數(shù) | 類型 | 說明 |
---|---|---|
sentences | List | 時間戳信息 |
其中
sentences
字段格式如下:參數(shù) | 類型 | 說明 |
---|---|---|
begin_time | String | ?本對應(yīng)TTS語?開始時間戳,單位ms。 |
end_time | String | ?本對應(yīng)TTS語?結(jié)束時間戳,單位ms。 |
示例
請求示例:
{
"payload":{
"tts_request":{
"voice":"Aifan",
"sample_rate":16000,
"format":"mp3",
"enable_subtitle":true,
"text":"我家的后面有一個很大的園,相傳叫作百草園。現(xiàn)在是早已并屋子一起賣給朱文公的子孫了,連那最末次的相見也已經(jīng)隔了七八年,其中似乎確鑿只有一些野草;但那時卻是我的樂園。"
},
"notify_url":"http://123****.com",
"enable_notify":false
},
"context":{
"device_id":"my_device_id"
},
"header":{
"appkey":"1iMxP16qgjP****",
"token":"16aea272b48d4bb188664611837f****"
}
}
返回示例:
{
"status":200,
"data":{
"sentences":[
{
"text":"我家的后面有一個很大的園,相傳叫作百草園",
"begin_time":"0",
"end_time":"4247"
},
{
"text":"現(xiàn)在是早已并屋子一起賣給朱文公的子孫了,連那最末次的相見也已經(jīng)隔了七八年,其中似乎確鑿只有一些野草;但那時卻是我的樂園",
"begin_time":"4247",
"end_time":"16060"
}
],
"task_id":"9628f978abab4628b1bcfd5a9da3749f",
"audio_address":"http://nls-cloud-cn-shanghai.oss-cn-shanghai.aliyuncs.com/jupiter-flow/tmp/9628f978abab4628b1bcfd5a9da3749f.mp3?Expires=1621305670&OSSAccessKeyId=LTAIUpwNp2H****&Signature=OYHTJMQXM3ltvw9x3x32iUpiAx*****",
"notify_custom":""
},
"error_code":20000000,
"error_message":"SUCCESS",
"request_id":"7e70c414c31a41ae86b4a5f4241a6f3c"
}
文檔內(nèi)容是否對您有幫助?