您可以通過音頻轉碼功能,將音頻轉換為需要的格式。本文介紹音頻轉碼處理功能參數及示例。
使用場景
音樂文件格式轉換:用戶從網絡下載的音樂可能不是其設備或播放器支持的格式,需要轉換音頻格式才能進行播放。
存儲空間優化:高品質無損音頻(如FLAC)占用大量存儲空間,為了在移動設備上節省空間,用戶會選擇將其轉碼為有損但壓縮率高的格式,如MP3。
在線流媒體服務:在線音樂平臺或廣播電臺會將原始音頻文件轉碼成多種比特率版本,以適應不同網絡條件下的傳輸需求,保證用戶在低帶寬環境下也能流暢收聽。
視頻制作與后期處理:視頻編輯時,原始音頻素材可能需要根據項目要求進行轉碼,比如調整采樣率、位深度以匹配影片的音軌規格,或者轉換成適合于網絡傳播的壓縮格式。
注意事項
音頻轉碼僅支持異步處理(x-oss-async-process處理方式)。
使用音頻轉碼前,需要先綁定IMM Project。關于控制臺和API如何綁定,請參見快速入門和AttachOSSBucket。
不支持匿名訪問。
必須擁有IMM處理所需的相關權限。更多信息,請參見權限。
當使用默認采樣率或聲道數進行轉碼時,轉碼可能由于目標音頻容器的兼容性而失敗。
目前音頻轉碼不支持設置音頻位深,視頻轉碼支持位深設置,通過OSS
x-oss-process
方式的pixfmt
參數來進行設置,參考視頻轉碼。
參數說明
操作名稱:audio/convert
具體參數如下表所示。
參數 | 類型 | 是否必須 | 描述 |
ss | int | 否 | 起始時間,單位為毫秒。取值:
|
t | int | 否 | 轉碼時長,單位為毫秒。取值:
|
f | string | 是 | 音頻容器:
|
ar | int | 否 | 音頻采樣率。默認與源音頻一致,取值:
說明 不同格式支持的采樣率有所不同,mp3僅支持48kHz及以下;opus支持8kHz、12kHz、16kHz、24kHz與48kHz;ac3支持32kHz、44.1kHz與48kHz;amr僅支持8kHz與16kHz。 |
ac | int | 否 | 音頻聲道數。默認與源音頻一致,取值范圍:1~8。 說明 不同格式支持的聲道數有所不同,mp3僅支持單、雙聲道;ac3最大支持6聲道(5.1);amr僅支持單聲道。 |
aq | int | 否 | 音頻壓縮質量。與參數ab互斥。取值范圍:0~100。 |
ab | int | 否 | 音頻比特率(碼率)。與參數aq互斥,單位為比特/秒(bps)。取值范圍:1000~10000000。 |
abopt | string | 否 | 音頻碼率選項。取值:
|
adepth | int | 否 | 音頻采樣位深,取值為16或24。 說明 該參數僅在f為flac時有效 |
使用REST API
將MP3格式轉換為AAC格式
轉碼信息
轉碼前
音頻格式:mp3
音頻名稱:example.mp3
處理方式
轉碼時長:從輸入媒體文件的第1000毫秒開始并持續60000毫秒進行音頻轉碼
轉碼完成消息通知:發送MNS消息
轉碼后
音頻信息
音頻格式:aac
音頻配置:保持原有采樣率與聲道數
音頻碼率:96 Kbps
文件存儲路徑
aac文件:oss://outbucket/outobjprefix.aac
處理示例
// 對文件example.mp3進行音頻轉碼。
POST /exmaple.mp3?x-oss-async-process HTTP/1.1
Host: video-demo.oss-cn-hangzhou.aliyuncs.com
Date: Fri, 28 Oct 2022 06:40:10 GMT
Authorization: OSS qn6q**************:77Dv****************
x-oss-async-process=audio/convert,ss_10000,t_60000,f_aac,ab_96000|sys/saveas,b_b3V0YnVja2V0,o_b3V0b2JqcHJlZml4LnthdXRvZXh0fQo/notify,topic_QXVkaW9Db252ZXJ0
將WAV格式轉換為OPUS格式
轉碼信息
轉碼前
音頻格式:wav
音頻名稱:example.wav
處理方式
轉碼時長:全部音頻
轉碼完成消息通知:發送MNS消息
轉碼后
音頻信息
音頻格式:opus
音頻配置:采樣率為48kHz,聲道為雙聲道
音頻碼率:96 Kbps
文件存儲路徑
opus文件:oss://outbucket/outobject.opus
處理示例
// 對文件example.wav進行音頻轉碼。
POST /exmaple.wav?x-oss-async-process HTTP/1.1
Host: video-demo.oss-cn-hangzhou.aliyuncs.com
Date: Fri, 28 Oct 2022 06:40:10 GMT
Authorization: OSS qn6q**************:77Dv****************
x-oss-async-process=audio/convert,f_opus,ab_96000,ar_48000,ac_2|sys/saveas,b_b3V0YnVja2V0, o_b3V0b2JqLnthdXRvZXh0fQo/notify,topic_QXVkaW9Db252ZXJ0
使用SDK
僅支持使用Java、Python、Go SDK通過異步處理的方式完成音頻轉碼。
Java
要求使用3.17.4及以上版本的Java SDK。
import com.aliyun.oss.ClientBuilderConfiguration;
import com.aliyun.oss.OSS;
import com.aliyun.oss.OSSClientBuilder;
import com.aliyun.oss.common.auth.CredentialsProviderFactory;
import com.aliyun.oss.common.auth.EnvironmentVariableCredentialsProvider;
import com.aliyun.oss.common.comm.SignVersion;
import com.aliyun.oss.model.AsyncProcessObjectRequest;
import com.aliyun.oss.model.AsyncProcessObjectResult;
import com.aliyuncs.exceptions.ClientException;
import java.util.Base64;
public class Demo {
public static void main(String[] args) throws ClientException {
// yourEndpoint填寫Bucket所在地域對應的Endpoint。
String endpoint = "https://oss-cn-hangzhou.aliyuncs.com";
// 填寫Endpoint對應的Region信息,例如cn-hangzhou。
String region = "cn-hangzhou";
// 從環境變量中獲取訪問憑證。運行本代碼示例之前,請確保已設置環境變量OSS_ACCESS_KEY_ID和OSS_ACCESS_KEY_SECRET。
EnvironmentVariableCredentialsProvider credentialsProvider = CredentialsProviderFactory.newEnvironmentVariableCredentialsProvider();
// 指定Bucket名稱。
String bucketName = "examplebucket";
// 指定轉碼后的音頻文件。
String targetKey = "dest.aac";
// 指定原音頻文件。
String sourceKey = "src.mp3";
// 創建OSSClient實例。
ClientBuilderConfiguration clientBuilderConfiguration = new ClientBuilderConfiguration();
clientBuilderConfiguration.setSignatureVersion(SignVersion.V4);
OSS ossClient = OSSClientBuilder.create()
.endpoint(endpoint)
.credentialsProvider(credentialsProvider)
.clientConfiguration(clientBuilderConfiguration)
.region(region)
.build();
try {
// 構建音頻處理樣式字符串以及音頻轉碼處理參數。
String style = String.format("audio/convert,ss_10000,t_60000,f_aac,ab_96000");
// 構建異步處理指令。
String bucketEncoded = Base64.getUrlEncoder().withoutPadding().encodeToString(bucketName.getBytes());
String targetEncoded = Base64.getUrlEncoder().withoutPadding().encodeToString(targetKey.getBytes());
String process = String.format("%s|sys/saveas,b_%s,o_%s/notify,topic_QXVkaW9Db252ZXJ0", style, bucketEncoded, targetEncoded);
// 創建AsyncProcessObjectRequest對象。
AsyncProcessObjectRequest request = new AsyncProcessObjectRequest(bucketName, sourceKey, process);
// 執行異步處理任務。
AsyncProcessObjectResult response = ossClient.asyncProcessObject(request);
System.out.println("EventId: " + response.getEventId());
System.out.println("RequestId: " + response.getRequestId());
System.out.println("TaskId: " + response.getTaskId());
} finally {
// 關閉OSSClient。
ossClient.shutdown();
}
}
}
Python
要求使用Python SDK 2.18.4及以上版本。
# -*- coding: utf-8 -*-
import base64
import oss2
from oss2.credentials import EnvironmentVariableCredentialsProvider
def main():
# 從環境變量中獲取訪問憑證。運行本代碼示例之前,請先配置環境變量。
auth = oss2.ProviderAuthV4(EnvironmentVariableCredentialsProvider())
# 填寫Bucket所在地域對應的Endpoint。以華東1(杭州)為例,Endpoint填寫為https://oss-cn-hangzhou.aliyuncs.com。
endpoint = 'https://oss-cn-hangzhou.aliyuncs.com'
# 指定阿里云通用Region ID,例如cn-hangzhou。
region = 'cn-hangzhou'
# 指定Bucket名稱,例如examplebucket。
bucket = oss2.Bucket(auth, endpoint, 'examplebucket', region=region)
# 指定原音頻文件名稱。
source_key = 'src.mp3'
# 指定轉碼后的音頻文件。
target_key = 'dest.aac'
# 構建音頻處理樣式字符串以及音頻轉碼處理參數。
animation_style = 'audio/convert,ss_10000,t_60000,f_aac,ab_96000'
# 構建處理指令,包括保存路徑和Base64編碼的Bucket名稱和目標文件名稱。
bucket_name_encoded = base64.urlsafe_b64encode('examplebucket'.encode()).decode().rstrip('=')
target_key_encoded = base64.urlsafe_b64encode(target_key.encode()).decode().rstrip('=')
process = f"{animation_style}|sys/saveas,b_{bucket_name_encoded},o_{target_key_encoded}/notify,topic_QXVkaW9Db252ZXJ0"
try:
# 執行異步處理任務。
result = bucket.async_process_object(source_key, process)
print(f"EventId: {result.event_id}")
print(f"RequestId: {result.request_id}")
print(f"TaskId: {result.task_id}")
except Exception as e:
print(f"Error: {e}")
if __name__ == "__main__":
main()
Go
要求使用Go SDK 3.0.2及以上版本。
package main
import (
"encoding/base64"
"fmt"
"log"
"os"
"github.com/aliyun/aliyun-oss-go-sdk/oss"
)
func main() {
// 從環境變量中獲取臨時訪問憑證。運行本代碼示例之前,請確保已設置環境變量OSS_ACCESS_KEY_ID、OSS_ACCESS_KEY_SECRET、OSS_SESSION_TOKEN。
provider, err := oss.NewEnvironmentVariableCredentialsProvider()
if err != nil {
fmt.Println("Error:", err)
os.Exit(-1)
}
// 創建OSSClient實例。
// yourEndpoint填寫Bucket對應的Endpoint,以華東1(杭州)為例,填寫為https://oss-cn-hangzhou.aliyuncs.com。其他Region請按實際情況填寫。
// yourRegion指定阿里云通用Region ID,例如cn-hangzhou。
client, err := oss.New("https://oss-cn-hangzhou.aliyuncs.com", "", "", oss.SetCredentialsProvider(&provider), oss.AuthVersion(oss.AuthV4), oss.Region("cn-hangzhou"))
if err != nil {
fmt.Println("Error:", err)
os.Exit(-1)
}
// 指定Bucket名稱,例如examplebucket。
bucketName := "examplebucket"
bucket, err := client.Bucket(bucketName)
if err != nil {
fmt.Println("Error:", err)
os.Exit(-1)
}
// 指定原音頻文件名稱。
sourceKey := "src.mp3"
// 指定轉碼后的音頻文件
targetKey := "dest.aac"
// 構建音頻處理樣式字符串以及音頻轉碼處理參數。
animationStyle := "audio/convert,ss_10000,t_60000,f_aac,ab_96000"
// 構建處理指令,包括保存路徑和Base64編碼的Bucket名稱和目標文件名稱。
bucketNameEncoded := base64.URLEncoding.EncodeToString([]byte(bucketName))
targetKeyEncoded := base64.URLEncoding.EncodeToString([]byte(targetKey))
process := fmt.Sprintf("%s|sys/saveas,b_%v,o_%v/notify,topic_QXVkaW9Db252ZXJ0", animationStyle, bucketNameEncoded, targetKeyEncoded)
// 執行異步處理任務。
result, err := bucket.AsyncProcessObject(sourceKey, process)
if err != nil {
log.Fatalf("Failed to async process object: %s", err)
}
fmt.Printf("EventId: %s\n", result.EventId)
fmt.Printf("RequestId: %s\n", result.RequestId)
fmt.Printf("TaskId: %s\n", result.TaskId)
}