開通百煉不會產生費用,調用大模型實現文本生成、圖片生成、語音合成等任務時,會產生模型推理(調用)費用。此外,如果訓練(調優)新模型或將模型部署到獨占實例也會產生費用。
計費項
計費項 | 計費說明 | 計費方式 | 計費公式 |
大模型推理(調用) | 所有模型的調用單價和免費額度,請參考模型列表。 調用場景包括:模型調用、應用調用、模型評測、Prompt 自動優化(內置為 Qwen-Plus)。 適合按使用量購買大模型推理服務的需求。 | 后付費(按量) | 模型推理(調用)費用 = 模型調用消耗 x 模型推理(調用)單價 在免費額度內,不會產生費用。查看免費額度請參考新人免費額度。 |
將模型部署到獨占實例的費用。 對部署后的模型進行調用和評測將不再額外收取“大模型推理(調用)”費用。 適合按時間買斷大模型推理服務的需求。如果只想要增加并發量,請前往擴容申請。 | 后付費(按量) | 模型部署按量費用 = 使用時長(小時)× 實例數量 x 實例單價(不滿1小時按1小時計費) 輕量版實例20元/小時 | |
預付費(包月) | 模型部署包月費用 = 購買時長(月)× 實例數量 x 實例單價(不滿1天按1天計費) 輕量版實例10,000元/月 | ||
調優或微調 | 模型訓練完成后獲得的新模型必須進行大模型部署(額外收費)后才能評測和調用。 | 后付費(按量) | 模型訓練費用 = (訓練數據 Token 總數 + 混合訓練數據 Token 總數)× 循環次數 × 訓練單價(最低為 0.006元/千Token) 您可以查看模型訓練控制臺底部的預估訓練費用,并單擊計算詳情,查看訓練 Token 總數、循環次數和訓練單價。 |
模型推理(調用)計費
完整的模型調用價格和免費額度,請參考模型列表。
計費公式:
文本
文本生成費用 = 模型輸入 Token 數 x 模型輸入單價 + 模型輸出 Token 數 x 模型輸出單價(最低為 0.0003元/千Token)
圖像轉成Token:每28x28像素對應一個Token;一張圖最少4個Token。
文本向量、多模態向量、文本分類、文本抽取、文本排序費用 = 模型輸出 Token 數 x 模型單價(最低為 0.0007元/千Token)
圖像
圖像生成費用 = 模型輸出圖片張數 x 單價(最低為 0.06元/張)
語音
語音合成費用 = 輸入字符數 x 單價(最低為 1元/萬字符)
根據待合成字符數計費(其中1個漢字算2個字符,英文、標點符號、空格均按照1個字符計費)。
語音識別(實時)費用 = 語音時間 x 單價(最低為 0.00008元/秒)
視頻
視頻合成大模型調用需要進行模型部署,部署后調用不收費,僅收取部署費用。詳情請參考模型部署計費(最低為20元/實例/小時)
模型推理(調用)的免費額度
如何獲取免費額度以及如何查看剩余免費額度請參考新人免費額度。
模型推理(調用)的預付費
您可以購買節省計劃(預付費),用于抵扣模型推理超出免費額度后產生的推理費用。節省計劃用完后,系統會按照后付費的方式結算,您也可以購買多個節省計劃進行抵扣。
模型推理(調用):預付費折扣信息請根據下圖信息前往價格折扣詳情表獲取,您也可以直接單擊此處購買大語言模型推理節省計劃。
適用范圍:通義千問、通義法睿、百川-開源版、ChatGLM以及OpenNLU模型。請前往模型列表獲取完整的模型的調用價格和免費額度。
使用說明:如果購買了多個節省計劃,抵扣時將按節省計劃到期時間的先后順序抵扣。如果到期時間相同,先購買的節省計劃先抵扣。
退訂規則:退訂規則請提交工單進行咨詢。
查詢節省計劃賬單:請參考如何查詢節省計劃賬單。
旗艦模型推理(調用)計費細則
其他模型的調用價格和免費額度,請參考模型列表。
旗艦模型 | 通義千問-Max 適合復雜任務,推理能力最強 | 通義千問-Plus 效果、速度、成本均衡 | 通義千問-Turbo 適合簡單任務,速度快、成本低 | Qwen-Long 支持長達千萬字文檔,成本低 |
API調用模型名 (穩定版本) | qwen-max | qwen-plus | qwen-turbo | qwen-long |
最大上下文長度 (Token數) | 32,768 | 131,072 | 1,000,000 | 10,000,000 |
最低輸入價格 (每千Token) | 0.02元 | 0.0008元 | 0.0003元 | 0.0005元 |
最低輸出價格 (每千Token) | 0.06元 | 0.002元 | 0.0006元 | 0.002元 |
Batch 調用的計費減免
百煉旗艦模型qwen-max、qwen-plus、qwen-turbo、qwen-long、qwen-vl-max、qwen-vl-plus,qwq-32b-preview支持 Batch調用,調用費用為實時調用的 50%。
您可以通過文件方式提交批量任務,任務將異步執行,系統將在任務執行完成或設置的最長等待時間到達后返回任務執行結果。在任務運行結束前,您可以通過API進行任務狀態查詢,當任務結束后,可以通過API獲取結果。使用詳情請參考OpenAI Batch 接口調用。
模型評測計費
模型評測是否產生費用取決于評測的對象:
對獨立部署的模型進行評測:只收取模型部署費用,評測不額外收費。
對普通模型(未獨立部署)進行評測:產生模型推理(調用)費用。
模型部署計費
模型部署的費用取決于模型需要多少實例,以及運行的時長。獨占實例的單價最低為20元/小時,預付費(包月)費用 7折。
按量付費:后付費模式,按量付費按實際使用時長計費,無需提前購買資源。您可以根據需求靈活使用,模型上線即開始計費,模型下線即停止計費。此外還支持彈性擴縮容,靈活調整獨占實例資源量。此模式適用于即購即用的短期服務模型。
包月預付費:預付費模式,您需要提前購買需要的實例規格。在模型部署時選擇包月資源,使用已購買的實例。此模式適合長期服務的穩定模型。您可以前往模型部署控制臺模型部署(點擊右上角的“資源池管理”)購買包月實例或查看已購買的實例信息。
計費方式 | 計費公式 |
后付費(按量) | 模型部署按量費用 = 使用時長(小時)× 實例數量 x 實例單價(不滿1小時按1小時計費) 部署前可以在模型部署控制臺查看不同模型的預估每小時費用。 |
預付費(包月) | 模型部署包月費用 = 購買時長(月)× 實例數量 x 實例單價 輕量版實例10,000元/月、基礎版20,000元/月、標準版80,000元/月、高級版160,000元/月 購買實例:請前往模型部署控制臺(點擊右上角的資源池管理)購買。 退訂實例:請前往退訂管理退訂。退訂后,將根據剩余時間退回未使用金額。(不滿1天按1天計費) |
當模型完成部署,即狀態為“運行中”時,開始收取模型部署的費用。模型狀態為“部署中”、“欠費”、“部署失敗”時,均不會計費。
如果是包月預付費,模型狀態為“運行中”后,開始消耗包月時間。
模型服務 | 獨占實例資源規格 | 實例單價(后付費,按量) | 實例單價(預付費,包月) |
悅動人像EMO-detect-deployment | 輕量版 | 20元/實例/小時 | 10,000元/月 |
悅動人像EMO-deployment | |||
舞動人像AnimateAnyone-detect | |||
舞動人像AnimateAnyone | |||
通義萬相-文本生成圖像-0521 | |||
通義千問-Turbo | 基礎版 | 40元/實例/小時 | 20,000元/月 |
通義千問1.5-開源版-7B | |||
通義千問1.5-開源版-14B | |||
基于通義千問2-開源版-7B訓練出來的模型 | 基礎版v2-Qwen2 | - | 20,000元/月 |
通義千問-Plus | 標準版 | 160元/實例/小時 | 80,000元/月 |
通義千問1.5-開源版-72B | |||
通義千問1.5-開源版-110B | |||
基于通義千問2-開源版-72B訓練出來的模型 | 標準版v2-Qwen2 | - | 80,000元/月 |
通義千問-Max | 高級版 | 320元/實例/小時 | 160,000元/月 |
基于通義千問VL-Plus訓練出來的模型 | - | 40元/實例/小時 | - |
基于通義千問VL-Max-0201訓練出來的模型 | - | 160元/實例/小時 | - |
模型訓練計費(模型調優、模型微調)
計費方式 | 計費公式 |
后付費(按量) | 模型訓練費用 = (訓練數據 Token 總數 + 混合訓練數據 Token 總數)× 循環次數 × 訓練單價 您可以查看模型訓練控制臺底部的預估訓練費用,并單擊計算詳情,查看訓練 Token 總數、循環次數和訓練單價。 |
模型服務 | 模型規格 | 價格 |
通義千問-開源版-72B | qwen-72b-chat | 0.15元/千Token |
通義千問2-開源版-72B | qwen2-72b-instruct | |
通義千問1.5-開源版-72B | qwen1.5-72b-chat | |
通義千問-Plus-0723 | qwen-plus-0723 | |
通義千問VL-Max-0201 | qwen-vl-max-0201 | |
通義千問-Turbo-0624 | qwen-turbo-0624 | 0.03元/千Token |
通義千問Turbo | qwen-turbo | |
通義千問-開源版-14B | qwen-14b-chat | |
通義千問-Plus | qwen-plus | |
通義千問VL-Plus | qwen-vl-plus | |
通義千問1.5-開源版-14B | qwen1.5-14b-chat | |
通義千問-開源版-7B | qwen-7b-chat | 0.006元/千Token |
通義千問2-開源版-7B | qwen2-7b-instruct | |
通義千問1.5-開源版-7B | qwen1.5-7b-chat |
計費常見問題
在哪里為百煉平臺的使用付費?
使用時發生余額不足、欠費等情況請直接前往費用與成本頁面充值需要的金額。
預付費方法:
模型推理(調用):預付費折扣信息請根據下圖信息前往價格折扣詳情表獲取,您也可以直接單擊此處購買大語言模型推理節省計劃。
模型部署:請前往模型部署控制臺模型部署(點擊右上角“資源池管理”)購買實例或查看已購買的實例信息。
模型訓練:不支持預付費。
Token和字符串之間怎么換算?
Token是模型用來表示自然語言文本的基本單位,可以直觀地理解為“字”或“詞”。
對于中文文本,1個Token通常對應一個漢字或詞語。例如,“你好,我是通義千問”會被轉換成['你好', ',', '我是', '通', '義', '千', '問']。
對于英文文本,1個Token通常對應3至4個字母或1個單詞。例如,"Nice to meet you."會被轉換成['Nice', ' to', ' meet', ' you', '.']。
不同的大模型切分Token的方法可能不同。您可以使用SDK在本地查看經過通義千問模型切分后的Token數據。
# 運行前請 pip install tiktoken
from dashscope import get_tokenizer # dashscope版本 >= 1.14.0
# 獲取tokenizer對象,目前只支持通義千問系列模型
tokenizer = get_tokenizer('qwen-turbo')
input_str = '通義千問具有強大的能力。'
# 將字符串切分成token并轉換為token id
tokens = tokenizer.encode(input_str)
print(f"經過切分后的token id為:{tokens}。")
print(f"經過切分后共有{len(tokens)}個token")
# 將token id轉化為字符串并打印出來
for i in range(len(tokens)):
print(f"token id為{tokens[i]}對應的字符串為:{tokenizer.decode(tokens[i])}")
// Copyright (c) Alibaba, Inc. and its affiliates.
// dashscope SDK版本 >= 2.13.0
import java.util.List;
import com.alibaba.dashscope.exception.NoSpecialTokenExists;
import com.alibaba.dashscope.exception.UnSupportedSpecialTokenMode;
import com.alibaba.dashscope.tokenizers.Tokenizer;
import com.alibaba.dashscope.tokenizers.TokenizerFactory;
public class Main {
public static void testEncodeOrdinary(){
Tokenizer tokenizer = TokenizerFactory.qwen();
String prompt ="如果現在要你走十萬八千里路,需要多長的時間才能到達? ";
// encode string with no special tokens
List<Integer> ids = tokenizer.encodeOrdinary(prompt);
System.out.println(ids);
String decodedString = tokenizer.decode(ids);
assert decodedString == prompt;
}
public static void testEncode() throws NoSpecialTokenExists, UnSupportedSpecialTokenMode{
Tokenizer tokenizer = TokenizerFactory.qwen();
String prompt = "<|im_start|>system\nYour are a helpful assistant.<|im_end|>\n<|im_start|>user\nSanFrancisco is a<|im_end|>\n<|im_start|>assistant\n";
// encode string with special tokens <|im_start|> and <|im_end|>
List<Integer> ids = tokenizer.encode(prompt, "all");
// 24 tokens [151644, 8948, 198, 7771, 525, 264, 10950, 17847, 13, 151645, 198, 151644, 872, 198, 23729, 80328, 9464, 374, 264, 151645, 198, 151644, 77091, 198]
String decodedString = tokenizer.decode(ids);
System.out.println(ids);
assert decodedString == prompt;
}
public static void main(String[] args) {
try {
testEncodeOrdinary();
testEncode();
} catch (NoSpecialTokenExists | UnSupportedSpecialTokenMode e) {
e.printStackTrace();
}
}
}
本地運行的tokenizer可以用來估計文本的Token量,但是得到的結果不保證與模型服務端完全一致,僅供參考。如果您對通義千問的tokenizer細節感興趣,請參考: tokenizer參考。
多輪對話怎么計費?
在多輪對話中,歷史對話的輸入輸出都會作為新一輪的模型輸入 token 進行計費。
怎么增加并發量?
如果您需要進一步提高模型的RPM或TPM,請通過郵箱申請,告知uid、期望申請的模型和RPM和TPM,請郵件聯系:modelstudio@service.aliyun.com。
如果是獨立部署的模型,請擴充實例數量。
創建了大模型應用會收費嗎?
只創建應用不會收費。但如果調用應用進行了問答,則會根據調用的模型類型收取模型調用費用。
主動取消模型訓練會收費么?
會,如果您主動取消訓練,之前已產生的費用仍會被計算。其他原因導致的訓練中斷,百煉平臺不會向您收取訓練費用。
模型部署什么時候開始計費?
當模型完成部署,即狀態為運行中時,開始收取模型部署的費用。模型狀態為部署中、欠費、部署失敗時,均不會計費。
如果是包月預付費,模型狀態為運行中后,開始消耗包月時間。
模型部署是否可以暫停計費?
如果是包月預付費的獨占實例,您只能在退訂管理頁面,退訂獨占實例。退訂時,將從實付金額中扣除已消費金額,退回剩余金額。具體說明請參考退訂說明。
如果是按量后付費的獨占實例,您可以下線模型服務。模型服務下線后,將不再產生模型部署費用。
賬單常見問題
查看上個月百煉的成本支出
在成本分析頁面,成本類型選擇應付金額,時間粒度選擇月,時間范圍選擇上個月(假設為2024年08月),產品選擇大模型服務平臺百煉,即可查看上個月百煉的成本支出。
查看模型推理(調用)總花費
在成本分析頁面,成本類型選擇應付金額,選擇時間粒度和范圍(假設為2024年03月~08月),產品明細選擇大模型推理。
查看具體模型的推理(調用)花費
以模型 qwen-max 為例。在費用與成本頁面,選擇賬期,選擇產品明細為大模型推理,然后單擊搜索。在實例ID列可以找到qwen-max的input_tokens和output_tokens兩個實例。將這兩個實例對應的應付金額相加,即為所選賬期內調用qwen-max模型所支付的費用。
實例ID字段內容依次為:ApiKeyId,WorkspaceId,ModelName,AmountType和Source。
如何根據明細賬單進行分賬?
比如可以通過業務空間、apikeyid、模型名稱等內容,進行分賬。
您可以前往百煉API Key管理查看API Key與ApiKeyId的對應關系。
自2024年9月7日以后產生的賬單,可通過實例ID信息進行分賬,其中實例ID中包含的信息是:ApiKeyId、業務空間ID、模型名稱、輸入/輸出類型、調用渠道。可以通過下載賬單表格,按照類型分賬進行數據分析和匯總。
如果您的實例ID中沒有包含ApiKeyId,則表示該收費項是通過控制臺調用產生的。
抵扣券或者優惠券相關
如果有抵扣券或者優惠券,產生的費用如何扣費?
阿里云扣費順序請前往阿里云后付費賬單扣款順序查詢。
相關文檔
如何獲取免費額度、如何查看免費額度用量,請參考新人免費額度。