產品計費
介紹通義星塵產品計費的規則。
產品計費
角色效果調試
通義星塵的網頁端支持用戶自主創建角色,通過聊天頁面進行角色對話的效果調試。
目前網頁端的對話調試功能為免費使用,不會收取任何費用。
API服務開通
服務開通入口:【星塵商品開通】
經過對話效果的調試后,您可以將對應角色能力API接入自己的應用中。通過API調用角色對話接口時,將按照計量計費規則進行計費。
您可以在角色聊天窗口里點擊“API接入”按鈕,查看當前角色的接入代碼。
在“API接入”頁面中,點擊“我要開通“即可進入API服務開通頁面。
開通服務后,您可以在通義星塵管控臺里創建API-KEY,將示例代碼中的API-KEY替換為您的API-KEY,即可進行調用。
創建API-KEY
通義星塵通過API-KEY進行調用鑒權和計量計費,可以在通義星塵官網管控臺創建API-KEY。 目前僅支持阿里云主賬號進行API-KEY的管理,每個主賬號最多同時可擁有3個有效的API-KEY,詳情可參考文檔API-KEY管理。
計量計費規則
用戶在通義星塵的官網頁面進行角色創建及對話調試目前不會產生費用。 如需通過API接入,則開通API服務調用后將產生計量和計費,按量付費(后付費)會按照您的實際用量結算,在每個結算周期生成賬單并從賬戶中扣除相應費用。
模型概覽
模型服務 | 計費單元 | 模型簡介 |
xingchen-base | Token | 通義星塵大語言模型,模型支持8k tokens上下文,限定用戶輸入為6.5k tokens。 |
xingchen-plus | Token | 通義星塵大語言模型增強版,模型支持8k tokens上下文,限定用戶輸入為6.5k tokens。 |
xingchen-plus-v2 | Token | 通義星塵大語言模型增強版,模型支持32k tokens上下文,限定用戶輸入為30k tokens。 |
xingchen-max | Token | 通義星塵超大規模語言模型,模型支持8k tokens上下文,限定用戶輸入為6.5k tokens。 |
xingchen-longcontext(開通需要走單獨的白名單申請流程,通過管理員審核) | Token | 通義星塵超大規模語言模型,模型支持32k tokens上下文。 |
白名單申請:請添加通義星塵官方釘釘群找管理員進行申請。
Token是模型用來表示自然語言文本的基本單位,可以直觀的理解為“字”或“詞”。對于中文文本來說,1個Token通常對應一個漢字;對于英文文本來說,1個Token通常對應3至4個字母。 通義星塵模型服務根據模型輸入和輸出的總Token數量進行計量計費。每一次模型調用產生的實際Token數量可以從 response 中獲取。
計費單價
模型服務 | 計費單價 | 計費說明 |
xingchen-lite | 輸入 0.002元/1000Tokens 輸出 0.006元/1000 Tokens | 2024年6月7日上新 |
xingchen-base | 輸入 0.004元/1000Tokens 輸出 0.012元/1000 Tokens | 2024年6月7日起降價,執行新計費標準 |
xingchen-plus | 輸入 0.004元/1000Tokens 輸出 0.012元/1000 Tokens | 2024年6月7日起降價執行新計費標準 |
xingchen-plus-v2 | 輸入 0.004元/1000Tokens 輸出 0.012元/1000 Tokens | 2024年9月18日上新 |
xingchen-max | 輸入 0.04元/1000Tokens 輸出 0.12元/1000 Tokens | 2024年6月7日起降價,執行新計費標準 |
xingchen-longcontext | 輸入/輸出 0.02元/1000 Tokens | 需添加白名單后使用 |
平臺服務 | 計費單價 | 計費說明 |
數字人和語音 | 限時免費 | / |
function call | 限時免費 | / |
真實信息檢索 | 限時免費 | / |
知識庫檢索 | 限時免費 | / |
卡牌庫插件 | 限時免費 | / |
長期記憶 | 限時免費 | / |
拒識插件 | 限時免費 | / |
文生圖插件 | 0.16元/張 | 2024年4月23日起正式執行新計費標準 |
inputTokens輸入到大模型,包含角色設置、對話歷史、長期記憶檢索、web檢索。
免費額度
模型服務 | 免費額度 |
通義星塵 | 輸入和輸出共計 100萬 tokens |
模型默認速率
類別 | 速率 |
每秒處理查詢次數(QPS) | 1次/秒 |
每分鐘處理請求數(QPM) | 60次/分 |
每分鐘處理tokens數(TPM) | 1000tokens |
1、星塵目前TPM是input+output的總體。
2、星塵目前的限流是針對主賬號的限制,和模型無關。
3、星塵目前模型單次發送的內容tokens限制為32000tokens。
4、星塵模型默認速率不代表上限能力,可根據您的根據實際業務需求進行調整,可向星塵官方同學了解詳情。
歡迎加入「通義星塵交流釘釘群」。
調用統計和計費賬單
調用統計和計量周期
通義星塵支持在管理控制臺查看API調用量的計量統計信息。有關的計量以小時為周期進行匯總統計。 有關計量信息請前往管理控制臺查詢。
賬單周期
通義星塵遵循阿里云統一出賬周期和扣費規則按小時結算出賬扣費,請預先保證賬戶余額充足,以免賬戶欠費影響業務。 有關賬單詳情請前往費用與成本查詢。
合并API-KEY計費
通義星塵API服務在結算時,以主賬號為賬單推送對象,同一個主賬號下創建的API-KEY將合并為同一個賬單計費。
欠費說明
賬號的可用額度(含阿里云賬戶余額和代金券)小于待結算的賬單,即被判定為賬號欠費。一旦您的賬號被判定為欠費,您將無法使用通義星塵API服務,直至賬號完成充值恢復正常使用狀態。