計量方式
專屬服務按照算力單元的使用時長計算費用。時間單位為小時。
專屬服務 | 計量單位 |
算力單元 | 小時,不足1小時按照1小時計算。 |
計費價格
專屬服務 | 計費單價 |
算力單元 | 在邀測期間,獲得資格的用戶可以免費使用2個算力單元。 |
算力單元
算力單元是專屬服務使用計算資源的基本單位,模型專屬服務按照算力單元的數量和使用時長進行計量計費。您可以根據實際需要的處理能力部署合適的算力單元。
模型專屬服務使用的算力單元必須是模型基礎算力單元的整數倍,例如qwen-turbo
模型的基礎算力單元為2
,使用了qwen-turbo
模型的專屬服務的算力單元必須是2
的倍數。
模型列表
以下為專屬服務支持的預置模型列表:
模型名稱 | 基礎算力單元 | 參考處理能力 |
qwen-plus | 8 | 70 QPM |
qwen-turbo | 2 | 25 QPM |
llama2-7b-chat-v2 | 1 | 4 QPM |
llama2-13b-chat-v2 | 2 | 6 QPM |
chatglm-6b-v2 | 1 | 6 QPM |
說明
文檔更新可能存在延遲,實際支持的模型列表以API返回為準;
基礎算力單元和參考處理能力在同一個模型的不同版本會有差異,表格中提供的數據基于最新版本測試獲得;
參考處理能力的單位是每分鐘處理請求數(QPM),是在常規數據集上測試獲得,實際處理能力會因輸入數據不同而有差異。
文檔內容是否對您有幫助?