計費單元
模型服務 | 計費單元 |
通用文本向量 | token |
這里token數量指的是大模型使用的tokenizer分詞后對應的最小分詞單元的數量。在通用文本向量模型中,單個token平均約對應1.5個漢字,0.7個英文單詞。通用文本向量服務根據模型輸出結果對應的token數量進行計量計費。每一次模型調用產生的實際token數量可以從response中獲取。
目前僅支持 text-embedding-v3。當前版本不支持 text-embedding-v1 和 text-embedding-v2。
計費單價
模型名 | 計費單價(幣種:RMB) |
text-embedding-v1 | 0.0007元/1000 tokens |
text-embedding-async-v1 | |
text-embedding-v2 | |
text-embedding-async-v2 | |
text-embedding-v3 |
免費額度
模型服務 | 免費額度 |
text-embedding-v1 | 50萬tokens 領取方式:開通阿里云百煉大模型后自動發放到賬戶中,點擊產品開通了解詳情。 有效期:180天 |
text-embedding-v2 | |
text-embedding-v3 | |
text-embedding-async-v1 | 2000萬tokens 領取方式:開通阿里云百煉大模型后自動發放到賬戶中,點擊產品開通了解詳情。 有效期:180天 |
text-embedding-async-v2 |
您可以參閱新人免費額度確認您是否具備享有免費額度的資格,并查詢免費總額度、剩余額度及到期時間。
基礎限流
為了保證用戶調用模型的公平性,因此通用文本向量對用戶設置了基礎限流。限流是基于模型維度的,并且和調用用戶的阿里云主賬號相關聯,按照該賬號下所有API-KEY調用該模型的總和計算限流。如果超出調用限制,用戶的API請求將因為限流控制而失敗,用戶需要等待一段時間待滿足限流條件后方能再次調用。
限流是基于模型維度的,并且和調用用戶的阿里云主賬號相關聯,按照該賬號下所有API-KEY調用該模型的總和計算限流。
模型服務 | 模型名 | 基礎限流 |
通用文本向量 | text-embedding-v1 | 以下條件任何一個超出都會觸發限流:
|
text-embedding-v2 | ||
text-embedding-v3 | ||
text-embedding-async-v1 | 以下條件任何一個超出都會觸發提交作業限流:
另外,為了避免大量突發的作業占據太多資源,限制并發的作業數為3個,即任意時間,單個用戶最多只有3個通用文本向量的異步作業在并發運行,其他的作業只能在隊列中等待。 | |
text-embedding-async-v2 |
查看賬單
有關阿里云百煉大模型服務的賬單時效信息請參閱產品計費。
有關賬單詳情請前往費用與成本查詢。