日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

通義文本向量計費說明

計費單元

模型服務

計費單元

通用文本向量

token

重要

這里token數量指的是大模型使用的tokenizer分詞后對應的最小分詞單元的數量。在通用文本向量模型中,單個token平均約對應1.5個漢字,0.7個英文單詞。通用文本向量服務根據模型輸出結果對應的token數量進行計量計費。每一次模型調用產生的實際token數量可以從response中獲取。

說明

目前僅支持 text-embedding-v3。當前版本不支持 text-embedding-v1 和 text-embedding-v2。

計費單價

模型名

計費單價(幣種:RMB)

text-embedding-v1

0.0007元/1000 tokens

text-embedding-async-v1

text-embedding-v2

text-embedding-async-v2

text-embedding-v3

免費額度

模型服務

免費額度

text-embedding-v1

50tokens

領取方式:開通阿里云百煉大模型后自動發放到賬戶中,點擊產品開通了解詳情。

有效期:180

text-embedding-v2

text-embedding-v3

text-embedding-async-v1

2000tokens

領取方式:開通阿里云百煉大模型后自動發放到賬戶中,點擊產品開通了解詳情。

有效期:180

text-embedding-async-v2

說明

您可以參閱新人免費額度確認您是否具備享有免費額度的資格,并查詢免費總額度、剩余額度及到期時間。

基礎限流

為了保證用戶調用模型的公平性,因此通用文本向量對用戶設置了基礎限流。限流是基于模型維度的,并且和調用用戶的阿里云主賬號相關聯,按照該賬號下所有API-KEY調用該模型的總和計算限流。如果超出調用限制,用戶的API請求將因為限流控制而失敗,用戶需要等待一段時間待滿足限流條件后方能再次調用。

說明

限流是基于模型維度的,并且和調用用戶的阿里云主賬號相關聯,按照該賬號下所有API-KEY調用該模型的總和計算限流。

模型服務

模型名

基礎限流

通用文本向量

text-embedding-v1

以下條件任何一個超出都會觸發限流:

  • 調用頻次 ≤ 30 QPS,每秒鐘不超過30API調用;

  • Token消耗 ≤ 600,000 TPM,每分鐘消耗的Token數目不超過600,000。

text-embedding-v2

text-embedding-v3

text-embedding-async-v1

以下條件任何一個超出都會觸發提交作業限流:

  • 提交作業的調用頻次 ≤ 1 QPS,每秒鐘最多提交一個作業;

  • 當前用戶在系統通用文本向量異步作業排隊中+運行中的作業數量不超過50個;

另外,為了避免大量突發的作業占據太多資源,限制并發的作業數為3個,即任意時間,單個用戶最多只有3個通用文本向量的異步作業在并發運行,其他的作業只能在隊列中等待。

text-embedding-async-v2

查看賬單

有關阿里云百煉大模型服務的賬單時效信息請參閱產品計費

有關賬單詳情請前往費用與成本查詢。