国产成人在线观看亚洲,亚洲在av人极品无码网站,亚洲人成网站在线播放2020

計費單元

模型服務	計費單元
通用文本向量	token

重要

這里token數量指的是大模型使用的tokenizer分詞后對應的最小分詞單元的數量。在通用文本向量模型中，單個token平均約對應1.5個漢字，0.7個英文單詞。通用文本向量服務根據模型輸出結果對應的token數量進行計量計費。每一次模型調用產生的實際token數量可以從response中獲取。

說明

目前僅支持 text-embedding-v3。當前版本不支持 text-embedding-v1 和 text-embedding-v2。

計費單價

模型名	計費單價（幣種：RMB）
text-embedding-v1	0.0007元/1000 tokens
text-embedding-async-v1
text-embedding-v2
text-embedding-async-v2
text-embedding-v3

免費額度

模型服務	免費額度
text-embedding-v1	50萬tokens 領取方式：開通阿里云百煉大模型后自動發放到賬戶中，點擊產品開通了解詳情。有效期：180天
text-embedding-v2
text-embedding-v3
text-embedding-async-v1	2000萬tokens 領取方式：開通阿里云百煉大模型后自動發放到賬戶中，點擊產品開通了解詳情。有效期：180天
text-embedding-async-v2

說明

您可以參閱新人免費額度確認您是否具備享有免費額度的資格，并查詢免費總額度、剩余額度及到期時間。

基礎限流

為了保證用戶調用模型的公平性，因此通用文本向量對用戶設置了基礎限流。限流是基于模型維度的，并且和調用用戶的阿里云主賬號相關聯，按照該賬號下所有API-KEY調用該模型的總和計算限流。如果超出調用限制，用戶的API請求將因為限流控制而失敗，用戶需要等待一段時間待滿足限流條件后方能再次調用。

說明

限流是基于模型維度的，并且和調用用戶的阿里云主賬號相關聯，按照該賬號下所有API-KEY調用該模型的總和計算限流。

模型服務	模型名	基礎限流
通用文本向量	text-embedding-v1	以下條件任何一個超出都會觸發限流：調用頻次 ≤ 30 QPS，每秒鐘不超過30次API調用； Token消耗 ≤ 600,000 TPM，每分鐘消耗的Token數目不超過600,000。
	text-embedding-v2
	text-embedding-v3
	text-embedding-async-v1	以下條件任何一個超出都會觸發提交作業限流：提交作業的調用頻次 ≤ 1 QPS，每秒鐘最多提交一個作業；當前用戶在系統通用文本向量異步作業排隊中+運行中的作業數量不超過50個；另外，為了避免大量突發的作業占據太多資源，限制并發的作業數為3個，即任意時間，單個用戶最多只有3個通用文本向量的異步作業在并發運行，其他的作業只能在隊列中等待。
	text-embedding-async-v2

查看賬單

有關阿里云百煉大模型服務的賬單時效信息請參閱產品計費。

有關賬單詳情請前往費用與成本查詢。

日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

通義文本向量計費說明

計費單元

計費單價

免費額度

基礎限流

查看賬單