計(jì)量計(jì)費(fèi)
計(jì)費(fèi)單元
模型服務(wù) | 計(jì)費(fèi)單元 |
通用文本向量 | token |
這里token數(shù)量指的是大模型使用的tokenizer分詞后對(duì)應(yīng)的最小分詞單元的數(shù)量。在通用文本向量模型中,單個(gè)token平均約對(duì)應(yīng)1.5個(gè)漢字, 0.7個(gè)英文單詞。通用文本向量服務(wù)根據(jù)模型輸出結(jié)果對(duì)應(yīng)的token數(shù)量進(jìn)行計(jì)量計(jì)費(fèi)。每一次模型調(diào)用產(chǎn)生的實(shí)際token數(shù)量可以從 response 中獲取。
計(jì)費(fèi)單價(jià)
模型名 | 計(jì)費(fèi)單價(jià)(幣種:RMB) |
text-embedding-v1 | 0.0007元/1000 tokens |
text-embedding-async-v1 | |
text-embedding-v2 | |
text-embedding-async-v2 |
免費(fèi)額度
模型服務(wù) | 免費(fèi)額度 | 有效期 |
text-embedding-v1 | 首次開(kāi)通DashScope即獲贈(zèng)總計(jì)500,000 tokens限時(shí)免費(fèi)使用額度 | 180天 |
text-embedding-v2 | ||
text-embedding-async-v1 | 首次開(kāi)通DashScope即獲贈(zèng)總計(jì)20,000,000 tokens限時(shí)免費(fèi)使用額度 | |
text-embedding-async-v2 |
基礎(chǔ)限流
為了保證用戶調(diào)用模型的公平性,所以通用文本向量對(duì)于普通用戶設(shè)置了基礎(chǔ)限流。限流是基于模型維度的,并且和調(diào)用用戶的阿里云主賬號(hào)相關(guān)聯(lián),按照該賬號(hào)下所有API-KEY調(diào)用該模型的總和計(jì)算限流。如果超出調(diào)用限制,用戶的API請(qǐng)求將會(huì)因?yàn)橄蘖骺刂贫。脩粜枰却欢螘r(shí)間待滿足限流條件后方能再次調(diào)用。
限流是基于模型維度的,并且和調(diào)用用戶的阿里云主賬號(hào)相關(guān)聯(lián),按照該賬號(hào)下所有API-KEY調(diào)用該模型的總和計(jì)算限流。
通常情況下,基礎(chǔ)限流是可以滿足大部分客戶的應(yīng)用場(chǎng)景的,如果您有超過(guò)基礎(chǔ)限流配額的訪問(wèn)需求,請(qǐng)使用下面表單中的方式額外提交申請(qǐng)。
模型服務(wù) | 模型名 | 基礎(chǔ)限流 |
通用文本向量 | text-embedding-v1 | 以下條件任何一個(gè)超出都會(huì)觸發(fā)限流:
|
text-embedding-v2 | ||
text-embedding-async-v1 | 以下條件任何一個(gè)超出都會(huì)觸發(fā)提交作業(yè)限流:
另外,為了避免大量突發(fā)的作業(yè)占據(jù)太多資源,限制并發(fā)的作業(yè)數(shù)為3個(gè),即任意時(shí)間,單個(gè)用戶最多只有3個(gè)通用文本向量的異步作業(yè)在并發(fā)運(yùn)行,其他的作業(yè)只能在隊(duì)列中等待。 | |
text-embedding-async-v2 |
查看賬單
有關(guān)DashScope的賬單時(shí)效信息請(qǐng)參閱:產(chǎn)品計(jì)費(fèi)。
有關(guān)賬單詳情請(qǐng)前往阿里云費(fèi)用與成本查詢。