日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

計量計費

ChatGLM開源雙語對話語言模型

計費單元

模型服務

計費單元

ChatGLM2開源雙語對話語言模型

token

ChatGLM3開源雙語對話語言模型

重要

Token是模型用來表示自然語言文本的基本單位,可以直觀的理解為“字”或“詞”。對于中文文本來說,1個token通常對應一個漢字;對于英文文本來說,1個token通常對應3至4個字母。

ChatGLM2模型服務根據模型輸入和輸出的總token數量進行計量計費,其中多輪對話中的history作為輸入也會進行計量計費。每一次模型調用產生的實際token數量可以從 response 中獲取。

計費單價

模型服務

模型名

輸入(input)價格

輸出(output)價格

ChatGLM2開源雙語對話語言模型

chatglm-6b-v2

0.006元/1,000 tokens

0.006元/1,000 tokens

ChatGLM3開源雙語對話語言模型

chatglm3-6b

限時免費中

限時免費中

免費額度

模型服務

模型名

免費額度

ChatGLM2開源雙語對話語言模型

chatglm-6b-v2

/

ChatGLM3開源雙語對話語言模型

chatglm3-6b

限時免費中

基礎限流

為了保證用戶調用模型的公平性,默認對于普通用戶設置了基礎限流。如果超出限流指定的調用限制,用戶的API請求將會因為限流控制而失敗,用戶需要等待一段時間待滿足限流條件后方能再次調用。

說明

限流是基于模型維度的,并且和調用用戶的阿里云主賬號相關聯,按照該賬號下所有API-KEY調用該模型的總和計算限流。

模型服務

模型名

基礎限流

ChatGLM2開源雙語對話語言模型

chatglm-6b-v2

以下條件任何一個超出都會觸發限流:

  • 流量 ≤ 60 QPM,每分鐘處理不超過60個完整的請求;

  • Token消耗 ≤ 100,000 TPM,每分鐘消耗的Token數目不超過100,000。

ChatGLM3開源雙語對話語言模型

chatglm3-6b

以下條件任何一個超出都會觸發限流:

  • 流量 ≤ 120 QPM,每分鐘處理不超過120個完整的請求;

  • Token消耗 ≤ 200,000 TPM,每分鐘消耗的Token數目不超過200,000。

查看賬單

有關DashScope的賬單時效信息請參閱產品計費

有關賬單詳情請前往阿里云費用與成本查詢。