ChatGLM開源雙語對話語言模型
計費單元
模型服務 | 計費單元 |
ChatGLM2開源雙語對話語言模型 | token |
ChatGLM3開源雙語對話語言模型 |
Token是模型用來表示自然語言文本的基本單位,可以直觀的理解為“字”或“詞”。對于中文文本來說,1個token通常對應一個漢字;對于英文文本來說,1個token通常對應3至4個字母。
ChatGLM2模型服務根據模型輸入和輸出的總token數量進行計量計費,其中多輪對話中的history作為輸入也會進行計量計費。每一次模型調用產生的實際token數量可以從 response 中獲取。
計費單價
模型服務 | 模型名 | 輸入(input)價格 | 輸出(output)價格 |
ChatGLM2開源雙語對話語言模型 | chatglm-6b-v2 | 0.006元/1,000 tokens | 0.006元/1,000 tokens |
ChatGLM3開源雙語對話語言模型 | chatglm3-6b | 限時免費中 | 限時免費中 |
免費額度
模型服務 | 模型名 | 免費額度 |
ChatGLM2開源雙語對話語言模型 | chatglm-6b-v2 | / |
ChatGLM3開源雙語對話語言模型 | chatglm3-6b | 限時免費中 |
基礎限流
為了保證用戶調用模型的公平性,默認對于普通用戶設置了基礎限流。如果超出限流指定的調用限制,用戶的API請求將會因為限流控制而失敗,用戶需要等待一段時間待滿足限流條件后方能再次調用。
限流是基于模型維度的,并且和調用用戶的阿里云主賬號相關聯,按照該賬號下所有API-KEY調用該模型的總和計算限流。
模型服務 | 模型名 | 基礎限流 |
ChatGLM2開源雙語對話語言模型 | chatglm-6b-v2 | 以下條件任何一個超出都會觸發限流:
|
ChatGLM3開源雙語對話語言模型 | chatglm3-6b | 以下條件任何一個超出都會觸發限流:
|
查看賬單
有關DashScope的賬單時效信息請參閱產品計費。
有關賬單詳情請前往阿里云費用與成本查詢。