BELLE開源中文對話大模型
BELLE-LLaMA模型是由BELLE出品的大規模語言模型,它在大模型服務平臺上的模型名稱為"belle-llama-13b-2m-v1"。BELLE(BE Large Language Model Engine),一款基于BLOOM和LLAMA針對中文優化、模型調優且僅使用由ChatGPT生成的數據,為中文指令提供更好的支持。促進中文對話大模型開源社區的發展,愿景是成為能夠幫到每一個人的LLM Engine。相比如何做好大語言模型的預訓練,BELLE更關注如何在開源預訓練大語言模型的基礎上,幫助每一個人都能夠得到一個屬于自己的、效果盡可能好的具有指令表現能力的語言模型,降低大語言模型、特別是中文大語言模型的研究和應用門檻。為此,BELLE項目會持續開放指令訓練數據、相關模型、訓練代碼、應用場景等,也會持續評估不同訓練數據、訓練算法等對模型表現的影響。BELLE針對中文做了優化,模型調優僅使用由ChatGPT生產的數據(不包含任何其他數據)。
開發者可以通過以下鏈接,了解如何通過大模型服務平臺調用BELLE-LLaMA API。