基于函數(shù)計(jì)算部署ChatYuan對(duì)話模型
本文介紹如何使用函數(shù)計(jì)算一鍵部署ChatYuan對(duì)話模型實(shí)現(xiàn)智能問(wèn)答。
背景信息
AIGC(Artificial Intelligence Generated Content)是指人工智能生成內(nèi)容。“文生文”技術(shù)是指使用AI進(jìn)行知識(shí)問(wèn)答。
ChatYuan即元語(yǔ)功能型對(duì)話大模型,可以用于問(wèn)答、結(jié)合上下文做對(duì)話、做各種生成任務(wù)(例如創(chuàng)意性寫(xiě)作),也能回答一些法律、醫(yī)療等領(lǐng)域問(wèn)題。ChatYuan基于PromptCLUE-large在1000億Token中文語(yǔ)料上預(yù)訓(xùn)練,累計(jì)學(xué)習(xí)1.5萬(wàn)億中文Token。
本文為您介紹如何基于函數(shù)計(jì)算部署ChatYuan對(duì)話模型實(shí)現(xiàn)智能問(wèn)答。
阿里云不對(duì)第三方模型的合法性、安全性、準(zhǔn)確性進(jìn)行任何保證,阿里云不對(duì)由此引發(fā)的任何損害承擔(dān)責(zé)任。
您應(yīng)自覺(jué)遵守第三方模型的用戶協(xié)議、使用規(guī)范和相關(guān)法律法規(guī),并就使用第三方模型的合法性、合規(guī)性自行承擔(dān)相關(guān)責(zé)任。
前提條件
已開(kāi)通函數(shù)計(jì)算服務(wù),詳情請(qǐng)參見(jiàn)開(kāi)通函數(shù)計(jì)算服務(wù)。
操作步驟
部署并使用ChatYuan對(duì)話模型將產(chǎn)生部分費(fèi)用,包括GPU資源使用、vCPU資源使用、內(nèi)存資源使用、磁盤(pán)資源使用和公網(wǎng)出流量以及函數(shù)調(diào)用的費(fèi)用。具體信息,請(qǐng)參見(jiàn)計(jì)費(fèi)概述。
創(chuàng)建應(yīng)用
登錄函數(shù)計(jì)算控制臺(tái),在左側(cè)導(dǎo)航欄,單擊應(yīng)用。
如果您首次使用函數(shù)計(jì)算的應(yīng)用中心,或您的賬號(hào)下沒(méi)有創(chuàng)建任何應(yīng)用,在左側(cè)導(dǎo)航欄,單擊應(yīng)用后,將自動(dòng)進(jìn)入創(chuàng)建應(yīng)用頁(yè)面。
如果您之前使用過(guò)應(yīng)用中心,在左側(cè)導(dǎo)航欄,單擊應(yīng)用,然后在應(yīng)用頁(yè)面單擊創(chuàng)建應(yīng)用。
在創(chuàng)建應(yīng)用頁(yè)面,選擇通過(guò)模板創(chuàng)建應(yīng)用,然后在應(yīng)用列表中搜索并選擇文生文-ChatYuan模型模板,光標(biāo)移至該卡片,然后單擊立即創(chuàng)建。
在創(chuàng)建應(yīng)用頁(yè)面,設(shè)置以下配置項(xiàng),然后單擊創(chuàng)建并部署默認(rèn)環(huán)境。
主要配置項(xiàng)說(shuō)明如下,其余配置項(xiàng)保持默認(rèn)值即可。
配置項(xiàng)
說(shuō)明
示例值
部署類(lèi)型
選擇部署應(yīng)用的方式。
直接部署
角色名稱(chēng)
首次登錄用戶,需要單擊前往授權(quán)配置角色權(quán)限。
如果您的角色名稱(chēng)已有相關(guān)權(quán)限,則無(wú)需設(shè)置。
AliyunFCServerlessDevsRole
地域
選擇部署應(yīng)用的地域。
重要如果部署異常,例如AIGC公共鏡像拉取耗時(shí)長(zhǎng),拉取失敗,請(qǐng)切換到其他地域重試。
華北2(北京)
fc-chatyuan 鏡像地址
輸入ChatYuan鏡像地址。鏡像地址需要與應(yīng)用所在的地域保持一致。
為了方便您使用,函數(shù)計(jì)算提供以下基于開(kāi)源項(xiàng)目構(gòu)建的鏡像,您可以直接使用。
上海地域鏡像:registry.cn-shanghai.aliyuncs.com/aliyun-fc/fc-chatyuan:v2
北京地域鏡像:registry.cn-beijing.aliyuncs.com/aliyun-fc/fc-chatyuan:v2
深圳地域鏡像:registry.cn-shenzhen.aliyuncs.com/aliyun-fc/fc-chatyuan:v2
杭州地域鏡像:registry.cn-hangzhou.aliyuncs.com/aliyun-fc/fc-chatyuan:v2
您還可以自定義鏡像。具體操作,請(qǐng)參見(jiàn)項(xiàng)目代碼目錄內(nèi)的README文檔。
registry.cn-beijing.aliyuncs.com/aliyun-fc/fc-chatyuan:v2
大約等待1~2分鐘后,部署狀態(tài)顯示部署成功,表示當(dāng)前版本部署完成。
檢查GPU函數(shù)
model
的鏡像加速準(zhǔn)備狀態(tài)。函數(shù)計(jì)算提供鏡像加速功能,可以對(duì)AI/GPU大鏡像進(jìn)行啟動(dòng)優(yōu)化,僅當(dāng)鏡像加速準(zhǔn)備狀態(tài)為可用時(shí),才可以開(kāi)始進(jìn)行函數(shù)調(diào)用。
在應(yīng)用詳情頁(yè)面,單擊環(huán)境名稱(chēng),本示例以默認(rèn)環(huán)境為例。
選擇環(huán)境詳情頁(yè)簽,在資源信息區(qū)域,單擊函數(shù)
model
。在
model
函數(shù)詳情頁(yè)面的函數(shù)配置頁(yè)簽,在環(huán)境信息區(qū)域,觀察鏡像加速準(zhǔn)備狀態(tài),等待狀態(tài)變更為可用。
返回至已創(chuàng)建應(yīng)用的應(yīng)用詳情頁(yè)面,找到目標(biāo)環(huán)境,光標(biāo)移至其右側(cè)操作列的訪問(wèn)域名,單擊訪問(wèn)第一個(gè)域名。
由于當(dāng)前模型較大,完全加載大概需要5~8分鐘。加載過(guò)程如下圖所示。
加載完成后,呈現(xiàn)以下頁(yè)面,表示您已成功搭建元語(yǔ)功能型對(duì)話大模型。
使用元語(yǔ)功能對(duì)話
輸入您要交談的內(nèi)容,單擊發(fā)送,然后等待模型回復(fù)。為了更好的對(duì)話效果,請(qǐng)為每一句交談內(nèi)容添加合適的標(biāo)點(diǎn)符號(hào)。
問(wèn)答示例如下。
刪除資源
如您暫時(shí)不需要使用此應(yīng)用,請(qǐng)及時(shí)刪除對(duì)應(yīng)資源。如您需要長(zhǎng)期使用此應(yīng)用,請(qǐng)忽略此步驟。
返回函數(shù)計(jì)算控制臺(tái)概覽頁(yè)面,在左側(cè)導(dǎo)航欄,單擊應(yīng)用。
單擊目標(biāo)應(yīng)用右側(cè)操作列的刪除,在彈出的刪除應(yīng)用對(duì)話框,勾選我已確定資源刪除的風(fēng)險(xiǎn),依舊要?jiǎng)h除上面已選擇的資源,然后單擊刪除應(yīng)用及所選資源。
費(fèi)用說(shuō)明
套餐領(lǐng)取
為了方便您體驗(yàn)本文提供的文生成圖的場(chǎng)景,首次開(kāi)通用戶可以領(lǐng)取試用套餐并開(kāi)通函數(shù)計(jì)算服務(wù)。該套餐不支持抵扣公網(wǎng)出流量和磁盤(pán)使用量的費(fèi)用。如果您沒(méi)有購(gòu)買(mǎi)相關(guān)資源包,公網(wǎng)出流量和超出512 MB的磁盤(pán)使用量將按量付費(fèi)。
公網(wǎng)出流量和磁盤(pán)使用量評(píng)估
當(dāng)前應(yīng)用磁盤(pán)使用量為512 MB,不需要支付費(fèi)用。在加載前端頁(yè)面時(shí),需要約1 MB的公網(wǎng)出流量。每次對(duì)話都需要消耗一定的流量,進(jìn)行21739次對(duì)話,大概會(huì)消耗2 MB。
公網(wǎng)出流量使用量和磁盤(pán)使用量計(jì)費(fèi)可參考以下表格內(nèi)容。
實(shí)際費(fèi)用與對(duì)話內(nèi)容、調(diào)用頻率等多種因素有關(guān)系,預(yù)估費(fèi)用僅供參考。
計(jì)費(fèi)項(xiàng) | 單價(jià) | 使用量 | 費(fèi)用 | |
公網(wǎng)出流量 | 前端頁(yè)面加載 | 0.50元/GB | 1 MB | 0.00049元 |
21739次對(duì)話 | 2 MB | 0.00098元 | ||
磁盤(pán)使用量 | 不超出512 MB:免費(fèi) | 512 MB | 0元 |
資源消耗評(píng)估
函數(shù)計(jì)算配置:GPU 16 GB、CPU 8核、內(nèi)存32 GB、磁盤(pán) 512 MB。通過(guò)多次對(duì)話測(cè)試,給出冷啟動(dòng)和熱啟動(dòng)對(duì)應(yīng)的資源消耗平均值。
資源 | 冷啟動(dòng)(35.25s) | 熱啟動(dòng)(0.575s) |
GPU資源消耗 |
|
|
CPU資源消耗 |
|
|
內(nèi)存資源消耗 |
|
|
如果您領(lǐng)取了試用套餐,根據(jù)上述資源消耗情況,可以評(píng)估出套餐能支持多少次對(duì)話。
在連續(xù)調(diào)用的情況下,只有少數(shù)的冷啟動(dòng)情況,所以以下評(píng)估信息以熱啟動(dòng)的資源消耗進(jìn)行評(píng)估。
資源 | 套餐額度 | 對(duì)話次數(shù) |
GPU | 前100萬(wàn)GB*秒GPU資源使用免費(fèi) |
|
CPU | 前50萬(wàn)vCPU*秒vCPU資源使用免費(fèi) |
|
內(nèi)存 | 前200萬(wàn)GB*秒內(nèi)存資源使用免費(fèi) |
|
取上述表格中的最小值,領(lǐng)取的套餐可以支持處理約108695次對(duì)話。
除上述的資源外,本文提供的場(chǎng)景還會(huì)產(chǎn)生磁盤(pán)使用量和公網(wǎng)出流量,這部分的費(fèi)用評(píng)估請(qǐng)參見(jiàn)公網(wǎng)出流量和磁盤(pán)使用量評(píng)估。