日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

基于函數(shù)計(jì)算部署ChatYuan對(duì)話模型

更新時(shí)間:

本文介紹如何使用函數(shù)計(jì)算一鍵部署ChatYuan對(duì)話模型實(shí)現(xiàn)智能問(wèn)答。

背景信息

AIGC(Artificial Intelligence Generated Content)是指人工智能生成內(nèi)容。“文生文”技術(shù)是指使用AI進(jìn)行知識(shí)問(wèn)答。

ChatYuan即元語(yǔ)功能型對(duì)話大模型,可以用于問(wèn)答、結(jié)合上下文做對(duì)話、做各種生成任務(wù)(例如創(chuàng)意性寫(xiě)作),也能回答一些法律、醫(yī)療等領(lǐng)域問(wèn)題。ChatYuan基于PromptCLUE-large在1000億Token中文語(yǔ)料上預(yù)訓(xùn)練,累計(jì)學(xué)習(xí)1.5萬(wàn)億中文Token。

本文為您介紹如何基于函數(shù)計(jì)算部署ChatYuan對(duì)話模型實(shí)現(xiàn)智能問(wèn)答。

重要
  • 阿里云不對(duì)第三方模型的合法性、安全性、準(zhǔn)確性進(jìn)行任何保證,阿里云不對(duì)由此引發(fā)的任何損害承擔(dān)責(zé)任。

  • 您應(yīng)自覺(jué)遵守第三方模型的用戶協(xié)議、使用規(guī)范和相關(guān)法律法規(guī),并就使用第三方模型的合法性、合規(guī)性自行承擔(dān)相關(guān)責(zé)任。

前提條件

已開(kāi)通函數(shù)計(jì)算服務(wù),詳情請(qǐng)參見(jiàn)開(kāi)通函數(shù)計(jì)算服務(wù)

操作步驟

部署并使用ChatYuan對(duì)話模型將產(chǎn)生部分費(fèi)用,包括GPU資源使用、vCPU資源使用、內(nèi)存資源使用、磁盤(pán)資源使用和公網(wǎng)出流量以及函數(shù)調(diào)用的費(fèi)用。具體信息,請(qǐng)參見(jiàn)計(jì)費(fèi)概述

創(chuàng)建應(yīng)用

  1. 登錄函數(shù)計(jì)算控制臺(tái),在左側(cè)導(dǎo)航欄,單擊應(yīng)用

    • 如果您首次使用函數(shù)計(jì)算的應(yīng)用中心,或您的賬號(hào)下沒(méi)有創(chuàng)建任何應(yīng)用,在左側(cè)導(dǎo)航欄,單擊應(yīng)用后,將自動(dòng)進(jìn)入創(chuàng)建應(yīng)用頁(yè)面。

      image..png

    • 如果您之前使用過(guò)應(yīng)用中心,在左側(cè)導(dǎo)航欄,單擊應(yīng)用,然后在應(yīng)用頁(yè)面單擊創(chuàng)建應(yīng)用

      image..png

  2. 創(chuàng)建應(yīng)用頁(yè)面,選擇通過(guò)模板創(chuàng)建應(yīng)用,然后在應(yīng)用列表中搜索并選擇文生文-ChatYuan模型模板,光標(biāo)移至該卡片,然后單擊立即創(chuàng)建

    image..png

  3. 創(chuàng)建應(yīng)用頁(yè)面,設(shè)置以下配置項(xiàng),然后單擊創(chuàng)建并部署默認(rèn)環(huán)境

    image..png

    主要配置項(xiàng)說(shuō)明如下,其余配置項(xiàng)保持默認(rèn)值即可。

    配置項(xiàng)

    說(shuō)明

    示例值

    部署類(lèi)型

    選擇部署應(yīng)用的方式。

    直接部署

    角色名稱(chēng)

    首次登錄用戶,需要單擊前往授權(quán)配置角色權(quán)限。

    image..png

    如果您的角色名稱(chēng)已有相關(guān)權(quán)限,則無(wú)需設(shè)置。

    AliyunFCServerlessDevsRole

    地域

    選擇部署應(yīng)用的地域。

    重要

    如果部署異常,例如AIGC公共鏡像拉取耗時(shí)長(zhǎng),拉取失敗,請(qǐng)切換到其他地域重試。

    華北2(北京)

    fc-chatyuan 鏡像地址

    輸入ChatYuan鏡像地址。鏡像地址需要與應(yīng)用所在的地域保持一致。

    為了方便您使用,函數(shù)計(jì)算提供以下基于開(kāi)源項(xiàng)目構(gòu)建的鏡像,您可以直接使用。

    • 上海地域鏡像:registry.cn-shanghai.aliyuncs.com/aliyun-fc/fc-chatyuan:v2

    • 北京地域鏡像:registry.cn-beijing.aliyuncs.com/aliyun-fc/fc-chatyuan:v2

    • 深圳地域鏡像:registry.cn-shenzhen.aliyuncs.com/aliyun-fc/fc-chatyuan:v2

    • 杭州地域鏡像:registry.cn-hangzhou.aliyuncs.com/aliyun-fc/fc-chatyuan:v2

    您還可以自定義鏡像。具體操作,請(qǐng)參見(jiàn)項(xiàng)目代碼目錄內(nèi)的README文檔。

    registry.cn-beijing.aliyuncs.com/aliyun-fc/fc-chatyuan:v2

    大約等待1~2分鐘后,部署狀態(tài)顯示部署成功,表示當(dāng)前版本部署完成。

    image..png

  4. 檢查GPU函數(shù)model的鏡像加速準(zhǔn)備狀態(tài)。

    函數(shù)計(jì)算提供鏡像加速功能,可以對(duì)AI/GPU大鏡像進(jìn)行啟動(dòng)優(yōu)化,僅當(dāng)鏡像加速準(zhǔn)備狀態(tài)為可用時(shí),才可以開(kāi)始進(jìn)行函數(shù)調(diào)用。

    1. 在應(yīng)用詳情頁(yè)面,單擊環(huán)境名稱(chēng),本示例以默認(rèn)環(huán)境為例。

      image..png

    2. 選擇環(huán)境詳情頁(yè)簽,在資源信息區(qū)域,單擊函數(shù)model

      image..png

    3. model函數(shù)詳情頁(yè)面的函數(shù)配置頁(yè)簽,在環(huán)境信息區(qū)域,觀察鏡像加速準(zhǔn)備狀態(tài),等待狀態(tài)變更為可用

      image..png

  5. 返回至已創(chuàng)建應(yīng)用的應(yīng)用詳情頁(yè)面,找到目標(biāo)環(huán)境,光標(biāo)移至其右側(cè)操作列的訪問(wèn)域名,單擊訪問(wèn)第一個(gè)域名。

    image..png

    由于當(dāng)前模型較大,完全加載大概需要5~8分鐘。加載過(guò)程如下圖所示。

    image..png

    加載完成后,呈現(xiàn)以下頁(yè)面,表示您已成功搭建元語(yǔ)功能型對(duì)話大模型。

    image..png

使用元語(yǔ)功能對(duì)話

輸入您要交談的內(nèi)容,單擊發(fā)送,然后等待模型回復(fù)。為了更好的對(duì)話效果,請(qǐng)為每一句交談內(nèi)容添加合適的標(biāo)點(diǎn)符號(hào)。

問(wèn)答示例如下。

image..png

刪除資源

如您暫時(shí)不需要使用此應(yīng)用,請(qǐng)及時(shí)刪除對(duì)應(yīng)資源。如您需要長(zhǎng)期使用此應(yīng)用,請(qǐng)忽略此步驟。

  1. 返回函數(shù)計(jì)算控制臺(tái)概覽頁(yè)面,在左側(cè)導(dǎo)航欄,單擊應(yīng)用

  2. 單擊目標(biāo)應(yīng)用右側(cè)操作列的刪除,在彈出的刪除應(yīng)用對(duì)話框,勾選我已確定資源刪除的風(fēng)險(xiǎn),依舊要?jiǎng)h除上面已選擇的資源,然后單擊刪除應(yīng)用及所選資源

    image..png

費(fèi)用說(shuō)明

套餐領(lǐng)取

為了方便您體驗(yàn)本文提供的文生成圖的場(chǎng)景,首次開(kāi)通用戶可以領(lǐng)取試用套餐并開(kāi)通函數(shù)計(jì)算服務(wù)。該套餐不支持抵扣公網(wǎng)出流量和磁盤(pán)使用量的費(fèi)用。如果您沒(méi)有購(gòu)買(mǎi)相關(guān)資源包,公網(wǎng)出流量和超出512 MB的磁盤(pán)使用量將按量付費(fèi)。

公網(wǎng)出流量和磁盤(pán)使用量評(píng)估

當(dāng)前應(yīng)用磁盤(pán)使用量為512 MB,不需要支付費(fèi)用。在加載前端頁(yè)面時(shí),需要約1 MB的公網(wǎng)出流量。每次對(duì)話都需要消耗一定的流量,進(jìn)行21739次對(duì)話,大概會(huì)消耗2 MB。

公網(wǎng)出流量使用量和磁盤(pán)使用量計(jì)費(fèi)可參考以下表格內(nèi)容。

說(shuō)明

實(shí)際費(fèi)用與對(duì)話內(nèi)容、調(diào)用頻率等多種因素有關(guān)系,預(yù)估費(fèi)用僅供參考。

計(jì)費(fèi)項(xiàng)

單價(jià)

使用量

費(fèi)用

公網(wǎng)出流量

前端頁(yè)面加載

0.50元/GB

1 MB

0.00049元

21739次對(duì)話

2 MB

0.00098元

磁盤(pán)使用量

不超出512 MB:免費(fèi)

512 MB

0元

資源消耗評(píng)估

函數(shù)計(jì)算配置:GPU 16 GB、CPU 8核、內(nèi)存32 GB、磁盤(pán) 512 MB。通過(guò)多次對(duì)話測(cè)試,給出冷啟動(dòng)和熱啟動(dòng)對(duì)應(yīng)的資源消耗平均值。

資源

冷啟動(dòng)(35.25s)

熱啟動(dòng)(0.575s)

GPU資源消耗

16 GB * 35.25秒 = 564 GB*秒

16 GB * 0.575秒 = 9.2 GB*秒

CPU資源消耗

8 GB * 35.25秒 = 282 vCPU*秒

8 GB * 0.575秒 = 4.6 vCPU*秒

內(nèi)存資源消耗

32 GB * 35.25秒 = 1128 GB*秒

32 GB * 0.575秒= 18.4 GB*秒

如果您領(lǐng)取了試用套餐,根據(jù)上述資源消耗情況,可以評(píng)估出套餐能支持多少次對(duì)話。

說(shuō)明

在連續(xù)調(diào)用的情況下,只有少數(shù)的冷啟動(dòng)情況,所以以下評(píng)估信息以熱啟動(dòng)的資源消耗進(jìn)行評(píng)估。

資源

套餐額度

對(duì)話次數(shù)

GPU

前100萬(wàn)GB*秒GPU資源使用免費(fèi)

1000000/9.2 = 108695次

CPU

前50萬(wàn)vCPU*秒vCPU資源使用免費(fèi)

500000/4.6 = 108695次

內(nèi)存

前200萬(wàn)GB*秒內(nèi)存資源使用免費(fèi)

2000000/18.4 = 108695次

取上述表格中的最小值,領(lǐng)取的套餐可以支持處理約108695次對(duì)話。

除上述的資源外,本文提供的場(chǎng)景還會(huì)產(chǎn)生磁盤(pán)使用量和公網(wǎng)出流量,這部分的費(fèi)用評(píng)估請(qǐng)參見(jiàn)公網(wǎng)出流量和磁盤(pán)使用量評(píng)估