多媒體分析
多媒體分析為您提供多媒體領(lǐng)域內(nèi)的算法識(shí)別服務(wù),包括基礎(chǔ)模型服務(wù)和高級(jí)模型服務(wù),為您提供開箱即用的算法服務(wù)能力。本文為您介紹多媒體分析相關(guān)計(jì)費(fèi)說明和使用指導(dǎo)。
背景信息
多媒體分析支持的算法服務(wù)如下:
基礎(chǔ)模型服務(wù):提供圖像領(lǐng)域內(nèi)開箱即用的算法服務(wù)能力,包括圖像多標(biāo)簽、圖像質(zhì)量分評(píng)定、人臉屬性分析(顏值、臉型、發(fā)型、發(fā)色等信息)、年齡分析、人像身材修改(瘦身/大碼)、圖像去水印等模型服務(wù)。
高級(jí)模型服務(wù):提供視頻領(lǐng)域內(nèi)開箱即用的算法服務(wù)能力,包括視頻分類打標(biāo)、視頻質(zhì)量分評(píng)定、圖文視頻動(dòng)態(tài)分類打標(biāo)(用于動(dòng)態(tài)、帖子類的多模態(tài)內(nèi)容打標(biāo))、AI繪圖打標(biāo)(打標(biāo)結(jié)果用于提升AI繪圖模型訓(xùn)練效果)等模型服務(wù)。
計(jì)費(fèi)說明
多媒體分析提供按量付費(fèi)后付費(fèi)和資源包預(yù)付費(fèi)兩種計(jì)費(fèi)方式,具體計(jì)費(fèi)說明,詳情請(qǐng)參見多媒體分析計(jì)費(fèi)說明。
使用指導(dǎo)
開通多媒體分析服務(wù)和購買資源包
新用戶首先需要在人工智能平臺(tái)PAI的場景化解決方案的多媒體分析中開通服務(wù),具體操作步驟如下。
登錄PAI控制臺(tái)。
按照下圖操作指引,開通多媒體分析服務(wù)。
默認(rèn)使用按量付費(fèi)(后付費(fèi))方式,按調(diào)用量計(jì)費(fèi)。
您也可以選擇購買資源包,一次性付費(fèi)購買,享受更優(yōu)惠的價(jià)格。
在多媒體分析頁面的基礎(chǔ)模型服務(wù)頁簽,單擊購買次數(shù)包。
在模型服務(wù)預(yù)付費(fèi)頁面,配置購買數(shù)量、場景規(guī)格和API調(diào)用次數(shù),并單擊立即購買。
其中:場景規(guī)格支持選擇多媒體分析-基礎(chǔ)模型服務(wù)或多媒體分析-高級(jí)模型服務(wù);其他參數(shù)根據(jù)使用場景進(jìn)行選擇。
Python SDK使用說明
開通多媒體分析服務(wù)后,您可以使用Python SDK調(diào)用各項(xiàng)算法服務(wù),詳情請(qǐng)參見多媒體分析:Python SDK使用說明。
Java SDK使用說明
開通多媒體分析服務(wù)后,使用Java SDK調(diào)用各項(xiàng)算法服務(wù)API接口的操作詳情,請(qǐng)參見Java SDK GitHub。Java SDK和Python SDK的參數(shù)基本一致。若需了解具體參數(shù)說明,請(qǐng)參考多媒體分析:Python SDK使用說明。
多媒體分析能力矩陣
規(guī)格 | 模型服務(wù)名稱 | 每次服務(wù)消耗 | 描述 | 示例 |
基礎(chǔ)模型服務(wù) | 圖像質(zhì)量評(píng)分 | 1次基礎(chǔ)模型服務(wù) | 提供圖像質(zhì)量評(píng)估能力,返回 [0, 100] 的浮點(diǎn)數(shù)分值。 |
|
人臉屬性分析 | 1次基礎(chǔ)模型服務(wù) |
|
| |
年齡分析 | 1次基礎(chǔ)模型服務(wù) |
| 年齡區(qū)間包含: | |
圖像多標(biāo)簽 | 1次基礎(chǔ)模型服務(wù) | 提供圖像多標(biāo)簽打標(biāo)能力,可以輸出概率最高的Top K個(gè)標(biāo)簽以及對(duì)應(yīng)的概率,也可以輸出圖像的高維特征。 | 高頻標(biāo)簽舉例:女生、自拍、男生、生活隨拍、截屏、食物、車、美食、游戲、卡通、動(dòng)物、韓系穿搭等。 | |
人像身材修改 | 1次基礎(chǔ)模型服務(wù) | 提供人像身材修改功能,您可以上傳人像照片,并通過調(diào)整degree參數(shù)來控制人像的身材,包括胖身或瘦身,其中 | 接口返回修改后圖像的Base64編碼。 | |
圖像去水印 | 1次基礎(chǔ)模型服務(wù) | 去除圖像中包含的水印。 | 接口返回去除水印后圖像的Base64編碼。 | |
AI繪圖打標(biāo) | 1次基礎(chǔ)模型服務(wù) | 提供AI繪圖(Stable-Diffusion)訓(xùn)練所需的多種圖像多標(biāo)簽打標(biāo)能力,更好的標(biāo)簽?zāi)芴嵘?xùn)練模型的生圖效果。 |
| |
定制模型服務(wù) | N次基礎(chǔ)模型服務(wù),具體N的值根據(jù)定制模型復(fù)雜度有所差異 | 提供圖像、視頻相關(guān)的定制模型服務(wù)。 | 根據(jù)實(shí)際定制模型類型確定。 | |
高級(jí)模型服務(wù) | 圖文視頻動(dòng)態(tài)分類打標(biāo) | 1次高級(jí)模型服務(wù) | 為包含多模態(tài)內(nèi)容的動(dòng)態(tài)或帖子提供分類打標(biāo)服務(wù),支持使用文本+圖片或文本+視頻的組合進(jìn)行分類打標(biāo),并支持返回高維特征Embedding。 |
|
視頻質(zhì)量評(píng)分 | 1次高級(jí)模型服務(wù) | 提供短視頻質(zhì)量評(píng)估能力,返回[0-100]的浮點(diǎn)質(zhì)量分。 |
| |
視頻分類打標(biāo) | 1次高級(jí)模型服務(wù) | 提供短視頻分類打標(biāo)能力,返回短視頻類別和概率較高的Top K個(gè)標(biāo)簽及對(duì)應(yīng)概率,也支持輸出視頻的高維特征。 |
|
測試與服務(wù)
如果您需要做進(jìn)一步的測試和服務(wù),請(qǐng)工單聯(lián)系我們獲取技術(shù)支持。