多媒體分析
多媒體分析為您提供多媒體領域內的算法識別服務,包括基礎模型服務和高級模型服務,為您提供開箱即用的算法服務能力。本文為您介紹多媒體分析相關計費說明和使用指導。
背景信息
多媒體分析支持的算法服務如下:
基礎模型服務:提供圖像領域內開箱即用的算法服務能力,包括圖像多標簽、圖像質量分評定、人臉屬性分析(顏值、臉型、發型、發色等信息)、年齡分析、人像身材修改(瘦身/大碼)、圖像去水印等模型服務。
高級模型服務:提供視頻領域內開箱即用的算法服務能力,包括視頻分類打標、視頻質量分評定、圖文視頻動態分類打標(用于動態、帖子類的多模態內容打標)、AI繪圖打標(打標結果用于提升AI繪圖模型訓練效果)等模型服務。
計費說明
多媒體分析提供按量付費后付費和資源包預付費兩種計費方式,具體計費說明,詳情請參見多媒體分析計費說明。
使用指導
開通多媒體分析服務和購買資源包
新用戶首先需要在人工智能平臺PAI的場景化解決方案的多媒體分析中開通服務,具體操作步驟如下。
登錄PAI控制臺。
按照下圖操作指引,開通多媒體分析服務。
默認使用按量付費(后付費)方式,按調用量計費。
您也可以選擇購買資源包,一次性付費購買,享受更優惠的價格。
在多媒體分析頁面的基礎模型服務頁簽,單擊購買次數包。
在模型服務預付費頁面,配置購買數量、場景規格和API調用次數,并單擊立即購買。
其中:場景規格支持選擇多媒體分析-基礎模型服務或多媒體分析-高級模型服務;其他參數根據使用場景進行選擇。
Python SDK使用說明
開通多媒體分析服務后,您可以使用Python SDK調用各項算法服務,詳情請參見多媒體分析:Python SDK使用說明。
Java SDK使用說明
開通多媒體分析服務后,使用Java SDK調用各項算法服務API接口的操作詳情,請參見Java SDK GitHub。Java SDK和Python SDK的參數基本一致。若需了解具體參數說明,請參考多媒體分析:Python SDK使用說明。
多媒體分析能力矩陣
規格 | 模型服務名稱 | 每次服務消耗 | 描述 | 示例 |
基礎模型服務 | 圖像質量評分 | 1次基礎模型服務 | 提供圖像質量評估能力,返回 [0, 100] 的浮點數分值。 |
|
人臉屬性分析 | 1次基礎模型服務 |
|
| |
年齡分析 | 1次基礎模型服務 |
| 年齡區間包含: | |
圖像多標簽 | 1次基礎模型服務 | 提供圖像多標簽打標能力,可以輸出概率最高的Top K個標簽以及對應的概率,也可以輸出圖像的高維特征。 | 高頻標簽舉例:女生、自拍、男生、生活隨拍、截屏、食物、車、美食、游戲、卡通、動物、韓系穿搭等。 | |
人像身材修改 | 1次基礎模型服務 | 提供人像身材修改功能,您可以上傳人像照片,并通過調整degree參數來控制人像的身材,包括胖身或瘦身,其中 | 接口返回修改后圖像的Base64編碼。 | |
圖像去水印 | 1次基礎模型服務 | 去除圖像中包含的水印。 | 接口返回去除水印后圖像的Base64編碼。 | |
AI繪圖打標 | 1次基礎模型服務 | 提供AI繪圖(Stable-Diffusion)訓練所需的多種圖像多標簽打標能力,更好的標簽能提升訓練模型的生圖效果。 |
| |
定制模型服務 | N次基礎模型服務,具體N的值根據定制模型復雜度有所差異 | 提供圖像、視頻相關的定制模型服務。 | 根據實際定制模型類型確定。 | |
高級模型服務 | 圖文視頻動態分類打標 | 1次高級模型服務 | 為包含多模態內容的動態或帖子提供分類打標服務,支持使用文本+圖片或文本+視頻的組合進行分類打標,并支持返回高維特征Embedding。 |
|
視頻質量評分 | 1次高級模型服務 | 提供短視頻質量評估能力,返回[0-100]的浮點質量分。 |
| |
視頻分類打標 | 1次高級模型服務 | 提供短視頻分類打標能力,返回短視頻類別和概率較高的Top K個標簽及對應概率,也支持輸出視頻的高維特征。 |
|
測試與服務
如果您需要做進一步的測試和服務,請工單聯系我們獲取技術支持。