日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

多媒體分析

更新時間: 2024-12-03 16:12:34

多媒體分析為您提供多媒體領域內的算法識別服務,包括基礎模型服務和高級模型服務,為您提供開箱即用的算法服務能力。本文為您介紹多媒體分析相關計費說明和使用指導。

背景信息

多媒體分析支持的算法服務如下:

  • 基礎模型服務:提供圖像領域內開箱即用的算法服務能力,包括圖像多標簽、圖像質量分評定、人臉屬性分析(顏值、臉型、發型、發色等信息)、年齡分析、人像身材修改(瘦身/大碼)、圖像去水印等模型服務。

  • 高級模型服務:提供視頻領域內開箱即用的算法服務能力,包括視頻分類打標、視頻質量分評定、圖文視頻動態分類打標(用于動態、帖子類的多模態內容打標)、AI繪圖打標(打標結果用于提升AI繪圖模型訓練效果)等模型服務。

計費說明

多媒體分析提供按量付費后付費和資源包預付費兩種計費方式,具體計費說明,詳情請參見多媒體分析計費說明

使用指導

開通多媒體分析服務和購買資源包

新用戶首先需要在人工智能平臺PAI場景化解決方案多媒體分析中開通服務,具體操作步驟如下。

  1. 登錄PAI控制臺。

  2. 按照下圖操作指引,開通多媒體分析服務。

  3. 默認使用按量付費(后付費)方式,按調用量計費。38e9535689e0b041a5c5c5a0ca32dd1a.png

您也可以選擇購買資源包,一次性付費購買,享受更優惠的價格。

  1. 多媒體分析頁面的基礎模型服務頁簽,單擊購買次數包。

  2. 模型服務預付費頁面,配置購買數量、場景規格API調用次數,并單擊立即購買

  3. 其中:場景規格支持選擇多媒體分析-基礎模型服務多媒體分析-高級模型服務;其他參數根據使用場景進行選擇。

Python SDK使用說明

開通多媒體分析服務后,您可以使用Python SDK調用各項算法服務,詳情請參見多媒體分析:Python SDK使用說明

Java SDK使用說明

開通多媒體分析服務后,使用Java SDK調用各項算法服務API接口的操作詳情,請參見Java SDK GitHub。Java SDK和Python SDK的參數基本一致。若需了解具體參數說明,請參考多媒體分析:Python SDK使用說明

多媒體分析能力矩陣

規格

模型服務名稱

每次服務消耗

描述

示例

基礎模型服務

圖像質量評分

1次基礎模型服務

提供圖像質量評估能力,返回 [0, 100] 的浮點數分值。

"iqa_result":66.88

人臉屬性分析

1次基礎模型服務

  • 提供人臉相關屬性的輸出,包括臉型、發色、發型、顏值等信息。

  • 根據人臉區域的坐標,將多個人臉區分開來,如果沒有檢測到人臉,則返回一個空數組。

  • 臉型:三角臉、圓臉、心形臉、方形臉、橢圓臉、菱形臉、長臉。

  • 女性發型:

    • 劉海類型:中分劉海、劉海編發、斜劉海、無劉海、空氣劉海、齊劉海。

    • 卷發類型:云朵卷、大波浪、小波浪、氧氣卷、空氣卷、羊毛卷、蛋卷。

    • 發型:卷發、盤發、直發、扎發、編發。

    • 長短發:中長發、短發、長發。

  • 男性發型:分發、圓寸、子彈頭、平頭、板寸、毛寸、碎發、背頭。

  • 發色:黑色、咖啡色、奶奶灰、栗色、棕色、漸變色、酒紅色、金色、黃色、其他顏色。

  • 顏值:0~5 分。

年齡分析

1次基礎模型服務

  • 識別圖像中主體人臉(唯一)的年齡區間。

  • 如果圖像中有多個人臉,則只會返回區域最大的主體人臉的結果。如果圖像中沒有檢測到人臉,將返回錯誤提示。

年齡區間包含:'0-2'、'3-9''10-19'、'20-29'、'30-39'、'40-49'、'50-59''60-69'、'70+'。

圖像多標簽

1次基礎模型服務

提供圖像多標簽打標能力,可以輸出概率最高的Top K個標簽以及對應的概率,也可以輸出圖像的高維特征。

高頻標簽舉例:女生、自拍、男生、生活隨拍、截屏、食物、車、美食、游戲、卡通、動物、韓系穿搭等。

人像身材修改

1次基礎模型服務

提供人像身材修改功能,您可以上傳人像照片,并通過調整degree參數來控制人像的身材,包括胖身或瘦身,其中degree > 0表示瘦身。

接口返回修改后圖像的Base64編碼。

圖像去水印

1次基礎模型服務

去除圖像中包含的水印。

接口返回去除水印后圖像的Base64編碼。

AI繪圖打標

1次基礎模型服務

提供AI繪圖(Stable-Diffusion)訓練所需的多種圖像多標簽打標能力,更好的標簽能提升訓練模型的生圖效果。

  • 支持的打標模型:WD14、BLIP、GIT、RAM。

  • caption結果示例:

    "sensitive, 1girl, solo, long hair, looking at viewer, smile, black hair, brown eyes, scarf, lips, realistic"

定制模型服務

N次基礎模型服務,具體N的值根據定制模型復雜度有所差異

提供圖像、視頻相關的定制模型服務。

根據實際定制模型類型確定。

高級模型服務

圖文視頻動態分類打標

1次高級模型服務

為包含多模態內容的動態或帖子提供分類打標服務,支持使用文本+圖片或文本+視頻的組合進行分類打標,并支持返回高維特征Embedding。

  • 高頻類別舉例:生活、影視綜藝、體育、旅游、游戲、美食、健身等。

  • 高頻標簽舉例:運動、美食、舞蹈、健身、烹飪、旅游、自拍等。

  • embedding舉例:

    0.915,0.882,0.943,0.978,1.027,1.181,1.066,1.029,0.866,0.716,0.628,1.203,0.689,0.533,0.734,1.038,0.98,0.613,0.96,0.88,0.586,0.702,1.515,0.697,0.987,0.699,1.179,4.274,0.757,0.89,0.805,0.901。

視頻質量評分

1次高級模型服務

提供短視頻質量評估能力,返回[0-100]的浮點質量分。

"video_score":20.57

視頻分類打標

1次高級模型服務

提供短視頻分類打標能力,返回短視頻類別和概率較高的Top K個標簽及對應概率,也支持輸出視頻的高維特征。

  • 高頻類別舉例:生活、知識、音樂、科技、游戲。

  • 高頻標簽舉例:有字幕、小姐姐、社會新聞資訊、瘦身塑形、劇情段子、影視片段、自然風景等。

測試與服務

如果您需要做進一步的測試和服務,請工單聯系我們獲取技術支持。

上一篇: 附錄:PAI-Plugin相關服務說明 下一篇: 多媒體分析:Python SDK使用說明
阿里云首頁 人工智能平臺 PAI 相關技術圈