本文介紹圖像識別(imagerecog)類目下的元素識別DetectImageElements的語法及示例。
功能描述
元素識別能力用于識別輸入圖像中所包含的元素內容,用矩形框標注出其位置,并區分其對應的基本類型(人物、修飾、文案)。
- 輸入原圖 :
- 輸出結果圖 :
接入指引
1. 注冊阿里云賬號:打開阿里云官網,在阿里云官網右上角,單擊立即注冊,按照操作提示完成賬號注冊。
2. 開通能力:請確保您已開通圖像識別服務,若未開通服務請立即開通。
3. 創建AccessKey:請確保您已創建AccessKey,如果您使用的是子賬號AccessKey,您需要給子賬號賦予AliyunVIAPIFullAccess權限,具體操作,請參見RAM授權。
4. 在線調試(可選):您可以通過OpenAPI Explorer在線調試能力,查看完整的調用示例代碼及SDK依賴信息,也可以下載完整的工程。
5. 開發接入步驟:
- 在SDK總覽中選擇您要接入使用的SDK語言。
- 在對應語言的SDK文檔中找到AI類目為圖像識別(imagerecog)的SDK包進行安裝。
- 參考文檔中提供的示例代碼進行適當修改后調用。
6. 示例代碼:該能力常用語言的示例代碼,請參見元素識別示例代碼。
7. 客戶端直接調用:該能力常用的客戶端調用方式包括以下幾種。
輸入限制
- 圖像格式:JPG、JPEG、BMP、PNG。
- 圖像大小:不超過3 MB。
- 圖像分辨率:不超過1280×1280像素。
- URL地址中不能包含中文字符。
計費說明
關于元素識別的計費方式及報價,請參見計費介紹。
調試
您可以在OpenAPI Explorer中直接運行該接口,免去您計算簽名的困擾。運行成功后,OpenAPI Explorer可以自動生成SDK代碼示例。
請求參數
名稱 |
類型 |
是否必選 |
示例值 |
描述 |
Action | String | 是 | DetectImageElements | 系統規定參數。取值:DetectImageElements。 |
Url | String | 是 | http://viapi-test.oss-cn-shanghai.aliyuncs.com/viapi-3.0domepic/imagerecog/DetectImageElements/DetectImageElements5.jpg | 圖像URL地址。推薦使用上海地域的OSS鏈接,對于文件在本地或者非上海地域OSS鏈接的情況,請參見文件URL處理。 |
返回數據
名稱 |
類型 |
示例值 |
描述 |
RequestId | String | 7EE82437-AEC4-5AAF-819F-AB28C23EE0FC | 請求ID。 |
Data | Object | 返回的結果數據內容。 |
|
Elements | Array of Element | 元素列表。 |
|
Type | String | majorhuman | 元素類型。包括: UnType(未定義類型)、AllType(所有類型)、RootType(根類型)、Synthesis(組合元素圖)、Embedded(所有嵌套類型)、Format(元素格式)、MajorObject(主體)、Character(文案)、Identifier(標識)、Background(背景)、Decoration(修飾)、MajorHuman(人物模特)、MajorAuction(商品)、MajorThing(物體)、MajorOther(其他主體)、CharMain(主文案)、CharSub(副文案)、CharAction(行動點文案)、CharContent(內容文案)、CharNumber(數字文案)、CharOther(其他文案)、IdentLogo(logo標識)、IdentLight(高亮標識)、IdentCode(碼標識)、IdentOther(其他標識)、BackBitmap(位圖背景)、BackVector(矢量圖背景)、BackOther(其他背景)、DecoTile(平鋪修飾)、DecoRegion(區域修飾)、DecoPieces(碎片修飾)、DecoEdge(貼邊修飾)、DecoLine(線性修飾)、DecoBox(框型修飾)、DecoChar(行動點文案修飾)、DecoOther(其他修飾)、SynthMajor(主體組團)、SynthChar(文案組團)、SynthIdent(標識組團)、SynthBack(背景組團)、SynthDeco(修飾組團)、SynthOther(其他組團)、EmbedSvg(svg嵌套格式)、EmbedJson(JSON嵌套格式)、EmbedHtml(html嵌套格式)。 |
Width | Integer | 285 | 元素寬度。 |
Height | Integer | 354 | 元素高度。 |
Y | Integer | 78 | 元素左上角Y軸坐標。 |
Score | Float | 0.997097373008728 | 置信度,取值范圍 |
X | Integer | 287 | 元素左上角X軸坐標。 |
SDK參考
阿里云視覺AI圖像識別類目下的元素識別能力推薦使用SDK調用,支持多種編程語言,調用時請選擇AI類目為圖像識別(imagerecog)的SDK包,文件參數通過SDK調用可支持本地文件及任意URL,具體可參見SDK總覽。
示例代碼
該能力常用語言的示例代碼,請參見元素識別示例代碼。
示例
請求示例
http(s)://imagerecog.cn-shanghai.aliyuncs.com/?Action=DetectImageElements //更多關于訪問域名(Endpoint)信息,請參見:http://bestwisewords.com/document_detail/143103.html
&Url=http://viapi-test.oss-cn-shanghai.aliyuncs.com/viapi-3.0domepic/imagerecog/DetectImageElements/DetectImageElements5.jpg
&<公共請求參數>
正常返回示例
XML
格式
HTTP/1.1 200 OK
Content-Type:application/xml
<DetectImageElementsResponse>
<RequestId>7EE82437-AEC4-5AAF-819F-AB28C23EE0FC</RequestId>
<Data>
<Elements>
<Type>character</Type>
<Score>0.999164342880249</Score>
<X>490</X>
<Y>215</Y>
<Height>66</Height>
<Width>380</Width>
</Elements>
<Elements>
<Type>character</Type>
<Score>0.998594701290131</Score>
<X>531</X>
<Y>302</Y>
<Height>38</Height>
<Width>308</Width>
</Elements>
<Elements>
<Type>majorauction</Type>
<Score>0.983854711055756</Score>
<X>51</X>
<Y>80</Y>
<Height>392</Height>
<Width>464</Width>
</Elements>
<Elements>
<Type>decoration</Type>
<Score>0.915460407733917</Score>
<X>596</X>
<Y>148</Y>
<Height>50</Height>
<Width>170</Width>
</Elements>
<Elements>
<Type>decoration</Type>
<Score>0.777607440948486</Score>
<X>649</X>
<Y>149</Y>
<Height>45</Height>
<Width>63</Width>
</Elements>
<Elements>
<Type>character</Type>
<Score>0.712217330932617</Score>
<X>533</X>
<Y>349</Y>
<Height>20</Height>
<Width>297</Width>
</Elements>
<Elements>
<Type>character</Type>
<Score>0.701746642589569</Score>
<X>239</X>
<Y>129</Y>
<Height>36</Height>
<Width>72</Width>
</Elements>
<Elements>
<Type>decoration</Type>
<Score>0.598963797092438</Score>
<X>594</X>
<Y>166</Y>
<Height>30</Height>
<Width>67</Width>
</Elements>
<Elements>
<Type>decoration</Type>
<Score>0.502112746238708</Score>
<X>703</X>
<Y>167</Y>
<Height>29</Height>
<Width>67</Width>
</Elements>
</Data>
</DetectImageElementsResponse>
JSON
格式
HTTP/1.1 200 OK
Content-Type:application/json
{
"RequestId" : "7EE82437-AEC4-5AAF-819F-AB28C23EE0FC",
"Data" : {
"Elements" : [ {
"Type" : "character",
"Score" : 0.999164342880249,
"X" : 490,
"Y" : 215,
"Height" : 66,
"Width" : 380
}, {
"Type" : "character",
"Score" : 0.998594701290131,
"X" : 531,
"Y" : 302,
"Height" : 38,
"Width" : 308
}, {
"Type" : "majorauction",
"Score" : 0.983854711055756,
"X" : 51,
"Y" : 80,
"Height" : 392,
"Width" : 464
}, {
"Type" : "decoration",
"Score" : 0.915460407733917,
"X" : 596,
"Y" : 148,
"Height" : 50,
"Width" : 170
}, {
"Type" : "decoration",
"Score" : 0.777607440948486,
"X" : 649,
"Y" : 149,
"Height" : 45,
"Width" : 63
}, {
"Type" : "character",
"Score" : 0.712217330932617,
"X" : 533,
"Y" : 349,
"Height" : 20,
"Width" : 297
}, {
"Type" : "character",
"Score" : 0.701746642589569,
"X" : 239,
"Y" : 129,
"Height" : 36,
"Width" : 72
}, {
"Type" : "decoration",
"Score" : 0.598963797092438,
"X" : 594,
"Y" : 166,
"Height" : 30,
"Width" : 67
}, {
"Type" : "decoration",
"Score" : 0.502112746238708,
"X" : 703,
"Y" : 167,
"Height" : 29,
"Width" : 67
} ]
}
}
錯誤碼
關于元素識別的錯誤碼,詳情請參見常見錯誤碼。
安全聲明
- 請確保上傳的圖片或文件來源符合相應的法律法規。
- 通過體驗調試上傳的臨時文件有效期為1小時,在24小時后會被系統自動清理刪除。