iTAG提供了圖片OCR、目標檢測、圖像分類的圖像類標注模板,創建標注任務時,您需要根據應用場景選擇標注模板。本文為您介紹圖像類標注模板的應用場景及數據結構。
背景信息
圖片OCR
圖片OCR(Optical Character Recognition)任務首先將輸入圖像中的文字轉換為文本格式,再根據文字信息類別對輸入圖像進行分組。
應用場景
證件識別、票據識別、車牌識別及銀行卡識別等。
數據結構
輸入數據
manifest文件的每行數據是一道題目,且每行數據必須包含source字段。
{"data":{"source":"oss://****.oss-cn-hangzhou.aliyuncs.com/demo_test/ocr_pic/img6.jpeg"}} ...
輸出數據
manifest文件的每行數據由題目和標注結果一起生成。每行數據的JSON結構如下。
{ "data": { "source": "oss://****.oss-cn-hangzhou.aliyuncs.com/demo_test/ocr_pic/img6.jpeg" }, "label-144863699223676****": { "results": [ { "questionId": "1", "data": [ { "id": "ecdb7552-2a4e-4d0e-8abb-0f1a2dc0****", "type": "image/polygon", "value": [ [ 368.1112214498511, 71.72740814299901 ], [ 444.34359483614696, 71.72740814299901 ], [ 444.34359483614696, 106.26762661370405 ], [ 368.1112214498511, 106.26762661370405 ] ], "labels": { "OCR識別結果": "理財顧問", "單選": "標簽1" } } ], "rotation": 0, "markTitle": "OCR標簽配置", "width": 1024, "type": "image", "height": 1024 } ] } }
目標檢測
目標檢測(Object Detection)標注任務是對圖像中的具體目標進行定位,常用矩形框工具。
應用場景
車輛檢測、行人檢測及圖片搜索等。
數據結構
輸入數據
manifest文件的每行數據是一道題目,且每行數據必須包含source字段。
{"data":{"source":"oss://****.oss-cn-hangzhou.aliyuncs.com/pic_ocr/img17.jpeg"}} ...
輸出數據
manifest文件的每行數據由題目和標注結果一起生成。每行數據的JSON結構如下。
{ "data": { "source": "oss://****.oss-cn-hangzhou.aliyuncs.com/pic_ocr/img17.jpeg" }, "label-144853549785619****": { "results": [ { "questionId": "1", "data": [ { "id": "e02a574b-9fd9-45e9-8c8a-9682567b****", "type": "image/polygon", "value": [ [ 499.93454545454546, 255.0981818181818 ], [ 911.0109090909091, 255.0981818181818 ], [ 911.0109090909091, 338.6836363636363 ], [ 499.93454545454546, 338.6836363636363 ] ], "labels": { "單選": "標簽1" } } ], "rotation": 0, "markTitle": "目標檢測標簽配置", "width": 1024, "type": "image", "height": 1024 } ] } }
圖像分類
圖像分類(Image Classification)是指從一組固定的分類標簽集合中,找到與輸入圖像內容相匹配的一個或多個分類標簽,并將其分配給該輸入圖像。該模板支持單標簽和多標簽圖像分類。
應用場景
圖片分類、拍照識圖、圖片搜索及內容推薦等。
數據結構
輸入數據
manifest文件的每行數據是一道題目,且每行數據必須包含source字段。
{"data":{"source":"oss://****.oss-cn-hangzhou.aliyuncs.com/iTAG/pic/1.jpg"}} ...
輸出數據
manifest文件的每行數據由題目和標注結果一起生成。每行數據的JSON結構如下。
{ "data": { "source": "oss://****.oss-cn-hangzhou.aliyuncs.com/pic/3.jpg" }, "label-143082452899667****": { "results": [ { "questionId": "2", "data": [ "標簽1", "標簽2" ], "markTitle": "多選", "type": "survey/multivalue" } ] } }
文檔內容是否對您有幫助?