日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

圖像類

iTAG提供了圖片OCR、目標檢測、圖像分類的圖像類標注模板,創建標注任務時,您需要根據應用場景選擇標注模板。本文為您介紹圖像類標注模板的應用場景及數據結構。

背景信息

本文介紹以下圖像類標注模板的數據結構:

圖片OCR

圖片OCR(Optical Character Recognition)任務首先將輸入圖像中的文字轉換為文本格式,再根據文字信息類別對輸入圖像進行分組。

  • 應用場景

    證件識別、票據識別、車牌識別及銀行卡識別等。

  • 數據結構

    • 輸入數據

      manifest文件的每行數據是一道題目,且每行數據必須包含source字段。

      {"data":{"source":"oss://****.oss-cn-hangzhou.aliyuncs.com/demo_test/ocr_pic/img6.jpeg"}}
      ...
    • 輸出數據

      manifest文件的每行數據由題目和標注結果一起生成。每行數據的JSON結構如下。

      {
          "data": {
              "source": "oss://****.oss-cn-hangzhou.aliyuncs.com/demo_test/ocr_pic/img6.jpeg"
          }, 
          "label-144863699223676****": {
              "results": [
                  {
                      "questionId": "1", 
                      "data": [
                          {
                              "id": "ecdb7552-2a4e-4d0e-8abb-0f1a2dc0****", 
                              "type": "image/polygon", 
                              "value": [
                                  [
                                      368.1112214498511, 
                                      71.72740814299901
                                  ], 
                                  [
                                      444.34359483614696, 
                                      71.72740814299901
                                  ], 
                                  [
                                      444.34359483614696, 
                                      106.26762661370405
                                  ], 
                                  [
                                      368.1112214498511, 
                                      106.26762661370405
                                  ]
                              ], 
                              "labels": {
                                  "OCR識別結果": "理財顧問", 
                                  "單選": "標簽1"
                              }
                          }
                      ], 
                      "rotation": 0, 
                      "markTitle": "OCR標簽配置", 
                      "width": 1024, 
                      "type": "image", 
                      "height": 1024
                  }
              ]
          }
      }

目標檢測

目標檢測(Object Detection)標注任務是對圖像中的具體目標進行定位,常用矩形框工具。

  • 應用場景

    車輛檢測、行人檢測及圖片搜索等。

  • 數據結構

    • 輸入數據

      manifest文件的每行數據是一道題目,且每行數據必須包含source字段。

      {"data":{"source":"oss://****.oss-cn-hangzhou.aliyuncs.com/pic_ocr/img17.jpeg"}}
      ...
    • 輸出數據

      manifest文件的每行數據由題目和標注結果一起生成。每行數據的JSON結構如下。

      {
          "data": {
              "source": "oss://****.oss-cn-hangzhou.aliyuncs.com/pic_ocr/img17.jpeg"
          }, 
          "label-144853549785619****": {
              "results": [
                  {
                      "questionId": "1", 
                      "data": [
                          {
                              "id": "e02a574b-9fd9-45e9-8c8a-9682567b****", 
                              "type": "image/polygon", 
                              "value": [
                                  [
                                      499.93454545454546, 
                                      255.0981818181818
                                  ], 
                                  [
                                      911.0109090909091, 
                                      255.0981818181818
                                  ], 
                                  [
                                      911.0109090909091, 
                                      338.6836363636363
                                  ], 
                                  [
                                      499.93454545454546, 
                                      338.6836363636363
                                  ]
                              ], 
                              "labels": {
                                  "單選": "標簽1"
                              }
                          }
                      ], 
                      "rotation": 0, 
                      "markTitle": "目標檢測標簽配置", 
                      "width": 1024, 
                      "type": "image", 
                      "height": 1024
                  }
              ]
          }
      }

圖像分類

圖像分類(Image Classification)是指從一組固定的分類標簽集合中,找到與輸入圖像內容相匹配的一個或多個分類標簽,并將其分配給該輸入圖像。該模板支持單標簽和多標簽圖像分類。

  • 應用場景

    圖片分類、拍照識圖、圖片搜索及內容推薦等。

  • 數據結構

    • 輸入數據

      manifest文件的每行數據是一道題目,且每行數據必須包含source字段。

      {"data":{"source":"oss://****.oss-cn-hangzhou.aliyuncs.com/iTAG/pic/1.jpg"}}
      ...
    • 輸出數據

      manifest文件的每行數據由題目和標注結果一起生成。每行數據的JSON結構如下。

      {
          "data": {
              "source": "oss://****.oss-cn-hangzhou.aliyuncs.com/pic/3.jpg"
          }, 
          "label-143082452899667****": {
              "results": [
                  {
                      "questionId": "2", 
                      "data": [
                          "標簽1", 
                          "標簽2"
                      ], 
                      "markTitle": "多選", 
                      "type": "survey/multivalue"
                  }
              ]
          }
      }