本文介紹文字識別(ocr)類目下的PDF識別RecognizePdf的語法及示例。

功能描述

PDF識別能力可以對PDF上的文字進行結構化識別。

說明
  • 您可以進入在線咨詢獲取在線人工幫助。
  • 當前能力可在視覺智能開放平臺有完整的免費產品體驗,您可以單擊立即試用對該能力進行更直觀試用以及在線購買。
  • 阿里云視覺智能開放平臺視覺AI能力API接入、接口使用或問題咨詢等,請通過釘釘群(23109592)加入阿里云視覺智能開放平臺咨詢群聯系我們。

應用場景

  • 內容審核:可以結合內容審核能力對識別結果進行審核,檢測文檔中是否存在違規信息。
  • 企業報銷: 可以對PDF格式的增值稅發票結構化識別處理后實現報銷場景下的自動化。

特色優勢

  • 精準識別:智能算法升級,精準識別文件內容,保留原始排版。
  • 多語種識別:可識別中、英、中英混合等多語種內容。

接入指引

1. 注冊阿里云賬號:打開阿里云官網,在阿里云官網右上角,單擊立即注冊,按照操作提示完成賬號注冊。

2. 開通能力:請確保您已開通文字識別服務,若未開通服務請立即開通

3. 創建AccessKey:請確保您已創建AccessKey,如果您使用的是子賬號AccessKey,您需要給子賬號賦予AliyunVIAPIFullAccess權限,具體操作,請參見RAM授權

4. 在線調試(可選):您可以通過OpenAPI Explorer在線調試能力,查看完整的調用示例代碼及SDK依賴信息,也可以下載完整的工程。

5. 開發接入步驟:

  • SDK總覽中選擇您要接入使用的SDK語言。
  • 在對應語言的SDK文檔中找到AI類目為文字識別(ocr)的SDK包進行安裝。
  • 參考文檔中提供的示例代碼進行適當修改后調用。

6. 示例代碼:該能力常用語言的示例代碼,請參見PDF識別示例代碼

7. 客戶端直接調用:該能力常用的客戶端調用方式包括以下幾種。

輸入限制

  • 文件格式:PDF。
  • 文件大小:不超過10 MB。
  • 文檔篇幅:PDF不超過5頁。
  • URL地址中不能包含中文字符。

計費說明

關于PDF識別的計費方式及報價,請參見計費介紹

說明 下方調試接口為付費接口,如需免費體驗調試請前往體驗中心

調試

您可以在OpenAPI Explorer中直接運行該接口,免去您計算簽名的困擾。運行成功后,OpenAPI Explorer可以自動生成SDK代碼示例。

請求參數

名稱 類型 是否必選 示例值 描述
Action String RecognizePdf

系統規定參數。取值:RecognizePdf

FileURL String https://viapi-test.oss-cn-shanghai.aliyuncs.com/ocr/xxxx.pdf

文件URL地址。推薦使用上海地域的OSS鏈接,對于文件在本地或者非上海地域OSS鏈接的情況,請參見文件URL處理

返回數據

名稱 類型 示例值 描述
RequestId String CD9A9659-ABEE-4A7D-837F-9FDF40879A97

請求ID。

Data Object

返回的結果數據內容。

Height Long 788

文檔在圖中旋轉后的高度。

Width Long 1220

文檔在圖中旋轉后的寬度。

OrgHeight Long 610

原圖高度。

OrgWidth Long 394

原圖寬度。

PageIndex Long 1

PDF頁數。

Angle Long 0

PDF文件被旋轉的角度。

WordsInfo Array of wordsInfo

文字信息。

Angle Long 0

被識別字段被旋轉的角度。

Word String 發票代碼:012002000211

文字信息。

Height Long 16

被識別字段的高度。

Width Long 205

被識別字段的寬度。

X Long 863

被識別字段左上角X坐標。

Y Long 46

被識別字段左上角Y坐標。

Positions Array of positions

文字信息位置。識別矩形框四個角的坐標順時針排列,分別為左上XY坐標、右上XY坐標、右下XY坐標、左下XY坐標。

X Long 863

矩形框X坐標。

Y Long 43

矩形框Y坐標。

SDK參考

阿里云視覺AI文字識別類目下的PDF識別能力推薦使用SDK調用,支持多種編程語言,調用時請選擇AI類目為文字識別(ocr)的SDK包,文件參數通過SDK調用可支持本地文件及任意URL,具體可參見SDK總覽

示例代碼

該能力常用語言的示例代碼,請參見PDF識別示例代碼

示例

請求示例

http(s)://ocr.cn-shanghai.aliyuncs.com/?Action=RecognizePdf      //更多關于訪問域名(Endpoint)信息,請參見:http://bestwisewords.com/document_detail/143103.html
&FileURL=https://viapi-test.oss-cn-shanghai.aliyuncs.com/ocr/xxxx.pdf
&公共請求參數

正常返回示例

XML格式

HTTP/1.1 200 OK
Content-Type:application/xml

<RecognizePdfResponse>
    <RequestId>CD9A9659-ABEE-4A7D-837F-9FDF40879A97</RequestId>
    <Data>
        <WordsInfo>
            <Word>天津增值稅</Word>
            <Angle>-88</Angle>
            <X>514</X>
            <Positions>
                <X>397</X>
                <Y>45</Y>
            </Positions>
            <Positions>
                <X>662</X>
                <Y>52</Y>
            </Positions>
            <Positions>
                <X>661</X>
                <Y>82</Y>
            </Positions>
            <Positions>
                <X>396</X>
                <Y>75</Y>
            </Positions>
            <Y>-69</Y>
            <Height>265</Height>
            <Width>29</Width>
        </WordsInfo>
        <WordsInfo>
            <Word>普通發票</Word>
            <Angle>0</Angle>
            <X>678</X>
            <Positions>
                <X>678</X>
                <Y>48</Y>
            </Positions>
            <Positions>
                <X>824</X>
                <Y>47</Y>
            </Positions>
            <Positions>
                <X>824</X>
                <Y>76</Y>
            </Positions>
            <Positions>
                <X>678</X>
                <Y>77</Y>
            </Positions>
            <Y>48</Y>
            <Height>29</Height>
            <Width>146</Width>
        </WordsInfo>
        <WordsInfo>
            <Word>發票代碼:012002000211</Word>
            <Angle>0</Angle>
            <X>863</X>
            <Positions>
                <X>863</X>
                <Y>46</Y>
            </Positions>
            <Positions>
                <X>1068</X>
                <Y>46</Y>
            </Positions>
            <Positions>
                <X>1068</X>
                <Y>62</Y>
            </Positions>
            <Positions>
                <X>863</X>
                <Y>62</Y>
            </Positions>
            <Y>46</Y>
            <Height>16</Height>
            <Width>205</Width>
        </WordsInfo>
        <OrgWidth>610</OrgWidth>
        <Angle>0</Angle>
        <OrgHeight>394</OrgHeight>
        <Height>788</Height>
        <PageIndex>1</PageIndex>
        <Width>1220</Width>
    </Data>
</RecognizePdfResponse>

JSON格式

HTTP/1.1 200 OK
Content-Type:application/json

{
  "RequestId" : "CD9A9659-ABEE-4A7D-837F-9FDF40879A97",
  "Data" : {
    "WordsInfo" : [ {
      "Word" : "天津增值稅",
      "Angle" : -88,
      "X" : 514,
      "Positions" : [ {
        "X" : 397,
        "Y" : 45
      }, {
        "X" : 662,
        "Y" : 52
      }, {
        "X" : 661,
        "Y" : 82
      }, {
        "X" : 396,
        "Y" : 75
      } ],
      "Y" : -69,
      "Height" : 265,
      "Width" : 29
    }, {
      "Word" : "普通發票",
      "Angle" : 0,
      "X" : 678,
      "Positions" : [ {
        "X" : 678,
        "Y" : 48
      }, {
        "X" : 824,
        "Y" : 47
      }, {
        "X" : 824,
        "Y" : 76
      }, {
        "X" : 678,
        "Y" : 77
      } ],
      "Y" : 48,
      "Height" : 29,
      "Width" : 146
    }, {
      "Word" : "發票代碼:012002000211",
      "Angle" : 0,
      "X" : 863,
      "Positions" : [ {
        "X" : 863,
        "Y" : 46
      }, {
        "X" : 1068,
        "Y" : 46
      }, {
        "X" : 1068,
        "Y" : 62
      }, {
        "X" : 863,
        "Y" : 62
      } ],
      "Y" : 46,
      "Height" : 16,
      "Width" : 205
    } ],
    "OrgWidth" : 610,
    "Angle" : 0,
    "OrgHeight" : 394,
    "Height" : 788,
    "PageIndex" : 1,
    "Width" : 1220
  }
}

錯誤碼

關于PDF識別的錯誤碼,詳情請參見常見錯誤碼

安全聲明

  • 請確保上傳的圖片或文件來源符合相應的法律法規。
  • 通過體驗調試上傳的臨時文件有效期為1小時,在24小時后會被系統自動清理刪除。