本文介紹文字識別(ocr)類目下的PDF識別RecognizePdf的語法及示例。
功能描述
PDF識別能力可以對PDF上的文字進行結構化識別。
應用場景
- 內容審核:可以結合內容審核能力對識別結果進行審核,檢測文檔中是否存在違規信息。
- 企業報銷: 可以對PDF格式的增值稅發票結構化識別處理后實現報銷場景下的自動化。
特色優勢
- 精準識別:智能算法升級,精準識別文件內容,保留原始排版。
- 多語種識別:可識別中、英、中英混合等多語種內容。
接入指引
1. 注冊阿里云賬號:打開阿里云官網,在阿里云官網右上角,單擊立即注冊,按照操作提示完成賬號注冊。
2. 開通能力:請確保您已開通文字識別服務,若未開通服務請立即開通。
3. 創建AccessKey:請確保您已創建AccessKey,如果您使用的是子賬號AccessKey,您需要給子賬號賦予AliyunVIAPIFullAccess權限,具體操作,請參見RAM授權。
4. 在線調試(可選):您可以通過OpenAPI Explorer在線調試能力,查看完整的調用示例代碼及SDK依賴信息,也可以下載完整的工程。
5. 開發接入步驟:
- 在SDK總覽中選擇您要接入使用的SDK語言。
- 在對應語言的SDK文檔中找到AI類目為文字識別(ocr)的SDK包進行安裝。
- 參考文檔中提供的示例代碼進行適當修改后調用。
6. 示例代碼:該能力常用語言的示例代碼,請參見PDF識別示例代碼。
7. 客戶端直接調用:該能力常用的客戶端調用方式包括以下幾種。
輸入限制
- 文件格式:PDF。
- 文件大小:不超過10 MB。
- 文檔篇幅:PDF不超過5頁。
- URL地址中不能包含中文字符。
計費說明
關于PDF識別的計費方式及報價,請參見計費介紹。
調試
您可以在OpenAPI Explorer中直接運行該接口,免去您計算簽名的困擾。運行成功后,OpenAPI Explorer可以自動生成SDK代碼示例。
請求參數
名稱 | 類型 | 是否必選 | 示例值 | 描述 |
---|---|---|---|---|
Action | String | 是 | RecognizePdf | 系統規定參數。取值:RecognizePdf。 |
FileURL | String | 是 | https://viapi-test.oss-cn-shanghai.aliyuncs.com/ocr/xxxx.pdf | 文件URL地址。推薦使用上海地域的OSS鏈接,對于文件在本地或者非上海地域OSS鏈接的情況,請參見文件URL處理。 |
返回數據
名稱 | 類型 | 示例值 | 描述 |
---|---|---|---|
RequestId | String | CD9A9659-ABEE-4A7D-837F-9FDF40879A97 | 請求ID。 |
Data | Object | 返回的結果數據內容。 |
|
Height | Long | 788 | 文檔在圖中旋轉后的高度。 |
Width | Long | 1220 | 文檔在圖中旋轉后的寬度。 |
OrgHeight | Long | 610 | 原圖高度。 |
OrgWidth | Long | 394 | 原圖寬度。 |
PageIndex | Long | 1 | PDF頁數。 |
Angle | Long | 0 | PDF文件被旋轉的角度。 |
WordsInfo | Array of wordsInfo | 文字信息。 |
|
Angle | Long | 0 | 被識別字段被旋轉的角度。 |
Word | String | 發票代碼:012002000211 | 文字信息。 |
Height | Long | 16 | 被識別字段的高度。 |
Width | Long | 205 | 被識別字段的寬度。 |
X | Long | 863 | 被識別字段左上角X坐標。 |
Y | Long | 46 | 被識別字段左上角Y坐標。 |
Positions | Array of positions | 文字信息位置。識別矩形框四個角的坐標順時針排列,分別為左上XY坐標、右上XY坐標、右下XY坐標、左下XY坐標。 |
|
X | Long | 863 | 矩形框X坐標。 |
Y | Long | 43 | 矩形框Y坐標。 |
SDK參考
阿里云視覺AI文字識別類目下的PDF識別能力推薦使用SDK調用,支持多種編程語言,調用時請選擇AI類目為文字識別(ocr)的SDK包,文件參數通過SDK調用可支持本地文件及任意URL,具體可參見SDK總覽。
示例代碼
該能力常用語言的示例代碼,請參見PDF識別示例代碼。
示例
請求示例
http(s)://ocr.cn-shanghai.aliyuncs.com/?Action=RecognizePdf //更多關于訪問域名(Endpoint)信息,請參見:http://bestwisewords.com/document_detail/143103.html
&FileURL=https://viapi-test.oss-cn-shanghai.aliyuncs.com/ocr/xxxx.pdf
&公共請求參數
正常返回示例
XML
格式
HTTP/1.1 200 OK
Content-Type:application/xml
<RecognizePdfResponse>
<RequestId>CD9A9659-ABEE-4A7D-837F-9FDF40879A97</RequestId>
<Data>
<WordsInfo>
<Word>天津增值稅</Word>
<Angle>-88</Angle>
<X>514</X>
<Positions>
<X>397</X>
<Y>45</Y>
</Positions>
<Positions>
<X>662</X>
<Y>52</Y>
</Positions>
<Positions>
<X>661</X>
<Y>82</Y>
</Positions>
<Positions>
<X>396</X>
<Y>75</Y>
</Positions>
<Y>-69</Y>
<Height>265</Height>
<Width>29</Width>
</WordsInfo>
<WordsInfo>
<Word>普通發票</Word>
<Angle>0</Angle>
<X>678</X>
<Positions>
<X>678</X>
<Y>48</Y>
</Positions>
<Positions>
<X>824</X>
<Y>47</Y>
</Positions>
<Positions>
<X>824</X>
<Y>76</Y>
</Positions>
<Positions>
<X>678</X>
<Y>77</Y>
</Positions>
<Y>48</Y>
<Height>29</Height>
<Width>146</Width>
</WordsInfo>
<WordsInfo>
<Word>發票代碼:012002000211</Word>
<Angle>0</Angle>
<X>863</X>
<Positions>
<X>863</X>
<Y>46</Y>
</Positions>
<Positions>
<X>1068</X>
<Y>46</Y>
</Positions>
<Positions>
<X>1068</X>
<Y>62</Y>
</Positions>
<Positions>
<X>863</X>
<Y>62</Y>
</Positions>
<Y>46</Y>
<Height>16</Height>
<Width>205</Width>
</WordsInfo>
<OrgWidth>610</OrgWidth>
<Angle>0</Angle>
<OrgHeight>394</OrgHeight>
<Height>788</Height>
<PageIndex>1</PageIndex>
<Width>1220</Width>
</Data>
</RecognizePdfResponse>
JSON
格式
HTTP/1.1 200 OK
Content-Type:application/json
{
"RequestId" : "CD9A9659-ABEE-4A7D-837F-9FDF40879A97",
"Data" : {
"WordsInfo" : [ {
"Word" : "天津增值稅",
"Angle" : -88,
"X" : 514,
"Positions" : [ {
"X" : 397,
"Y" : 45
}, {
"X" : 662,
"Y" : 52
}, {
"X" : 661,
"Y" : 82
}, {
"X" : 396,
"Y" : 75
} ],
"Y" : -69,
"Height" : 265,
"Width" : 29
}, {
"Word" : "普通發票",
"Angle" : 0,
"X" : 678,
"Positions" : [ {
"X" : 678,
"Y" : 48
}, {
"X" : 824,
"Y" : 47
}, {
"X" : 824,
"Y" : 76
}, {
"X" : 678,
"Y" : 77
} ],
"Y" : 48,
"Height" : 29,
"Width" : 146
}, {
"Word" : "發票代碼:012002000211",
"Angle" : 0,
"X" : 863,
"Positions" : [ {
"X" : 863,
"Y" : 46
}, {
"X" : 1068,
"Y" : 46
}, {
"X" : 1068,
"Y" : 62
}, {
"X" : 863,
"Y" : 62
} ],
"Y" : 46,
"Height" : 16,
"Width" : 205
} ],
"OrgWidth" : 610,
"Angle" : 0,
"OrgHeight" : 394,
"Height" : 788,
"PageIndex" : 1,
"Width" : 1220
}
}
錯誤碼
關于PDF識別的錯誤碼,詳情請參見常見錯誤碼。
安全聲明
- 請確保上傳的圖片或文件來源符合相應的法律法規。
- 通過體驗調試上傳的臨時文件有效期為1小時,在24小時后會被系統自動清理刪除。