針對拉丁語系的圖片文檔場景下印刷體高效檢測和識別,支持旋轉、表格、文字坐標等多項基礎功能。
調試
您可以在OpenAPI Explorer中直接運行該接口,免去您計算簽名的困擾。運行成功后,OpenAPI Explorer可以自動生成SDK代碼示例。
授權信息
下表是API對應的授權信息,可以在RAM權限策略語句的Action
元素中使用,用來給RAM用戶或RAM角色授予調用此API的權限。具體說明如下:
- 操作:是指具體的權限點。
- 訪問級別:是指每個操作的訪問級別,取值為寫入(Write)、讀取(Read)或列出(List)。
- 資源類型:是指操作中支持授權的資源類型。具體說明如下:
- 對于必選的資源類型,用背景高亮的方式表示。
- 對于不支持資源級授權的操作,用
全部資源
表示。
- 條件關鍵字:是指云產品自身定義的條件關鍵字。
- 關聯操作:是指成功執行操作所需要的其他權限。操作者必須同時具備關聯操作的權限,操作才能成功。
操作 | 訪問級別 | 資源類型 | 條件關鍵字 | 關聯操作 |
---|---|---|---|---|
ocr:RecognizeLatin | *全部資源 * |
| 無 |
請求參數
名稱 | 類型 | 必填 | 描述 | 示例值 |
---|---|---|---|---|
Url | string | 否 | 圖片鏈接(長度不超 2048 字節,不支持 base64) | https://img.alicdn.com/tfs/TB1Wo7eXAvoK1RjSZFDXXXY3pXa-2512-3509.jpg |
body | byte | 否 | 圖片二進制文件,最大 10MB,與 URL 二選一。 使用 HTTP 方式調用,把圖片二進制文件放到 HTTP body 中上傳即可。 使用 SDK 的方式調用,把圖片放到 SDK 的 body 中即可。 | 圖片二進制文件 |
OutputCharInfo | boolean | 否 | 是否輸出單字識別結果 | false |
NeedRotate | boolean | 否 | 是否需要自動旋轉功能(結構化檢測、混貼場景、教育相關場景會自動做旋轉,無需設置),返回角度信息 | false |
OutputTable | boolean | 否 | 是否輸出表格識別結果,包含單元格信息 | false |
返回參數
返回數據說明
angle 圖片的角度,0 表示正向,90 表示圖片朝右,180 朝下,270 朝左</br>
content 識別出圖片的文字塊匯總</br>
height 算法矯正圖片后的高度</br>
width 算法矯正圖片后的寬度</br>
orgHeight 原圖的高度</br>
orgWidth 原圖的寬度</br>
prism_wnum 識別的文字塊的數量,prism_wordsInfo 數組的大小</br>
-------------------------prism-wordsInfo 文字塊數組內的字段說明-------------------------</br>
angle 文字塊的角度,這個角度只影響 width 和 height,當角度為-90、90、-270、270,width 和 height 的值需要自行互換</br>
height 文字塊的高度</br>
width 文字塊的寬度</br>
pos 文字塊的外矩形四個點的坐標按順時針排列,左上、右上、右下、左下,當 NeedRotate 為 true 時,如果最外層的 angle 不為 0,需要按照 angle 矯正圖片后,坐標才準確</br>
word 文字塊的文字</br>
tableId 當 OutputTable 為 true 并且該文字塊在表格內則存在該字段,tableId 表示表格的 id</br>
tableCellId 當 OutputTable 為 true 并且該文字塊在表格內則存在該字段,表示表格中單元格的 id</br>
----------------------------------------charInfo 單字信息-----------------------------------------</br>
word 單字文字</br>
x 單字左上角橫坐標</br>
y 單字左上角縱坐標</br>
w 單字寬度
<span>h 單字高度</span></br>
--------------------------------------------------------------------------------------------------------</br>
--------------------------------------------------------------------------------------------------------</br>
---------------------------prism-tablesInfo 表格數組內的字段說明--------------------------</br>
tableId 表格 id,和 prism_wordsInfo 信息中的 tableId 對應</br>
xCellSize 表格中橫坐標單元格的數量</br>
yCellSize 表格中縱坐標單元格的數量</br>
------------cellInfos 單元格信息,包含單元格在整個表格中的空間拓撲關系---------</br>
tableCellId 表格中單元格 id,和 prism_wordsInfo 信息中的 tableCellId 對應</br>
word 單元格中的文字</br>
xsc xStartCell 縮寫,表示橫軸方向該單元格起始在第幾個單元格,第一個單元格值為 0</br>
xec xEndCell 縮寫,表示橫軸方向該單元格結束在第幾個單元格,第一個單元格值為 0,如果 xsc 和 xec 都為 0 說明該文字在橫軸方向占據了一個單元格并且在第一個單元格內</br>
ysc yStartCell 縮寫,表示縱軸方向該單元格起始在第幾個單元格,第一個單元格值為 0</br>
yec yEndCell 縮寫,表示縱軸方向該單元格結束在第幾個單元格,第一個單元格值為 0</br>
pos 單元格位置,按照單元格四個角的坐標順時針排列,分別為左上 XY 坐標、右上 XY 坐標、右下 XY 坐標、左下 XY 坐標</br>
--------------------------------------------------------------------------------------------------------</br>
--------------------------------------------------------------------------------------------------------</br>
示例
正常返回示例
JSON
格式
{
"RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
"Data": "{\"angle\":1,\"content\":\"??m Phong Cách Khác Biêt Trên tay ch? tác nguyên kh?i d?n ??u xu h??ng v?i thi?t k? th?n máy li?n m?ch, ?? m?ng ?n t??ng 8.5mm cùng ki?u dáng m?t kinh bóng m??t, sang tr?ng t? Galaxy M30. V?a v?n ho?n h?o trong l?ng b?n tay, tho thích th? hi?n phong cách th?i th??ng v?i hai phiên b?n màu ?en ho?c Xanh c? tính. xanh Ngan Hà ?en Ng? Khói OC S \",\"height\":821,\"orgHeight\":803,\"orgWidth\":1075,\"prism_version\":\"1.0.9\",\"prism_wnum\":9,\"prism_wordsInfo\":[{\"angle\":0,\"direction\":0,\"height\":37,\"pos\":[{\"x\":293,\"y\":37},{\"x\":776,\"y\":29},{\"x\":777,\"y\":66},{\"x\":294,\"y\":74}],\"prob\":99,\"width\":484,\"word\":\"??m Phong Cách\",\"x\":292,\"y\":24}],\"width\":1088}",
"Code": "200",
"Message": "message"
}
錯誤碼
訪問錯誤中心查看更多錯誤碼。
變更歷史
變更時間 | 變更內容概要 | 操作 |
---|---|---|
2021-08-17 | OpenAPI 入參發生變更 | 查看變更詳情 |