針對全日文圖片文檔場景下日文印刷體高效檢測和識別,支持旋轉、表格、文字坐標等多項基礎功能。
調試
您可以在OpenAPI Explorer中直接運行該接口,免去您計算簽名的困擾。運行成功后,OpenAPI Explorer可以自動生成SDK代碼示例。
授權信息
下表是API對應的授權信息,可以在RAM權限策略語句的Action
元素中使用,用來給RAM用戶或RAM角色授予調用此API的權限。具體說明如下:
- 操作:是指具體的權限點。
- 訪問級別:是指每個操作的訪問級別,取值為寫入(Write)、讀取(Read)或列出(List)。
- 資源類型:是指操作中支持授權的資源類型。具體說明如下:
- 對于必選的資源類型,用背景高亮的方式表示。
- 對于不支持資源級授權的操作,用
全部資源
表示。
- 條件關鍵字:是指云產品自身定義的條件關鍵字。
- 關聯操作:是指成功執行操作所需要的其他權限。操作者必須同時具備關聯操作的權限,操作才能成功。
操作 | 訪問級別 | 資源類型 | 條件關鍵字 | 關聯操作 |
---|---|---|---|---|
ocr:RecognizeJanpanese | *全部資源 * |
| 無 |
請求參數
名稱 | 類型 | 必填 | 描述 | 示例值 |
---|---|---|---|---|
Url | string | 否 | 圖片鏈接(長度不超 2048 字節,不支持 base64) | https://img.alicdn.com/tfs/TB1Wo7eXAvoK1RjSZFDXXXY3pXa-2512-3509.jpg |
body | byte | 否 | 圖片二進制文件,最大 10MB,與 URL 二選一。 使用 HTTP 方式調用,把圖片二進制文件放到 HTTP body 中上傳即可。 使用 SDK 的方式調用,把圖片放到 SDK 的 body 中即可 | 圖片二進制文件 |
OutputCharInfo | boolean | 否 | 是否輸出單字識別結果 | false |
NeedRotate | boolean | 否 | 是否需要自動旋轉功能(結構化檢測、混貼場景、教育相關場景會自動做旋轉,無需設置),返回角度信息 | false |
OutputTable | boolean | 否 | 是否輸出表格識別結果,包含單元格信息 | false |
返回參數
返回數據說明
angle 圖片的角度,0 表示正向,90 表示圖片朝右,180 朝下,270 朝左</br>
content 識別出圖片的文字塊匯總</br>
height 算法矯正圖片后的高度</br>
width 算法矯正圖片后的寬度</br>
orgHeight 原圖的高度</br>
orgWidth 原圖的寬度</br>
prism_wnum 識別的文字塊的數量,prism_wordsInfo 數組的大小</br>
-------------------------prism-wordsInfo 文字塊數組內的字段說明-------------------------</br>
angle 文字塊的角度,這個角度只影響 width 和 height,當角度為-90、90、-270、270,width 和 height 的值需要自行互換</br>
height 文字塊的高度</br>
width 文字塊的寬度</br>
pos 文字塊的外矩形四個點的坐標按順時針排列,左上、右上、右下、左下,當 NeedRotate 為 true 時,如果最外層的 angle 不為 0,需要按照 angle 矯正圖片后,坐標才準確</br>
word 文字塊的文字</br>
tableId 當 OutputTable 為 true 并且該文字塊在表格內則存在該字段,tableId 表示表格的 id</br>
tableCellId 當 OutputTable 為 true 并且該文字塊在表格內則存在該字段,表示表格中單元格的 id</br>
----------------------------------------charInfo 單字信息-----------------------------------------</br>
word 單字文字</br>
x 單字左上角橫坐標</br>
y 單字左上角縱坐標</br>
w 單字寬度
<span>h 單字高度</span></br>
--------------------------------------------------------------------------------------------------------</br>
--------------------------------------------------------------------------------------------------------</br>
---------------------------prism-tablesInfo 表格數組內的字段說明--------------------------</br>
tableId 表格 id,和 prism_wordsInfo 信息中的 tableId 對應</br>
xCellSize 表格中橫坐標單元格的數量</br>
yCellSize 表格中縱坐標單元格的數量</br>
------------cellInfos 單元格信息,包含單元格在整個表格中的空間拓撲關系---------</br>
tableCellId 表格中單元格 id,和 prism_wordsInfo 信息中的 tableCellId 對應</br>
word 單元格中的文字</br>
xsc xStartCell 縮寫,表示橫軸方向該單元格起始在第幾個單元格,第一個單元格值為 0</br>
xec xEndCell 縮寫,表示橫軸方向該單元格結束在第幾個單元格,第一個單元格值為 0,如果 xsc 和 xec 都為 0 說明該文字在橫軸方向占據了一個單元格并且在第一個單元格內</br>
ysc yStartCell 縮寫,表示縱軸方向該單元格起始在第幾個單元格,第一個單元格值為 0</br>
yec yEndCell 縮寫,表示縱軸方向該單元格結束在第幾個單元格,第一個單元格值為 0</br>
pos 單元格位置,按照單元格四個角的坐標順時針排列,分別為左上 XY 坐標、右上 XY 坐標、右下 XY 坐標、左下 XY 坐標</br>
--------------------------------------------------------------------------------------------------------</br>
--------------------------------------------------------------------------------------------------------</br>
示例
正常返回示例
JSON
格式
{
"RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
"Data": "{\"content\":\"いくら飛すか (多少錢?) \",\"height\":384,\"orgHeight\":384,\"orgWidth\":512,\"prism_version\":\"1.0.9\",\"prism_wnum\":2,\"prism_wordsInfo\":[{\"angle\":-89,\"direction\":0,\"height\":508,\"pos\":[{\"x\":2,\"y\":85},{\"x\":509,\"y\":85},{\"x\":509,\"y\":170},{\"x\":2,\"y\":170}],\"prob\":99,\"width\":84,\"word\":\"いくら飛すか\",\"x\":213,\"y\":-126}],\"width\":512}",
"Code": "200",
"Message": "message"
}
錯誤碼
訪問錯誤中心查看更多錯誤碼。
變更歷史
變更時間 | 變更內容概要 | 操作 |
---|---|---|
2021-08-17 | OpenAPI 入參發生變更 | 查看變更詳情 |