針對(duì)全日文圖片文檔場(chǎng)景下日文印刷體高效檢測(cè)和識(shí)別,支持旋轉(zhuǎn)、表格、文字坐標(biāo)等多項(xiàng)基礎(chǔ)功能。
調(diào)試
您可以在OpenAPI Explorer中直接運(yùn)行該接口,免去您計(jì)算簽名的困擾。運(yùn)行成功后,OpenAPI Explorer可以自動(dòng)生成SDK代碼示例。
授權(quán)信息
下表是API對(duì)應(yīng)的授權(quán)信息,可以在RAM權(quán)限策略語(yǔ)句的Action
元素中使用,用來(lái)給RAM用戶或RAM角色授予調(diào)用此API的權(quán)限。具體說(shuō)明如下:
- 操作:是指具體的權(quán)限點(diǎn)。
- 訪問(wèn)級(jí)別:是指每個(gè)操作的訪問(wèn)級(jí)別,取值為寫(xiě)入(Write)、讀?。≧ead)或列出(List)。
- 資源類型:是指操作中支持授權(quán)的資源類型。具體說(shuō)明如下:
- 對(duì)于必選的資源類型,用背景高亮的方式表示。
- 對(duì)于不支持資源級(jí)授權(quán)的操作,用
全部資源
表示。
- 條件關(guān)鍵字:是指云產(chǎn)品自身定義的條件關(guān)鍵字。
- 關(guān)聯(lián)操作:是指成功執(zhí)行操作所需要的其他權(quán)限。操作者必須同時(shí)具備關(guān)聯(lián)操作的權(quán)限,操作才能成功。
操作 | 訪問(wèn)級(jí)別 | 資源類型 | 條件關(guān)鍵字 | 關(guān)聯(lián)操作 |
---|---|---|---|---|
ocr:RecognizeJanpanese | *全部資源 * |
| 無(wú) |
請(qǐng)求參數(shù)
名稱 | 類型 | 必填 | 描述 | 示例值 |
---|---|---|---|---|
Url | string | 否 | 圖片鏈接(長(zhǎng)度不超 2048 字節(jié),不支持 base64) | https://img.alicdn.com/tfs/TB1Wo7eXAvoK1RjSZFDXXXY3pXa-2512-3509.jpg |
body | byte | 否 | 圖片二進(jìn)制文件,最大 10MB,與 URL 二選一。 使用 HTTP 方式調(diào)用,把圖片二進(jìn)制文件放到 HTTP body 中上傳即可。 使用 SDK 的方式調(diào)用,把圖片放到 SDK 的 body 中即可 | 圖片二進(jìn)制文件 |
OutputCharInfo | boolean | 否 | 是否輸出單字識(shí)別結(jié)果 | false |
NeedRotate | boolean | 否 | 是否需要自動(dòng)旋轉(zhuǎn)功能(結(jié)構(gòu)化檢測(cè)、混貼場(chǎng)景、教育相關(guān)場(chǎng)景會(huì)自動(dòng)做旋轉(zhuǎn),無(wú)需設(shè)置),返回角度信息 | false |
OutputTable | boolean | 否 | 是否輸出表格識(shí)別結(jié)果,包含單元格信息 | false |
返回參數(shù)
返回?cái)?shù)據(jù)說(shuō)明
angle 圖片的角度,0 表示正向,90 表示圖片朝右,180 朝下,270 朝左</br>
content 識(shí)別出圖片的文字塊匯總</br>
height 算法矯正圖片后的高度</br>
width 算法矯正圖片后的寬度</br>
orgHeight 原圖的高度</br>
orgWidth 原圖的寬度</br>
prism_wnum 識(shí)別的文字塊的數(shù)量,prism_wordsInfo 數(shù)組的大小</br>
-------------------------prism-wordsInfo 文字塊數(shù)組內(nèi)的字段說(shuō)明-------------------------</br>
angle 文字塊的角度,這個(gè)角度只影響 width 和 height,當(dāng)角度為-90、90、-270、270,width 和 height 的值需要自行互換</br>
height 文字塊的高度</br>
width 文字塊的寬度</br>
pos 文字塊的外矩形四個(gè)點(diǎn)的坐標(biāo)按順時(shí)針排列,左上、右上、右下、左下,當(dāng) NeedRotate 為 true 時(shí),如果最外層的 angle 不為 0,需要按照 angle 矯正圖片后,坐標(biāo)才準(zhǔn)確</br>
word 文字塊的文字</br>
tableId 當(dāng) OutputTable 為 true 并且該文字塊在表格內(nèi)則存在該字段,tableId 表示表格的 id</br>
tableCellId 當(dāng) OutputTable 為 true 并且該文字塊在表格內(nèi)則存在該字段,表示表格中單元格的 id</br>
----------------------------------------charInfo 單字信息-----------------------------------------</br>
word 單字文字</br>
x 單字左上角橫坐標(biāo)</br>
y 單字左上角縱坐標(biāo)</br>
w 單字寬度
<span>h 單字高度</span></br>
--------------------------------------------------------------------------------------------------------</br>
--------------------------------------------------------------------------------------------------------</br>
---------------------------prism-tablesInfo 表格數(shù)組內(nèi)的字段說(shuō)明--------------------------</br>
tableId 表格 id,和 prism_wordsInfo 信息中的 tableId 對(duì)應(yīng)</br>
xCellSize 表格中橫坐標(biāo)單元格的數(shù)量</br>
yCellSize 表格中縱坐標(biāo)單元格的數(shù)量</br>
------------cellInfos 單元格信息,包含單元格在整個(gè)表格中的空間拓?fù)潢P(guān)系---------</br>
tableCellId 表格中單元格 id,和 prism_wordsInfo 信息中的 tableCellId 對(duì)應(yīng)</br>
word 單元格中的文字</br>
xsc xStartCell 縮寫(xiě),表示橫軸方向該單元格起始在第幾個(gè)單元格,第一個(gè)單元格值為 0</br>
xec xEndCell 縮寫(xiě),表示橫軸方向該單元格結(jié)束在第幾個(gè)單元格,第一個(gè)單元格值為 0,如果 xsc 和 xec 都為 0 說(shuō)明該文字在橫軸方向占據(jù)了一個(gè)單元格并且在第一個(gè)單元格內(nèi)</br>
ysc yStartCell 縮寫(xiě),表示縱軸方向該單元格起始在第幾個(gè)單元格,第一個(gè)單元格值為 0</br>
yec yEndCell 縮寫(xiě),表示縱軸方向該單元格結(jié)束在第幾個(gè)單元格,第一個(gè)單元格值為 0</br>
pos 單元格位置,按照單元格四個(gè)角的坐標(biāo)順時(shí)針排列,分別為左上 XY 坐標(biāo)、右上 XY 坐標(biāo)、右下 XY 坐標(biāo)、左下 XY 坐標(biāo)</br>
--------------------------------------------------------------------------------------------------------</br>
--------------------------------------------------------------------------------------------------------</br>
示例
正常返回示例
JSON
格式
{
"RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
"Data": "{\"content\":\"いくら飛すか (多少錢?) \",\"height\":384,\"orgHeight\":384,\"orgWidth\":512,\"prism_version\":\"1.0.9\",\"prism_wnum\":2,\"prism_wordsInfo\":[{\"angle\":-89,\"direction\":0,\"height\":508,\"pos\":[{\"x\":2,\"y\":85},{\"x\":509,\"y\":85},{\"x\":509,\"y\":170},{\"x\":2,\"y\":170}],\"prob\":99,\"width\":84,\"word\":\"いくら飛すか\",\"x\":213,\"y\":-126}],\"width\":512}",
"Code": "200",
"Message": "message"
}
錯(cuò)誤碼
訪問(wèn)錯(cuò)誤中心查看更多錯(cuò)誤碼。
變更歷史
變更時(shí)間 | 變更內(nèi)容概要 | 操作 |
---|---|---|
2021-08-17 | OpenAPI 入?yún)l(fā)生變更 | 查看變更詳情 |