針對(duì)全英文圖片文檔場(chǎng)景下英文印刷體字符高效檢測(cè)和識(shí)別,具備英文專項(xiàng)識(shí)別和英文分詞功能,支持旋轉(zhuǎn)、表格、文字坐標(biāo)等多項(xiàng)基礎(chǔ)功能。
接口說明
本接口適用場(chǎng)景
- 阿里云英語專項(xiàng)識(shí)別,是阿里云官方自研 OCR 文字識(shí)別產(chǎn)品,適用于全英文圖片、文檔場(chǎng)景下的英文印刷體字符的高效檢測(cè)和識(shí)別。
- 阿里云 OCR 產(chǎn)品基于阿里巴巴達(dá)摩院強(qiáng)大的 AI 技術(shù)及海量數(shù)據(jù),歷經(jīng)多年沉淀打磨,具有服務(wù)穩(wěn)定、操作簡(jiǎn)易、實(shí)時(shí)性高、能力全面等幾大優(yōu)勢(shì)。
- 本接口圖片示例
本接口核心能力
分類 | 概述 |
---|---|
功能 | 具備英文專項(xiàng)識(shí)別和英文分詞功能。 |
圖像增強(qiáng) | 默認(rèn)支持圖像增強(qiáng),包括圖像自動(dòng)旋轉(zhuǎn)、畸變自動(dòng)矯正、模糊圖片自動(dòng)增強(qiáng)等能力。 |
多類型覆蓋 | 支持模糊、光照不均、透視畸變、任意背景等低質(zhì)量圖像識(shí)別。 |
多卡面類型 | 支持各種位數(shù)、凸字卡面、平面卡面的識(shí)別。 |
如何使用本接口
步驟 | 概述 |
---|---|
1 | 開通 小語種識(shí)別 服務(wù)。開通服務(wù)前后,您可以通過體驗(yàn)館免費(fèi)體驗(yàn)本功能識(shí)別效果。 |
2 | 購買英語作文識(shí)別資源包。本 API 會(huì)贈(zèng)送免費(fèi)額度,可使用免費(fèi)額度測(cè)試。 |
3 | 可以參照調(diào)試頁面提供的代碼示例完成 API 接入開發(fā)。接入完成后,調(diào)用 API 獲取識(shí)別結(jié)果。如果使用子賬號(hào)調(diào)用接口,需要阿里云賬號(hào)(主賬號(hào))對(duì) RAM 賬號(hào)進(jìn)行授權(quán)。創(chuàng)建 RAM 用戶的具體操作,請(qǐng)參考:創(chuàng)建 RAM 用戶。文字識(shí)別服務(wù)提供一種系統(tǒng)授權(quán)策略,即 AliyunOCRFullAccess。具體授權(quán)操作,請(qǐng)參見在用戶頁面為 RAM 用戶授權(quán)。 |
重要提示
類型 | 概述 |
---|---|
圖片格式 |
|
圖片尺寸 |
|
圖片大小 |
|
其他提示 |
|
調(diào)試
您可以在OpenAPI Explorer中直接運(yùn)行該接口,免去您計(jì)算簽名的困擾。運(yùn)行成功后,OpenAPI Explorer可以自動(dòng)生成SDK代碼示例。
授權(quán)信息
下表是API對(duì)應(yīng)的授權(quán)信息,可以在RAM權(quán)限策略語句的Action
元素中使用,用來給RAM用戶或RAM角色授予調(diào)用此API的權(quán)限。具體說明如下:
- 操作:是指具體的權(quán)限點(diǎn)。
- 訪問級(jí)別:是指每個(gè)操作的訪問級(jí)別,取值為寫入(Write)、讀取(Read)或列出(List)。
- 資源類型:是指操作中支持授權(quán)的資源類型。具體說明如下:
- 對(duì)于必選的資源類型,用背景高亮的方式表示。
- 對(duì)于不支持資源級(jí)授權(quán)的操作,用
全部資源
表示。
- 條件關(guān)鍵字:是指云產(chǎn)品自身定義的條件關(guān)鍵字。
- 關(guān)聯(lián)操作:是指成功執(zhí)行操作所需要的其他權(quán)限。操作者必須同時(shí)具備關(guān)聯(lián)操作的權(quán)限,操作才能成功。
操作 | 訪問級(jí)別 | 資源類型 | 條件關(guān)鍵字 | 關(guān)聯(lián)操作 |
---|---|---|---|---|
ocr:RecognizeEnglish | *全部資源 * |
| 無 |
請(qǐng)求參數(shù)
名稱 | 類型 | 必填 | 描述 | 示例值 |
---|---|---|---|---|
Url | string | 否 |
| https://img.alicdn.com/tfs/TB1Wo7eXAvoK1RjSZFDXXXY3pXa-2512-3509.jpg |
body | byte | 否 |
| 圖片二進(jìn)制文件 |
NeedRotate | boolean | 否 |
| false |
OutputTable | boolean | 否 |
| false |
返回參數(shù)
返回參數(shù)說明
字段 | 類型 | 說明 |
---|---|---|
angle | int | 圖片的角度(當(dāng) NeedRotate=true 時(shí),返回此字段)。0 表示正向,90 表示圖片朝右,180 朝下,270 朝左。 |
content | string | 識(shí)別出圖片的文字塊匯總。 |
prism_wordsInfo | list | 文字塊信息。 |
prism_tablesInfo | list | 表格信息(當(dāng) OutputTable=true 時(shí),返回此字段)。 |
prism_wnum | int | 識(shí)別的文字塊的數(shù)量,prism_wordsInfo 數(shù)組的大小。 |
height | int | 算法矯正圖片后的高度。 |
width | int | 算法矯正圖片后的寬度。 |
orgHeight | int | 原圖的高度。 |
orgWidth | int | 原圖的寬度。 |
文字塊信息(prism_wordsInfo 字段)
字段 | 類型 | 說明 |
---|---|---|
angle | int | 文字塊的角度。 |
height | int | 文字塊的高度(需考慮文字塊的角度) |
width | int | 文字塊的寬度(需考慮文字塊的角度) |
pos | list | 文字塊的外矩形四個(gè)點(diǎn)的坐標(biāo)按順時(shí)針排列(左上、右上、右下、左下)。當(dāng) NeedRotate=true 時(shí),如果最外層的 angle 不為 0,需要按照 angle 矯正圖片后,坐標(biāo)才準(zhǔn)確。 |
word | string | 文字塊的文字內(nèi)容。 |
tableId | int | 表格的 id(當(dāng) OutputTable=true 時(shí),返回此字段)。 |
tableCellId | int | 表格中單元格的 id(當(dāng) OutputTable=true 時(shí),返回此字段)。 |
表格信息(prism_tablesInfo 字段。當(dāng) OutputTable=true 時(shí),返回此字段。)
字段 | 類型 | 說明 |
---|---|---|
tableId | int | 表格 id,和 prism_wordsInfo 信息中的 tableId 對(duì)應(yīng)。 |
xCellSize | int | 表格中橫坐標(biāo)單元格的數(shù)量。 |
yCellSize | int | 表格中縱坐標(biāo)單元格的數(shù)量。 |
cellInfos | list | 單元格信息。 |
單元格信息(cellInfos 字段)
字段 | 類型 | 說明 |
---|---|---|
tableCellId | int | 表格中單元格 id,和 prism_wordsInfo 信息中的 tableCellId 對(duì)應(yīng)。 |
word | string | 單元格中的文字。 |
xsc | int | xStartCell 縮寫,表示橫軸方向該單元格起始在第幾個(gè)單元格,第一個(gè)單元格值為 0。 |
xec | int | xEndCell 縮寫,表示橫軸方向該單元格結(jié)束在第幾個(gè)單元格,第一個(gè)單元格值為 0,如果 xsc 和 xec 都為 0 說明該文字在橫軸方向占據(jù)了一個(gè)單元格并且在第一個(gè)單元格內(nèi)。 |
ysc | int | yStartCell 縮寫,表示縱軸方向該單元格起始在第幾個(gè)單元格,第一個(gè)單元格值為 0。 |
yec | int | yEndCell 縮寫,表示縱軸方向該單元格結(jié)束在第幾個(gè)單元格,第一個(gè)單元格值為 0。 |
pos | list | 單元格位置,按照單元格四個(gè)角的坐標(biāo)順時(shí)針排列,分別為左上 XY 坐標(biāo)、右上 XY 坐標(biāo)、右下 XY 坐標(biāo)、左下 XY 坐標(biāo)。 |
示例
正常返回示例
JSON
格式
{
"RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
"Data": "{\"content\":\"2:1.*5RI, 99034n&; 2.4079#17; 3.48MM; 4.AMF*E9P7EExg條. 0 O Denr_Ms Jenkins, Im_Li Hun ya_student_of your_English_c loss. Im_writing_tn_ask_for yow r help.The_ sumer Vacation_ _is_.coming.And_I_woud_like.to sply for a port-time_ _jo) _at a for i en com zany. in_ my a ity. I_hoe just_completed_my_ayp lic n tion_ ptter on d__ yes ume.How eyer, I/m_not_sure that_the len guo ge_and_fo mot_ore_right.I_know_you hae a_very pusy schedule, put_Id_be very grn te ful_if you_could_take_ s0me time_to 90_ though_them_and_ make necce55ary_chong es looking for word_to youre orly_reply.And I'd_e_re olly_t honk ful. You Ys- Li huo. 6121at1#x \",\"height\":2340,\"orgHeight\":2340,\"orgWidth\":1654,\"prism_version\":\"1.0.9\",\"prism_wnum\":32,\"prism_wordsInfo\":[{\"angle\":-89,\"direction\":0,\"height\":960,\"pos\":[{\"x\":475,\"y\":225},{\"x\":1434,\"y\":225},{\"x\":1434,\"y\":260},{\"x\":475,\"y\":260}],\"prob\":67,\"width\":34,\"word\":\"2:1.*5RI, 99034n&; 2.4079#17; 3.48MM; 4.AMF*E9P7EExg條.\",\"x\":937,\"y\":-237}],\"width\":1654}",
"Code": "200",
"Message": "message"
}
錯(cuò)誤碼
訪問錯(cuò)誤中心查看更多錯(cuò)誤碼。
變更歷史
變更時(shí)間 | 變更內(nèi)容概要 | 操作 |
---|---|---|
2021-08-17 | OpenAPI 入?yún)l(fā)生變更 | 查看變更詳情 |