支持K12全學(xué)科掃描場景的整頁內(nèi)容文字識別。接口支持印刷體文本及公式的OCR識別和坐標(biāo)返回,此外,接口還可對題目中的配圖位置進(jìn)行檢測并返回坐標(biāo)位置。
接口說明
本接口適用場景
- 阿里云整頁試卷識別,是阿里云官方自研 OCR 文字識別產(chǎn)品,適用于對練習(xí)冊、教輔、教材等內(nèi)容進(jìn)行整頁識別與題目檢索場景。
- 阿里云 OCR 產(chǎn)品基于阿里巴巴達(dá)摩院強(qiáng)大的 AI 技術(shù)及海量數(shù)據(jù),歷經(jīng)多年沉淀打磨,具有服務(wù)穩(wěn)定、操作簡易、實時性高、能力全面等幾大優(yōu)勢。
- 本接口圖片示例
本接口核心能力
分類 | 概述 |
---|---|
圖像增強(qiáng) | 默認(rèn)支持圖像增強(qiáng),包括圖像自動旋轉(zhuǎn)、畸變自動矯正、模糊圖片自動增強(qiáng)等能力。 |
多類型覆蓋 | 支持模糊、光照不均、透視畸變、任意背景等低質(zhì)量圖像識別。 |
高精度識別 | 總體識別準(zhǔn)確率可達(dá) 97%。 |
如何使用本接口
步驟 | 概述 |
---|---|
1 | 開通 教育場景識別 服務(wù)。開通服務(wù)前后,您可以通過體驗館免費(fèi)體驗本功能識別效果。 |
2 | 購買教育場景識別資源包。本 API 會贈送免費(fèi)額度,可使用免費(fèi)額度測試。 |
3 | 可以參照調(diào)試頁面提供的代碼示例完成 API 接入開發(fā)。接入完成后,調(diào)用 API 獲取識別結(jié)果。如果使用子賬號調(diào)用接口,需要阿里云賬號(主賬號)對 RAM 賬號進(jìn)行授權(quán)。創(chuàng)建 RAM 用戶的具體操作,請參考:創(chuàng)建 RAM 用戶。文字識別服務(wù)提供一種系統(tǒng)授權(quán)策略,即 AliyunOCRFullAccess。具體授權(quán)操作,請參見在用戶頁面為 RAM 用戶授權(quán)。 |
重要提示
類型 | 概述 |
---|---|
圖片格式 |
|
圖片尺寸 |
|
圖片大小 |
|
其他提示 |
|
調(diào)試
您可以在OpenAPI Explorer中直接運(yùn)行該接口,免去您計算簽名的困擾。運(yùn)行成功后,OpenAPI Explorer可以自動生成SDK代碼示例。
授權(quán)信息
下表是API對應(yīng)的授權(quán)信息,可以在RAM權(quán)限策略語句的Action
元素中使用,用來給RAM用戶或RAM角色授予調(diào)用此API的權(quán)限。具體說明如下:
- 操作:是指具體的權(quán)限點(diǎn)。
- 訪問級別:是指每個操作的訪問級別,取值為寫入(Write)、讀取(Read)或列出(List)。
- 資源類型:是指操作中支持授權(quán)的資源類型。具體說明如下:
- 對于必選的資源類型,用背景高亮的方式表示。
- 對于不支持資源級授權(quán)的操作,用
全部資源
表示。
- 條件關(guān)鍵字:是指云產(chǎn)品自身定義的條件關(guān)鍵字。
- 關(guān)聯(lián)操作:是指成功執(zhí)行操作所需要的其他權(quán)限。操作者必須同時具備關(guān)聯(lián)操作的權(quán)限,操作才能成功。
操作 | 訪問級別 | 資源類型 | 條件關(guān)鍵字 | 關(guān)聯(lián)操作 |
---|---|---|---|---|
ocr:RecognizeEduPaperOcr | *全部資源 * |
| 無 |
請求參數(shù)
名稱 | 類型 | 必填 | 描述 | 示例值 |
---|---|---|---|---|
Url | string | 否 |
| https://img.alicdn.com/tfs/TB1Wo7eXAvoK1RjSZFDXXXY3pXa-2512-3509.jpg |
body | byte | 否 |
| 圖片二進(jìn)制文件 |
ImageType | string | 是 |
| scan:掃描圖, photo:實拍圖 |
Subject | string | 否 |
| default:默認(rèn), Math:數(shù)學(xué), PrimarySchool_Math:小學(xué)數(shù)學(xué), JHighSchool_Math: 初中數(shù)學(xué), Chinese:語文, PrimarySchool_Chinese:小學(xué)語文, JHighSchool_Chinese:初中語文, English:英語, PrimarySchool_English:小學(xué)英語, JHighSchool_English:初中英語, Physics:物理, JHighSchool_Physics:初中物理, Chemistry: 化學(xué), JHighSchool_Chemistry:初中化學(xué), Biology:生物, JHighSchool_Biology:初中生物, History:歷史, JHighSchool_History:初中歷史, Geography:地理, JHighSchool_Geography:初中地理, Politics:政治, JHighSchool_Politics:初中政治 |
OutputOricoord | boolean | 否 |
| false |
返回參數(shù)
返回參數(shù)說明
字段 | 類型 | 說明 |
---|---|---|
angle | int | 圖片的角度。0 表示正向,90 表示圖片朝右,180 朝下,270 朝左。 |
content | string | 識別出圖片的文字塊匯總,可能包含 latex 公式,需要自行解析還原。 |
figure | list | 圖片中的圖案信息。 |
prism_wordsInfo | list | 文字塊信息。 |
prism_wnum | int | 識別的文字塊的數(shù)量,prism_wordsInfo 數(shù)組的大小。 |
height | int | 算法矯正圖片后的高度。 |
width | int | 算法矯正圖片后的寬度。 |
orgHeight | int | 原圖的高度。 |
orgWidth | int | 原圖的寬度。 |
文字塊信息(prism_wordsInfo 字段)
字段 | 類型 | 說明 |
---|---|---|
angle | int | 文字塊的角度。 |
height | int | 文字塊的高度(需考慮文字塊的角度) |
width | int | 文字塊的寬度(需考慮文字塊的角度) |
pos | list | 文字塊的外矩形四個點(diǎn)的坐標(biāo)按順時針排列(左上、右上、右下、左下)。當(dāng) NeedRotate=true 時,如果最外層的 angle 不為 0,需要按照 angle 矯正圖片后,坐標(biāo)才準(zhǔn)確。 |
word | string | 文字塊的文字內(nèi)容。 |
charInfo | list | 單字信息。 |
單字信息(charInfo 字段)
字段 | 類型 | 說明 |
---|---|---|
word | string | 單字文字。 |
prob | int | 置信度。 |
recClassify | int | 文字屬性分類。(0:中文印刷,1:拉丁語種,2:手寫體,3:韓語,4:泰文,5:公式) |
x | int | 單字左上角橫坐標(biāo)。 |
y | int | 單字左上角縱坐標(biāo)。 |
w | int | 單字寬度。 |
h | int | 單字高度。 |
圖案位置信息(figure 字段)
字段 | 類型 | 說明 |
---|---|---|
type | string | 圖案類型。 |
x | int | 圖案左上角橫坐標(biāo)。 |
y | int | 圖案左上角縱坐標(biāo)。 |
w | int | 圖案寬度。 |
h | int | 圖案高度。 |
box | object | 圖案坐標(biāo)信息:中心橫縱坐標(biāo),長寬,順時針旋轉(zhuǎn)角度。定義同 OpenCV 中 RotatedRect,請參見 OpenCV 文檔。 |
points | list | 圖案四個點(diǎn)坐標(biāo)(左上、右上、右下、左下)。 |
示例
正常返回示例
JSON
格式
{
"RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
"Data": "{\"content\":\"√技能提升練 √拓展創(chuàng)新練 12.對于同一平面內(nèi)的三條直線,給出下列5個論斷: 15.「2018春·如皋期末]在一個\",\"figure\":[{\"type\":\"subject_pattern\",\"x\":1605,\"y\":3087,\"w\":645,\"h\":804,\"box\":{\"x\":0,\"y\":0,\"w\":0,\"h\":0,\"angle\":0},\"points\":[{\"x\":1605,\"y\":3087},{\"x\":2250,\"y\":3087},{\"x\":2250,\"y\":3891},{\"x\":1605,\"y\":3891}]}],\"height\":7000,\"orgHeight\":7000,\"orgWidth\":4716,\"prism_version\":\"1.0.9\",\"prism_wnum\":64,\"prism_wordsInfo\":[{\"angle\":0,\"direction\":0,\"height\":85,\"pos\":[{\"x\":207,\"y\":508},{\"x\":826,\"y\":506},{\"x\":826,\"y\":592},{\"x\":208,\"y\":594}],\"prob\":96,\"recClassify\":0,\"width\":618,\"word\":\"√技能提升練\",\"x\":207,\"y\":506}],\"width\":4716}",
"Code": "200",
"Message": "message"
}
錯誤碼
訪問錯誤中心查看更多錯誤碼。
變更歷史
變更時間 | 變更內(nèi)容概要 | 操作 |
---|---|---|
2021-08-17 | OpenAPI 入?yún)l(fā)生變更 | 查看變更詳情 |