支持多學科教輔試卷的結構化識別,將整頁練習冊、試卷或教輔中的題目進行自動切題,并識別出其中的文字內容和坐標位置。
接口說明
本接口適用場景
- 阿里云精細版結構化切題,是阿里云官方自研 OCR 文字識別產品,適用于整頁練習冊、試卷或教輔種的題目場景。
- 阿里云 OCR 產品基于阿里巴巴達摩院強大的 AI 技術及海量數(shù)據(jù),歷經(jīng)多年沉淀打磨,具有服務穩(wěn)定、操作簡易、實時性高、能力全面等幾大優(yōu)勢。
- 本接口圖片示例
本接口核心能力
分類 | 概述 |
---|---|
智能識別 | 自動切題,并識別其中的全部字段和坐標位置。 |
圖像增強 | 默認支持圖像增強,包括圖像自動旋轉、畸變自動矯正、模糊圖片自動增強等能力。 |
多類型覆蓋 | 支持模糊、光照不均、透視畸變、任意背景等低質量圖像識別。 |
高精度識別 | 總體識別準確率可達 98%。 |
如何使用本接口
步驟 | 概述 |
---|---|
1 | 開通 教育場景識別 服務。開通服務前后,您可以通過體驗館免費體驗本功能識別效果。 |
2 | 購買精細版結構化切題資源包。本 API 會贈送免費額度,可使用免費額度測試。 |
3 | 可以參照調試頁面提供的代碼示例完成 API 接入開發(fā)。接入完成后,調用 API 獲取識別結果。如果使用子賬號調用接口,需要阿里云賬號(主賬號)對 RAM 賬號進行授權。創(chuàng)建 RAM 用戶的具體操作,請參考:創(chuàng)建 RAM 用戶。文字識別服務提供一種系統(tǒng)授權策略,即 AliyunOCRFullAccess。具體授權操作,請參見在用戶頁面為 RAM 用戶授權。 |
重要提示
類型 | 概述 |
---|---|
圖片格式 |
|
圖片尺寸 |
|
圖片大小 |
|
其他提示 |
|
調試
您可以在OpenAPI Explorer中直接運行該接口,免去您計算簽名的困擾。運行成功后,OpenAPI Explorer可以自動生成SDK代碼示例。
授權信息
下表是API對應的授權信息,可以在RAM權限策略語句的Action
元素中使用,用來給RAM用戶或RAM角色授予調用此API的權限。具體說明如下:
- 操作:是指具體的權限點。
- 訪問級別:是指每個操作的訪問級別,取值為寫入(Write)、讀取(Read)或列出(List)。
- 資源類型:是指操作中支持授權的資源類型。具體說明如下:
- 對于必選的資源類型,用背景高亮的方式表示。
- 對于不支持資源級授權的操作,用
全部資源
表示。
- 條件關鍵字:是指云產品自身定義的條件關鍵字。
- 關聯(lián)操作:是指成功執(zhí)行操作所需要的其他權限。操作者必須同時具備關聯(lián)操作的權限,操作才能成功。
操作 | 訪問級別 | 資源類型 | 條件關鍵字 | 關聯(lián)操作 |
---|---|---|---|---|
ocr:RecognizeEduPaperStructed | none | *全部資源 * |
| 無 |
請求參數(shù)
名稱 | 類型 | 必填 | 描述 | 示例值 |
---|---|---|---|---|
Url | string | 否 |
| https://example.png |
body | byte | 否 |
| 圖片二進制文件 |
Subject | string | 否 |
| default:默認, Math:數(shù)學, PrimarySchool_Math:小學數(shù)學, JHighSchool_Math: 初中數(shù)學, Chinese:語文, PrimarySchool_Chinese:小學語文, JHighSchool_Chinese:初中語文, English:英語, PrimarySchool_English:小學英語, JHighSchool_English:初中英語, Physics:物理, JHighSchool_Physics:初中物理, Chemistry: 化學, JHighSchool_Chemistry:初中化學, Biology:生物, JHighSchool_Biology:初中生物, History:歷史, JHighSchool_History:初中歷史, Geography:地理, JHighSchool_Geography:初中地理, Politics:政治, JHighSchool_Politics:初中政治 |
NeedRotate | boolean | 否 |
| false |
OutputOricoord | boolean | 否 |
| false |
返回參數(shù)
返回參數(shù)說明
字段 | 類型 | 說明 |
---|---|---|
doc_layout | list | 版面信息。 |
doc_sptext | list | 特殊文字信息。 |
figure | list | 圖案信息。 |
page_id | int | 頁碼。 |
page_title | string | 頁標題。 |
part_info | list | 題型大類信息。 |
height | int | 算法矯正圖片后的高度。 |
width | int | 算法矯正圖片后的寬度。 |
orgHeight | int | 原圖的高度。 |
orgWidth | int | 原圖的寬度。 |
題目列表信息(doc_layout 字段)
字段 | 類型 | 說明 |
---|---|---|
layout_type | string | 文字類型(text:普通文字,special_text:特殊文字,table:表格,head:頁眉,foot:頁腳,side_column:側欄)。 |
pos | list | 外矩形四個點的坐標按順時針排列(左上、右上、右下、左下)。 |
特殊文字信息(doc_sptext 字段)
字段 | 類型 | 說明 |
---|---|---|
layout_type | string | 文字類型(bold:黑體,complex:特殊體)。 |
pos | list | 外矩形四個點的坐標按順時針排列(左上、右上、右下、左下)。 |
圖案信息(figure 字段)
字段 | 類型 | 說明 |
---|---|---|
type | string | 配圖類型(subject_sline:分欄線,豎線;subject_bline:空格線/下劃線,豎線;subject_bracket:括號;subject_quad:田字格和四線三格;subject_table:表格;subject_pattern:圖案;subject_big_bracket:大括號;subject_match_question:連線題;subject_question:非材料題;subject_material:材料題)。 |
x | int | 圖案左上角橫坐標。 |
y | int | 圖案左上角縱坐標。 |
w | int | 圖案寬度。 |
h | int | 圖案高度。 |
box | object | 圖案坐標信息:中心橫縱坐標,長寬,順時針旋轉角度。定義同 OpenCV 中 RotatedRect,請參見 OpenCV 文檔。 |
points | list | 圖案四個點坐標(左上、右上、右下、左下)。 |
題型大類信息(part_info 字段)
字段 | 類型 | 說明 |
---|---|---|
part_title | string | 題型標題(例如選擇題,填空題,解答題)。 |
pos_list | list | 對應所有題型的外層大矩形的四個點的坐標數(shù)組。 |
subject_list | list | 題目列表。 |
題目列表信息(subject_list 字段)
字段 | 類型 | 說明 |
---|---|---|
index | int | 在 part_info 中的序號。 |
type | int | 題目類型(0:選擇題;1:填空題;2:閱讀理解(閱讀+問答選擇);3:完型填空(閱讀+選擇);4:閱讀填空(閱讀+填空);5:問答題;6:選擇題,多選多;7:填空、選擇題混合;8:應用題;9:判斷題;10:作圖題;11:材料題;12:計算題;13:連線題;14:作文題;15:解答題;16:其他;17:圖;18:表格)。 |
text | string | 整題文本信息,可能包含 latex 公式,需要自行解析還原。 |
prob | int | 置信度。 |
post_list | list | 整題外矩形四個點的坐標按順時針排列(左上、右上、右下、左下)。 |
element_list | list | 題目元素。 |
題目元素信息(element_list 字段)
字段 | 類型 | 說明 |
---|---|---|
type | int | 題目元素類型(0:題干;1:選項;2:解析;3:答案)。 |
text | string | 整題文本信息,可能包含 latex 公式,需要自行解析還原。 |
post_list | list | 外層大矩形的四個點的坐標數(shù)組。 |
content_list | list | 內容數(shù)組。 |
內容數(shù)組信息(content_list 字段)
字段 | 類型 | 說明 |
---|---|---|
type | int | 內容類型(0:圖片;1:文本;2:公式)。 |
string | string | 整題文本信息,可能包含 latex 公式,需要自行解析還原。 |
pos | list | 外層大矩形的四個點的坐標數(shù)組。 |
示例
正常返回示例
JSON
格式
{
"RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
"Data": "{\"figure\":[{\"type\":\"subject_bracket\",\"x\":1039,\"y\":2625,\"w\":124,\"h\":42,\"box\":{\"x\":0,\"y\":0,\"w\":0,\"h\":0,\"angle\":0},\"points\":[{\"x\":1039,\"y\":2625},{\"x\":1163,\"y\":2625},{\"x\":1163,\"y\":2667},{\"x\":1039,\"y\":2667}]}],\"height\":3442,\"orgHeight\":3442,\"orgWidth\":2377,\"page_id\":7,\"page_title\":\"\",\"part_info\":[{\"part_title\":\"選擇題\",\"pos_list\":[[{\"x\":245,\"y\":3260},{\"x\":2235,\"y\":3265},{\"x\":2235,\"y\":3353},{\"x\":245,\"y\":3352}]],\"subject_list\":[{\"index\":0,\"type\":0,\"prob\":0,\"text\":\"1.(疑難,★★☆)下列各組數(shù)據(jù)中,表示同一 時刻的是 ( ) A.前2s末、第2s末、第3s初 B.第1s末、第2s末、第3s末 C.前2s末、第2s末、前3s初 D.前2s初、第2s末、第3s初\",\"pos_list\":[[{\"x\":170,\"y\":417},{\"x\":1162,\"y\":416},{\"x\":1161,\"y\":757},{\"x\":170,\"y\":757}]],\"element_list\":[{\"type\":0,\"text\":\"1.(疑難,★★☆)下列各組數(shù)據(jù)中,表示同一 時刻的是 ( )\",\"pos_list\":[[{\"x\":170,\"y\":417},{\"x\":1162,\"y\":416},{\"x\":1161,\"y\":520},{\"x\":170,\"y\":518}]],\"content_list\":[{\"type\":1,\"prob\":0,\"string\":\"1.(疑難,★★☆)下列各組數(shù)據(jù)中,表示同一 時刻的是\",\"option\":\"\",\"pos\":[{\"x\":170,\"y\":417},{\"x\":1131,\"y\":416},{\"x\":1131,\"y\":453},{\"x\":170,\"y\":454}]},{\"type\":1,\"prob\":0,\"string\":\"( )\",\"option\":\"\",\"pos\":[{\"x\":1033,\"y\":481},{\"x\":1162,\"y\":483},{\"x\":1161,\"y\":520},{\"x\":1033,\"y\":518}]}]},{\"type\":1,\"text\":\"A.前2s末、第2s末、第3s初\",\"pos_list\":[[{\"x\":204,\"y\":541},{\"x\":746,\"y\":536},{\"x\":746,\"y\":572},{\"x\":204,\"y\":577}]],\"content_list\":[{\"type\":1,\"prob\":0,\"string\":\"A.前2s末、第2s末、第3s初\",\"option\":\"\",\"pos\":[{\"x\":204,\"y\":541},{\"x\":746,\"y\":536},{\"x\":746,\"y\":572},{\"x\":204,\"y\":577}]}]},{\"type\":1,\"text\":\"B.第1s末、第2s末、第3s末\",\"pos_list\":[[{\"x\":205,\"y\":601},{\"x\":742,\"y\":596},{\"x\":743,\"y\":632},{\"x\":205,\"y\":637}]],\"content_list\":[{\"type\":1,\"prob\":0,\"string\":\"B.第1s末、第2s末、第3s末\",\"option\":\"\",\"pos\":[{\"x\":205,\"y\":601},{\"x\":742,\"y\":596},{\"x\":743,\"y\":632},{\"x\":205,\"y\":637}]}]},{\"type\":1,\"text\":\"C.前2s末、第2s末、前3s初\",\"pos_list\":[[{\"x\":205,\"y\":660},{\"x\":743,\"y\":660},{\"x\":743,\"y\":696},{\"x\":205,\"y\":696}]],\"content_list\":[{\"type\":1,\"prob\":0,\"string\":\"C.前2s末、第2s末、前3s初\",\"option\":\"\",\"pos\":[{\"x\":205,\"y\":660},{\"x\":743,\"y\":660},{\"x\":743,\"y\":696},{\"x\":205,\"y\":696}]}]},{\"type\":1,\"text\":\"D.前2s初、第2s末、第3s初\",\"pos_list\":[[{\"x\":205,\"y\":721},{\"x\":746,\"y\":721},{\"x\":746,\"y\":757},{\"x\":205,\"y\":757}]],\"content_list\":[{\"type\":1,\"prob\":0,\"string\":\"D.前2s初、第2s末、第3s初\",\"option\":\"\",\"pos\":[{\"x\":205,\"y\":721},{\"x\":746,\"y\":721},{\"x\":746,\"y\":757},{\"x\":205,\"y\":757}]}]}]}]}],\"prism_version\":\"1.0.9\",\"prism_wnum\":0,\"prism_wordsInfo\":[],\"width\":2377}",
"Code": "200",
"Message": "message"
}
錯誤碼
訪問錯誤中心查看更多錯誤碼。
變更歷史
變更時間 | 變更內容概要 | 操作 |
---|---|---|
2021-08-17 | OpenAPI 入?yún)l(fā)生變更 | 查看變更詳情 |