可對題目進行有效識別。通過對題目的元素進行打標,提升題目的識別效果。
接口說明
本接口適用場景
- 阿里云題目識別,是阿里云官方自研 OCR 文字識別產品,適用于掃描、拍照場景的單題題目識別,適用于智能批改等場景的題目內容識別。
- 阿里云 OCR 產品基于阿里巴巴達摩院強大的 AI 技術及海量數據,歷經多年沉淀打磨,具有服務穩定、操作簡易、實時性高、能力全面等幾大優勢。
- 本接口圖片示例
本接口核心能力
分類 | 概述 |
---|---|
多文本格式 | 支持印刷體文本以及公式的 OCR 識別。 |
圖像增強 | 默認支持圖像增強,包括圖像自動旋轉、畸變自動矯正、模糊圖片自動增強等能力。 |
多類型覆蓋 | 支持模糊、光照不均、透視畸變、任意背景等低質量圖像識別。 |
返回坐標 | 可實現對題目中的配圖位置進行檢測并返回坐標位置。 |
如何使用本接口
步驟 | 概述 |
---|---|
1 | 開通 教育場景識別 服務。開通服務前后,您可以通過體驗館免費體驗本功能識別效果。 |
2 | 購買題目識別資源包。本 API 會贈送免費額度,可使用免費額度測試。 |
3 | 可以參照調試頁面提供的代碼示例完成 API 接入開發。接入完成后,調用 API 獲取識別結果。如果使用子賬號調用接口,需要阿里云賬號(主賬號)對 RAM 賬號進行授權。創建 RAM 用戶的具體操作,請參考:創建 RAM 用戶。文字識別服務提供一種系統授權策略,即 AliyunOCRFullAccess。具體授權操作,請參見在用戶頁面為 RAM 用戶授權。 |
重要提示
類型 | 概述 |
---|---|
圖片格式 |
|
圖片尺寸 |
|
圖片大小 |
|
其他提示 |
|
調試
您可以在OpenAPI Explorer中直接運行該接口,免去您計算簽名的困擾。運行成功后,OpenAPI Explorer可以自動生成SDK代碼示例。
授權信息
下表是API對應的授權信息,可以在RAM權限策略語句的Action
元素中使用,用來給RAM用戶或RAM角色授予調用此API的權限。具體說明如下:
- 操作:是指具體的權限點。
- 訪問級別:是指每個操作的訪問級別,取值為寫入(Write)、讀取(Read)或列出(List)。
- 資源類型:是指操作中支持授權的資源類型。具體說明如下:
- 對于必選的資源類型,用背景高亮的方式表示。
- 對于不支持資源級授權的操作,用
全部資源
表示。
- 條件關鍵字:是指云產品自身定義的條件關鍵字。
- 關聯操作:是指成功執行操作所需要的其他權限。操作者必須同時具備關聯操作的權限,操作才能成功。
操作 | 訪問級別 | 資源類型 | 條件關鍵字 | 關聯操作 |
---|---|---|---|---|
ocr:RecognizeEduQuestionOcr | *全部資源 * |
| 無 |
請求參數
名稱 | 類型 | 必填 | 描述 | 示例值 |
---|---|---|---|---|
Url | string | 否 |
| https://img.alicdn.com/tfs/TB1Wo7eXAvoK1RjSZFDXXXY3pXa-2512-3509.jpg |
body | byte | 否 |
| 圖片二進制文件 |
NeedRotate | boolean | 否 |
| false |
返回參數
返回參數說明
字段 | 類型 | 說明 |
---|---|---|
content | string | 識別出圖片的文字塊匯總。 |
figure | list | 圖片中的圖案信息。 |
prism_wordsInfo | list | 文字塊信息。 |
prism_wnum | int | 識別的文字塊的數量,prism_wordsInfo 數組的大小。 |
height | int | 算法矯正圖片后的高度。 |
width | int | 算法矯正圖片后的寬度。 |
orgHeight | int | 原圖的高度。 |
orgWidth | int | 原圖的寬度。 |
文字塊信息(prism_wordsInfo 字段)
字段 | 類型 | 說明 |
---|---|---|
angle | int | 文字塊的角度。 |
height | int | 文字塊的高度(需考慮文字塊的角度) |
width | int | 文字塊的寬度(需考慮文字塊的角度) |
pos | list | 文字塊的外矩形四個點的坐標按順時針排列(左上、右上、右下、左下)。 |
word | string | 文字塊的文字內容。 |
charInfo | list | 單字信息。 |
recClassify | int | 文字屬性分類。(0:“中文印刷”,1:“拉丁語種”,2:“手寫體”,3:“韓語”,4:“泰文”,51:“公式”)。 |
單字信息(charInfo 字段)
字段 | 類型 | 說明 |
---|---|---|
word | string | 單字文字。 |
prob | int | 置信度。 |
x | int | 單字左上角橫坐標。 |
y | int | 單字左上角縱坐標。 |
w | int | 單字寬度。 |
h | int | 單字高度。 |
圖案位置信息(figure 字段)
字段 | 類型 | 說明 |
---|---|---|
type | string | 圖案類型。 |
x | int | 圖案左上角橫坐標。 |
y | int | 圖案左上角縱坐標。 |
w | int | 圖案寬度。 |
h | int | 圖案高度。 |
box | object | 圖案坐標信息:中心橫縱坐標,長寬,順時針旋轉角度。定義同 OpenCV 中 RotatedRect,請參見 OpenCV 文檔。 |
points | list | 圖案四個點坐標(左上、右上、右下、左下)。 |
示例
正常返回示例
JSON
格式
{
"RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
"Data": "{\n \"content\": \"√技能提升練 √拓展創新練 12.對于同一平面內的三條直線,給出下列5個論斷:15.「2018春·如皋期末]在一個三角形中,如果一個角 ①a//b;②b∥c;③a⊥b;④a∥c;⑤a⊥c ,以其中兩是另一個角的3倍,這樣的三角形我們稱之為“智個論斷為條件,一個論斷為結論,組成一個你認為慧三角形”.如三個內角分別為 1 2 0 ^ { \\\\circ } , 4 0 ^ { \\\\circ } , 2 0 ^ { \\\\circ } 的三角正確的命題. 形是“智慧三角形”. 已知:,結論: 如圖 1 - 2 - 2 , \\\\angle M O N = 6 0 ^ { \\\\circ } , 在射線OM上找一點 13.指出命題“同旁內角互補”的條件和結論,并說明這 A,過點A作 AB⊥OM 交ON于點B,以A為端點個命題是正確的命題還是錯誤的命題. 作射線AD 交射線OB于點C(點C不與點O重合). M A B N 圖 1- -2一2 14.如圖 1-2-1, 點B,A,E在同一條直線上,已知①AD (1) ∠ABC 的度數為°, △AOB ∥BC,②∠B=∠C,③AD 平分 ∠EAC. 請你用其中兩(填“是”或“不是”)智慧三角形; 個作為條件,另一個作為結論,構造命題,并說明你構 (2)若 \\\\angle O A C = 2 0 ^ { \\\\circ } ,試說明::△AOC 為\"智慧三角形的命題是正確的命題還是錯誤的命題. 形”; E D B C 圖 1-2-1 (3)當 △ABC 為“智慧三角形”時,求 ∠OAC 的度數. 第1章三角形的初步知識A5 \",\n \"figure\": [\n {\n \"type\": \"subject_pattern\",\n \"x\": 1605,\n \"y\": 3087,\n \"w\": 645,\n \"h\": 804,\n \"box\": {\n \"x\": 0,\n \"y\": 0,\n \"w\": 0,\n \"h\": 0,\n \"angle\": 0\n },\n \"points\": [\n {\n \"x\": 1605,\n \"y\": 3087\n },\n {\n \"x\": 2250,\n \"y\": 3087\n },\n {\n \"x\": 2250,\n \"y\": 3891\n },\n {\n \"x\": 1605,\n \"y\": 3891\n }\n ]\n }\n ],\n \"height\": 7000,\n \"orgHeight\": 7000,\n \"orgWidth\": 4716,\n \"prism_version\": \"1.0.9\",\n \"prism_wnum\": 64,\n \"prism_wordsInfo\": [\n {\n \"angle\": 0,\n \"direction\": 0,\n \"height\": 85,\n \"pos\": [\n {\n \"x\": 207,\n \"y\": 508\n },\n {\n \"x\": 826,\n \"y\": 506\n },\n {\n \"x\": 826,\n \"y\": 592\n },\n {\n \"x\": 208,\n \"y\": 594\n }\n ],\n \"prob\": 96,\n \"recClassify\": 0,\n \"width\": 618,\n \"word\": \"√技能提升練\",\n \"x\": 207,\n \"y\": 506\n }\n ],\n \"width\": 4716\n}",
"Code": "200",
"Message": "message"
}
錯誤碼
訪問錯誤中心查看更多錯誤碼。
變更歷史
變更時間 | 變更內容概要 | 操作 |
---|---|---|
2021-08-17 | OpenAPI 入參發生變更 | 查看變更詳情 |