對文檔信息進行結構化識別,并提供元素平鋪和層級樹兩種視角的版面信息輸出。能夠將文檔中的文字元素(單字、文字塊、行等)和相應的版面格式(標題、段落、表格)抽離并按順序輸出。
調試
您可以在OpenAPI Explorer中直接運行該接口,免去您計算簽名的困擾。運行成功后,OpenAPI Explorer可以自動生成SDK代碼示例。
授權信息
下表是API對應的授權信息,可以在RAM權限策略語句的Action
元素中使用,用來給RAM用戶或RAM角色授予調用此API的權限。具體說明如下:
- 操作:是指具體的權限點。
- 訪問級別:是指每個操作的訪問級別,取值為寫入(Write)、讀取(Read)或列出(List)。
- 資源類型:是指操作中支持授權的資源類型。具體說明如下:
- 對于必選的資源類型,用背景高亮的方式表示。
- 對于不支持資源級授權的操作,用
全部資源
表示。
- 條件關鍵字:是指云產品自身定義的條件關鍵字。
- 關聯操作:是指成功執行操作所需要的其他權限。操作者必須同時具備關聯操作的權限,操作才能成功。
操作 | 訪問級別 | 資源類型 | 條件關鍵字 | 關聯操作 |
---|---|---|---|---|
ocr:RecognizeDocumentStructure | *全部資源 * |
| 無 |
請求參數
名稱 | 類型 | 必填 | 描述 | 示例值 |
---|---|---|---|---|
Url | string | 否 | 圖片鏈接(長度不超 2048 字節,不支持 base64)。 | https://img.alicdn.com/imgextra/i4/O1CN01amMFBF1GUki3NHNzI_!!6000000000626-2-tps-978-1346.png |
body | byte | 否 | 圖片二進制文件,最大 10MB,與 URL 二選一。 使用 HTTP 方式調用,把圖片二進制文件放到 HTTP body 中上傳即可。 使用 SDK 的方式調用,把圖片放到 SDK 的 body 中即可。 | 圖片二進制文件 |
NeedRotate | boolean | 否 | 是否需要自動旋轉功能,返回角度信息。默認不需要。true:需要 false:不需要。 | false |
OutputCharInfo | boolean | 否 | 是否輸出單字識別結果,默認不需要。true:需要 false:不需要。 當 UseNewStyleOutput=true 時,此參數不生效。 | false |
OutputTable | boolean | 否 | 是否輸出表格識別結果,包含單元格信息。默認不需要。true:需要 false:不需要。 | false |
NeedSortPage | boolean | 否 | 是否按順序輸出文字塊,默認不需要。true:需要 false:不需要。false 表示從左往右,從上到下的順序;true 表示從上到下,從左往右的順序。 當 UseNewStyleOutput=true 時,此參數不生效。 | false |
Page | boolean | 否 | 是否需要分頁功能,默認不需要。 true:需要 false:不需要。 當 UseNewStyleOutput=true 時,此參數不生效。 | false |
NoStamp | boolean | 否 | 是否需要去除印章功能,默認不需要。true:需要 false:不需要 | false |
Paragraph | boolean | 否 | 是否需要分段功能,默認不需要。true:需要 false:不需要。 當 UseNewStyleOutput=true 時,此參數不生效。 | false |
Row | boolean | 否 | 是否需要成行返回功能,默認不需要。true:需要 false:不需要。 當 UseNewStyleOutput=true 時,此參數不生效。 | false |
UseNewStyleOutput | boolean | 否 | 是否返回新版格式輸出,默認為 false | false |
支持的圖片格式
- PNG、JPG、JPEG、BMP、GIF、TIFF、WebP
- PDF 文件格式的文檔結構化解析請點擊文檔智能解析快速了解
返回參數
返回字段補充說明
第一種返回格式(UseNewStyleOutput=false)
angle 圖片的角度,當 NeedRotate 為 true 時才會返回,0 表示正向,90 表示圖片朝右,180 朝下,270 朝左
content 識別出圖片的文字塊匯總
height 算法矯正圖片后的高度
width 算法矯正圖片后的寬度
orgHeight 原圖的高度
orgWidth 原圖的寬度
prism_wnum 識別的文字塊的數量,prism_wordsInfo 數組的大小
--------------------------prism-wordsInfo 文字塊數組內的字段說明--------------------------
angle 文字塊的角度,這個角度只影響 width 和 height,當角度為-90、90、-270、270,width 和 height 的值需要自行互換
height 文字塊的高度
width 文字塊的寬度
pos 文字塊的外矩形四個點的坐標按順時針排列,左上、右上、右下、左下
word 文字塊內容
tableId 當 OutputTable 為 true 并且該文字塊在表格內則存在該字段,tableId 表示表格的 id
tableCellId 當 OutputTable 為 true 并且該文字塊在表格內則存在該字段,表示表格中單元格的 id
paragraphId 當 Paragraph 為 true 返回該字段,表示段落 id
-----------------------------------------charInfo 單字信息-------------------------------------------
word 單字文字
prob 置信度
x 單字左上角橫坐標
y 單字左上角縱坐標
w 單字寬度
h 單字高度
-----------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------
----------------------------prism-tablesInfo 表格數組內的字段說明---------------------------
tableId 表格 id,和 prism_wordsInfo 信息中的 tableId 對應
xCellSize 表格中橫坐標單元格的數量
yCellSize 表格中縱坐標單元格的數量
-------------cellInfos 單元格信息,包含單元格在整個表格中的空間拓撲關系-----------
tableCellId 表格中單元格 id,和 prism_wordsInfo 信息中的 tableCellId 對應
word 單元格中的文字
xsc xStartCell 縮寫,表示橫軸方向該單元格起始在第幾個單元格,第一個單元格值為 0
xec xEndCell 縮寫,表示橫軸方向該單元格結束在第幾個單元格,第一個單元格值為 0,如果 xsc 和 xec 都為 0 說明該文字在橫軸方向占據了一個單元格并且在第一個單元格內
ysc yStartCell 縮寫,表示縱軸方向該單元格起始在第幾個單元格,第一個單元格值為 0
yec yEndCell 縮寫,表示縱軸方向該單元格結束在第幾個單元格,第一個單元格值為 0
pos 單元格位置,按照單元格四個角的坐標順時針排列,分別為左上 XY 坐標、右上 XY 坐標、右下 XY 坐標、左下 XY 坐標
------------------------------------------------------------------------------------
第二種返回格式(UseNewStyleOutput=true)
docInfo 文檔信息
layouts 版面信息列表
version doc-json 版本信息
----------------------------------------docInfo 中的字段----------------------------------------
pages 文檔頁面列表
imageWidth 頁面轉圖后的寬
imageHeight 頁面轉圖后的高
pageIdAllDocs 頁面在所有文檔的頁索引
pageIdCurDoc 頁面在當前文檔的頁索引
----------------------------------------layouts 中的字段----------------------------------------
alignment 間距枚舉(LEFT、CENTER、RIGHT、BOTH)
blocks 字塊信息列表
text 文本內容
firstLinesChars 文字首行縮進
index 版面閱讀順序
lineHeight 行平均高度
pageNum 單元格所在頁數
pos 文字塊的外矩形四個點的坐標按順時針排列,左上、右上、右下、左下
type 版面類型(title:標題、table:表格、table_name:表格名、table_note:表注、multicolumn:多欄文字、formula:公式、contents_title:目錄標題、contents:目錄主體、text:普通文字、figure:圖表、foot:頁腳、head:頁眉、side:側欄)
uniqueId 版面信息唯一 id
numCol 表格總列數
numRow 表格總行數
cells 單元格信息
示例
正常返回示例
JSON
格式
{
"RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
"Data": "{\"algo_version\": \"\", \"angle\": 0, \"content\": \"1.1技術方案設計貴公司進行防磨噴涂的鍋爐均為循環流化床鍋爐,作為一種新型燃燒技術,由于爐型結構和設計參數等特點,在環保性能、燃燒效率、燃料適應性、高效脫硫及灰渣綜合利用等方法,具有很大的優越性。然而, CFB鍋爐受熱面的磨損問題十分嚴重,貴公司決定采用超音速電弧金屬噴涂技術來解決鍋爐受熱面磨損問題,以減少鍋爐的非計劃停運。我公司技術服務組根據全國各電廠的防磨防護情況,針對鍋爐運行的詳細狀況、工藝參數以及失效因素,并依據我公司多年來從事該行業的寶貴工程經驗,經我公司技術服務組專業人員的認真分析研究,并對上述部位的防護1問題分析:鍋爐衛燃帶,爐膛出口處,焊縫處的磨損、減薄與氣流中固體物料濃度、煙氣速度、顆粒的特性硬度和流道幾何形狀等密切相關,而在CFB鍋爐中,固體物料的濃度巨大,通常可達煤粉爐的幾十倍到上百倍,并且煙氣流速大,顆粒硬且棱角尖銳,因而在高速煙氣的帶動下,對CFB 鍋爐水冷壁等受熱面部位的沖刷磨損極為嚴重;尤其在護墻根部水冷壁部位,由于位處密相區邊緣區,不但受到嚴重的高速高濃度含床料、燃料氣流的強烈沖刷、磨損,而且存在嚴重的渦流效應、切割效應和離心作用。渦流效應在爐膛四角部位,由于該處形成邊壁流,物料匯集此處較多,由于固體顆粒的慣性作用,局部磨損作用尤為明顯,而切割效應體現在護墻根部水冷壁處,其原因是由于防護墻的頂部提供了一個平臺,當焦渣以較高的速度下降到該平臺時產生反彈,其中往水冷壁管側反彈部分,對水冷壁管就產生了嚴重的切割效應,離心作用是由于顆粒運行時受到煙氣離心作用而引起。其次還易受到高溫氧化和硫酸鹽及硫、硫化物的熱腐蝕。水冷壁管具備了高溫氧化和高溫腐蝕條件,其煙氣溫度高,且是富氧燃燒,實踐證明, 在300℃以上,管外表溫度每升高50℃, 腐蝕速度增加1倍。鍋爐在運行過程中受熱面管表面首先發生高溫氧化,表面生成Fe20s, 其次燃料灰中的Na20和K20與煙氣中的SOs化合生成硫酸鹽,其捕捉飛灰形成結渣和流渣,此時煙氣中SOs與M2S04同管壁上的Fe20s反應生成復合硫酸鹽MFe (S04) 2或MaFe (S04)3,此復合硫酸鹽受高溫又分解為疏松狀氧化鐵和硫酸鹽沉積層,易被飛灰氣流沖蝕帶走,氧化腐蝕繼續向管壁縱深進行;另外燃料中硫份,經燃燒生成的S和HeS也對管壁會產生強烈的腐蝕,與Fe反應生成FeS。\", \"figure\": [], \"height\": 1128, \"orgHeight\": 1128, \"orgWidth\": 912, \"prism_pagesInfo\": [{\"pageId\": 0, \"word\": \"1.1技術方案設計貴公司進行防磨噴涂的鍋爐均為循環流化床鍋爐,作為一種新型燃燒技術,由于爐型結構和設計參數等特點,在環保性能、燃燒效率、燃料適應性、高效脫硫及灰渣綜合利用等方法,具有很大的優越性。然而, CFB鍋爐受熱面的磨損問題十分嚴重,貴公司決定采用超音速電弧金屬噴涂技術來解決鍋爐受熱面磨損問題,以減少鍋爐的非計劃停運。我公司技術服務組根據全國各電廠的防磨防護情況,針對鍋爐運行的詳細狀況、工藝參數以及失效因素,并依據我公司多年來從事該行業的寶貴工程經驗,經我公司技術服務組專業人員的認真分析研究,并對上述部位的防護1問題分析:鍋爐衛燃帶,爐膛出口處,焊縫處的磨損、減薄與氣流中固體物料濃度、煙氣速度、顆粒的特性硬度和流道幾何形狀等密切相關,而在CFB鍋爐中,固體物料的濃度巨大,通常可達煤粉爐的幾十倍到上百倍,并且煙氣流速大,顆粒硬且棱角尖銳,因而在高速煙氣的帶動下,對CFB 鍋爐水冷壁等受熱面部位的沖刷磨損極為嚴重;尤其在護墻根部水冷壁部位,由于位處密相區邊緣區,不但受到嚴重的高速高濃度含床料、燃料氣流的強烈沖刷、磨損,而且存在嚴重的渦流效應、切割效應和離心作用。渦流效應在爐膛四角部位,由于該處形成邊壁流,物料匯集此處較多,由于固體顆粒的慣性作用,局部磨損作用尤為明顯,而切割效應體現在護墻根部水冷壁處,其原因是由于防護墻的頂部提供了一個平臺,當焦渣以較高的速度下降到該平臺時產生反彈,其中往水冷壁管側反彈部分,對水冷壁管就產生了嚴重的切割效應,離心作用是由于顆粒運行時受到煙氣離心作用而引起。其次還易受到高溫氧化和硫酸鹽及硫、硫化物的熱腐蝕。水冷壁管具備了高溫氧化和高溫腐蝕條件,其煙氣溫度高,且是富氧燃燒,實踐證明, 在300℃以上,管外表溫度每升高50℃, 腐蝕速度增加1倍。鍋爐在運行過程中受熱面管表面首先發生高溫氧化,表面生成Fe20s, 其次燃料灰中的Na20和K20與煙氣中的SOs化合生成硫酸鹽,其捕捉飛灰形成結渣和流渣,此時煙氣中SOs與M2S04同管壁上的Fe20s反應生成復合硫酸鹽MFe (S04) 2或MaFe (S04)3,此復合硫酸鹽受高溫又分解為疏松狀氧化鐵和硫酸鹽沉積層,易被飛灰氣流沖蝕帶走,氧化腐蝕繼續向管壁縱深進行;另外燃料中硫份,經燃燒生成的S和HeS也對管壁會產生強烈的腐蝕,與Fe反應生成FeS。\"}], \"prism_paragraphsInfo\": [{\"paragraphId\": 0, \"word\": \"1.1技術方案設計\"}, {\"paragraphId\": 1, \"word\": \"貴公司進行防磨噴涂的鍋爐均為循環流化床鍋爐,作為一種新型燃燒技術,由于爐型結構和設計參數等特點,在環保性能、燃燒效率、燃料適應性、高效脫硫及灰渣綜合利用等方法,具有很大的優越性。然而, CFB鍋爐受熱面的磨損問題十分嚴重,貴公司決定采用超音速電弧金屬噴涂技術來解決鍋爐受熱面磨損問題,以減少鍋爐的非計劃停運。我公司技術服務組根據全國各電廠的防磨防護情況,針對鍋爐運行的詳細狀況、工藝參數以及失效因素,并依據我公司多年來從事該行業的寶貴工程經驗,經我公司技術服務組專業人員的認真分析研究,并對上述部位的防護\"}, {\"paragraphId\": 2, \"word\": \"1問題分析:\"}, {\"paragraphId\": 3, \"word\": \"鍋爐衛燃帶,爐膛出口處,焊縫處的磨損、減薄與氣流中固體物料濃度、煙氣速度、顆粒的特性硬度和流道幾何形狀等密切相關,而在CFB鍋爐中,固體物料的濃度巨大,通常可達煤粉爐的幾十倍到上百倍,并且煙氣流速大,顆粒硬且棱角尖銳,因而在高速煙氣的帶動下,對CFB 鍋爐水冷壁等受熱面部位的沖刷磨損極為嚴重;尤其在護墻根部水冷壁部位,由于位處密相區邊緣區,不但受到嚴重的高速高濃度含床料、燃料氣流的強烈沖刷、磨損,而且存在嚴重的渦流效應、切割效應和離心作用。渦流效應在爐膛四角部位,由于該處形成邊壁流,物料匯集此處較多,由于固體顆粒的慣性作用,局部磨損作用尤為明顯,而切割效應體現在護墻根部水冷壁處,其原因是由于防護墻的頂部提供了一個平臺,當焦渣以較高的速度下降到該平臺時產生反彈,其中往水冷壁管側反彈部分,對水冷壁管就產生了嚴重的切割效應,離心作用是由于顆粒運行時受到煙氣離心作用而引起。\"}, {\"paragraphId\": 4, \"word\": \"其次還易受到高溫氧化和硫酸鹽及硫、硫化物的熱腐蝕。水冷壁管具備了高溫氧化和高溫腐蝕條件, 其煙氣溫度高,且是富氧燃燒,實踐證明, 在300℃以上,管外表溫度每升高50℃, 腐蝕速度增加1倍。鍋爐在運行過程中受熱面管表面首先發生高溫氧化,表面生成Fe20s, 其次燃料灰中的Na20和K20與煙氣中的SOs化合生成硫酸鹽,其捕捉飛灰形成結渣和流渣,此時煙氣中SOs與M2S04同管壁上的Fe20s反應生成復合硫酸鹽MFe (S04) 2或MaFe (S04)3,此復合硫酸鹽受高溫又分解為疏松狀氧化鐵和硫酸鹽沉積層,易被飛灰氣流沖蝕帶走,氧化腐蝕繼續向管壁縱深進行;另外燃料中硫份,經燃燒生成的S和HeS也對管壁會產生強烈的腐蝕,與Fe反應生成FeS。\"}], \"prism_rowsInfo\": [{\"rowId\": 0, \"word\": \"1.1技術方案設計\"}, {\"rowId\": 1, \"word\": \"貴公司進行防磨噴涂的鍋爐均為循環流化床鍋爐,作為一種新型燃燒技術,由于爐型結構和設計參\"}, {\"rowId\": 2, \"word\": \"數等特點,在環保性能、燃燒效率、燃料適應性、高效脫硫及灰渣綜合利用等方法,具有很大\"}, {\"rowId\": 3, \"word\": \"的優越性。然而, CFB鍋爐受熱面的磨損問題十分嚴重,貴公司決定采用超音速電弧金屬噴涂技\"}, {\"rowId\": 4, \"word\": \"術來解決鍋爐受熱面磨損問題,以減少鍋爐的非計劃停運。我公司技術服務組根據全國各電廠的\"}, {\"rowId\": 5, \"word\": \"防磨防護情況,針對鍋爐運行的詳細狀況、工藝參數以及失效因素,并依據我公司多年來從事\"}, {\"rowId\": 6, \"word\": \"該行業的寶貴工程經驗,經我公司技術服務組專業人員的認真分析研究,并對上述部位的防護\"}, {\"rowId\": 7, \"word\": \"1問題分析:\"}, {\"rowId\": 8, \"word\": \"鍋爐衛燃帶,爐膛出口處,焊縫處的磨損、減薄與氣流中固體物料濃度、煙氣速度、顆粒的特\"}, {\"rowId\": 9, \"word\": \"性硬度和流道幾何形狀等密切相關,而在CFB鍋爐中,固體物料的濃度巨大,通常可達煤粉爐的\"}, {\"rowId\": 10, \"word\": \"幾十倍到上百倍,并且煙氣流速大,顆粒硬且棱角尖銳,因而在高速煙氣的帶動下,對CFB 鍋\"}, {\"rowId\": 11, \"word\": \"爐水冷壁等受熱面部位的沖刷磨損極為嚴重;尤其在護墻根部水冷壁部位,由于位處密相區邊\"}, {\"rowId\": 12, \"word\": \"緣區,不但受到嚴重的高速高濃度含床料、燃料氣流的強烈沖刷、磨損,而且存在嚴重的渦流\"}, {\"rowId\": 13, \"word\": \"效應、切割效應和離心作用。渦流效應在爐膛四角部位,由于該處形成邊壁流,物料匯集此處\"}, {\"rowId\": 14, \"word\": \"較多,由于固體顆粒的慣性作用,局部磨損作用尤為明顯,而切割效應體現在護墻根部水冷壁\"}, {\"rowId\": 15, \"word\": \"處,其原因是由于防護墻的頂部提供了一個平臺,當焦渣以較高的速度下降到該平臺時產生反\"}, {\"rowId\": 16, \"word\": \"彈,其中往水冷壁管側反彈部分,對水冷壁管就產生了嚴重的切割效應,離心作用是由于顆粒\"}, {\"rowId\": 17, \"word\": \"運行時受到煙氣離心作用而引起。\"}, {\"rowId\": 18, \"word\": \"其次還易受到高溫氧化和硫酸鹽及硫、硫化物的熱腐蝕。水冷壁管具備了高溫氧化和高溫腐\"}, {\"rowId\": 19, \"word\": \"蝕條件,其煙氣溫度高,且是富氧燃燒,實踐證明, 在300℃以上,管外表溫度每升高50℃, 腐\"}, {\"rowId\": 20, \"word\": \"蝕速度增加1倍。鍋爐在運行過程中受熱面管表面首先發生高溫氧化,表面生成Fe20s, 其次燃\"}, {\"rowId\": 21, \"word\": \"料灰中的Na20和K20與煙氣中的SOs化合生成硫酸鹽,其捕捉飛灰形成結渣和流渣,此時煙氣中\"}, {\"rowId\": 22, \"word\": \"SOs與M2S04同管壁上的Fe20s反應生成復合硫酸鹽MFe (S04) 2或MaFe (S04)3,此復合硫酸鹽受\"}, {\"rowId\": 23, \"word\": \"高溫又分解為疏松狀氧化鐵和硫酸鹽沉積層,易被飛灰氣流沖蝕帶走,氧化腐蝕繼續向管壁縱\"}, {\"rowId\": 24, \"word\": \"深進行;另外燃料中硫份,經燃燒生成的S和HeS也對管壁會產生強烈的腐蝕,與Fe反應生成\"}, {\"rowId\": 25, \"word\": \"FeS。\"}], \"prism_version\": \"1.0.9\", \"prism_wnum\": 26, \"prism_wordsInfo\": [{\"pageId\": 0, \"paragraphId\": 0, \"pos\": [{\"x\": 384, \"y\": 116}, {\"x\": 538, \"y\": 116}, {\"x\": 538, \"y\": 137}, {\"x\": 384, \"y\": 137}], \"prob\": 100, \"rowId\": 0, \"tableCellId\": -1, \"tableId\": -1, \"word\": \"1.1技術方案設計\"}, {\"pageId\": 0, \"paragraphId\": 1, \"pos\": [{\"x\": 129, \"y\": 149}, {\"x\": 776, \"y\": 149}, {\"x\": 776, \"y\": 169}, {\"x\": 129, \"y\": 168}], \"prob\": 100, \"rowId\": 1, \"tableCellId\": -1, \"tableId\": -1, \"word\": \"貴公司進行防磨噴涂的鍋爐均為循環流化床鍋爐,作為一種新型燃燒技術,由于爐型結構和設計參\"}, {\"pageId\": 0, \"paragraphId\": 1, \"pos\": [{\"x\": 120, \"y\": 177}, {\"x\": 779, \"y\": 177}, {\"x\": 779, \"y\": 198}, {\"x\": 120, \"y\": 197}], \"prob\": 100, \"rowId\": 2, \"tableCellId\": -1, \"tableId\": -1, \"word\": \"數等特點,在環保性能、燃燒效率、燃料適應性、高效脫硫及灰渣綜合利用等方法,具有很大\"}, {\"pageId\": 0, \"paragraphId\": 1, \"pos\": [{\"x\": 121, \"y\": 205}, {\"x\": 787, \"y\": 207}, {\"x\": 787, \"y\": 227}, {\"x\": 121, \"y\": 225}], \"prob\": 100, \"rowId\": 3, \"tableCellId\": -1, \"tableId\": -1, \"word\": \"的優越性。然而, CFB鍋爐受熱面的磨損問題十分嚴重,貴公司決定采用超音速電弧金屬噴涂技\"}, {\"pageId\": 0, \"para",
"Code": "noPermission",
"Message": "You are not authorized to perform this operation."
}
錯誤碼
訪問錯誤中心查看更多錯誤碼。
變更歷史
變更時間 | 變更內容概要 | 操作 |
---|---|---|
2022-08-17 | 新增 OpenAPI | 查看變更詳情 |