文檔處理
文檔轉換是由智能媒體管理IMM提供的對多種文檔格式進行格式轉換的處理能力。您可以將原始文檔上傳到阿里云對象存儲OSS,通過OSS的RESTful數據處理接口x-oss-process
和x-oss-async-process
在任何時間、任何地點、任何互聯網設備上對文檔進行文檔格式轉換、在線預覽、在線編輯等處理。
處理參數
OSS支持直接使用一個或多個參數處理文檔,也支持將多個參數封裝在一個樣式中批量處理文檔。關于樣式的更多信息,請參見樣式。
當存在多個處理參數時,OSS將按照參數順序對文件進行處理。處理參數說明如下表所示。
處理操作 | 參數 | 說明 |
doc/convert | 將OSS中的文檔轉換為需要的格式。 | |
doc/preview | 對OSS中的文檔進行預覽。 | |
doc/edit | 對OSS中的文檔進行協同編輯。 | |
doc/snapshot | 對OSS中的文檔指定頁生成快照。 | |
參見具體文檔 | 對OSS中的文檔進行AI處理,包括文檔內容翻譯、文檔內容潤色、文檔摘要生成、文檔續寫、文檔內容豐富以及文檔語氣改寫六大類。 |
操作方式
使用限制
文檔轉換支持的文件類型
輸入文件類型
文檔類型
文件后綴
文字文檔
doc、dot、wps、wpt、docx、dotx、docm、dotm、txt、wpss、lrc、c、cpp、h、asm、s、java、asp、bat、bas、prg、cmd、rtf、txt、log、xml、htm、html
演示文檔
pptx、ppt、pot、potx、pps、ppsx、dps、dpt、pptm、potm、ppsm、dpss
表格文檔
xls、xlt、et、ett、xlsx、xltx、csv、xlsb、xlsm、xltm、ets
PDF文檔
pdf
輸出文件類型
文件格式
說明
JPEG
按文檔樣式每頁生成一張JPEG圖片。
PNG
按文檔樣式每頁生成一張PNG圖片。
PDF
每個文檔生成一個PDF文件。
TXT
每個文檔生成一個TXT文件。
文檔轉換支持的文件大小和頁數
文檔轉換單次轉換的原文件大小限制為200 MB。
文檔轉換單次轉換的原文件頁數無限制,但頁數太多可能會導致轉換處理超時,此時需要傳入頁碼參數分頁轉換。示例如下:
POST /exmaple.docx?x-oss-async-process HTTP/1.1 Host: doc-demo.oss-cn-hangzhou.aliyuncs.com Date: Fri, 28 Oct 2022 06:40:10 GMT Authorization: OSS qn6q**************:77Dv**************** // 將文件example.docx的1-10頁轉換為PNG格式的圖片文件,轉換后的存儲路徑為:oss://test-bucket/doc_images/頁碼.png。 x-oss-async-process=doc/convert,pages_MS0xMA,target_png,source_docx|sys/saveas,b_dGVzdC1idWNrZXQ,o_ZG9jX2ltYWdlcy97aW5kZXh9LnBuZw
文檔預覽支持的文件類型
文檔預覽支持的文件類型如下表所示。
文檔類型 | 文件后綴 |
文字文檔 | doc、dot、wps、wpt、docx、dotx、docm、dotm、rtf |
表格文檔 | xls、xlt、et、xlsx、xltx、csv、xlsm、xltm |
演示文檔 | ppt、pptx、pptm、ppsx、ppsm、pps、potx、potm、dpt、dps |
PDF文檔 |
文檔編輯支持的文件類型
文檔編輯支持的文件類型如下表所示。
文檔類型 | 文件后綴 |
文字文檔 | doc、dot、wps、wpt、docx、dotx、docm、dotm |
表格文檔 | xls、xlt、et、xlsx、xltx、xlsm、xltm |
演示文檔 | ppt、pptx、pptm、ppsx、ppsm、pps、potx、potm、dpt、dps |
文檔預覽和編輯支持的文件大小和頁數
文檔預覽和編輯支持的文件大小限制為200 MB。
文檔預覽和編輯支持的頁數無限制。
文檔快照支持輸出的文件格式
支持輸出jpg、png格式。
計費
使用文檔處理服務時,會產生如下費用:
常見問題
開啟CDN后生成帶簽名的文檔URL報錯Either the Signature query string parameter or the Authorization header should be specified, not both.
如果您在私有 Bucket 開啟回源功能后,通過 CDN 域名訪問已綁定至 IMM 項目的 Bucket 中的文件,無需提供額外的簽名信息。請按照以下要求進行配置:
授權默認角色 您需要為 CDN 的默認角色
AliyunCDNAccessingPrivateOSSRole
授予oss:ProcessImm
和imm:GetWebofficeURL
權限。訪問資源時,應使用不包含簽名信息的 URL。
例如,您可以使用如下格式的URL:http://cdn.example.info/demo.ppt?x-oss-process=doc/preview,export_1,print_1使用文檔在線預覽功能。