產品簡介
本文為您介紹阿里云文字識別的產品概述。
阿里云OCR是依據阿里巴巴多年AI技術積累打造的全棧全場景OCR文本識別類產品。多年來, 通過持續整合前沿AI技術和行業實戰經驗,阿里云OCR打磨出了能夠承載跨行業敏捷應用的技術架構,具備圖像文字定位、文字識別和文字理解的全棧技術體系,形成了包含通用文本識別、卡證票據自動化分類及結構化識別、卡證票據混貼識別、表格文檔批量結構化識別以及試題作業智能識別等全量OCR原子能力矩陣。支持公有云調用、私有化部署、終端 SDK 等云邊端全業務場景服務能力。
產品概覽
*名詞解釋:讀光是阿里云OCR的產品品牌,由阿里巴巴達摩院提供算法服務。本文檔中阿里云OCR與讀光OCR為相同概念,特此說明。
產品分類
文字識別(OCR)可以將圖片中的文字信息轉換為可編輯文本,阿里云根據客戶的業務場景和需求,將產品分為了OCR統一識別、通用文字識別、個人證照識別、發票憑證識別、教育場景識別、車輛物流識別、企業資質識別、小語種文字識別等幾大類商品,滿足各種客戶的圖片識別需求。
適用于用一個API覆蓋多場景下各類文檔圖片或文檔掃描件的文字信息識別或文字信息抽取。
適用于各類常見文檔圖片或掃描件中的文字信息按照文檔原有的格式進行文本識別和還原。
個人證照類識別提供個人身份識別所需的身份證、銀行卡、護照等證件的結構化識別服務。
票據憑證系列提供企業報銷所需的各類發票的結構化識別以及混貼發票的自動分割與識別。
OCR識別能力賦能教育應用場景中試題題目、數學公式、速算題目等信息智能化識別需求。
適用于交通物流相關的行駛證、駕駛證、車牌、vin碼、電子運單等汽車相關內容識別。
提供企事業單位在業務開展過程中使用到的營業執照、商標注冊證等資質證明的結構化識別服務。
小語種文字識別能夠支持國際主流幾大語系的自動語言分類判定并返回對應語言的文字信息。
醫療場景識別提供抗疫場景下核酸檢測報告識別能力。
提供針對發票及企業執照等各類票證單據的真偽核驗能力。
可實現圖片、PDF、掃描件與Word、Excel等多種格式的轉換,保留版式樣式信息。
從文檔中提取出邏輯層級結構、文本內容、表格內容、 Key-value鍵值字段、樣式信息等。