本文介紹阿里云文字識別-通用文字識別系列相關產品的功能、特色優勢及應用場景,并為您提供產品的API快捷入口。
產品介紹
讀光OCR通用識別類產品,可對各類常見文檔圖片或文檔掃描件中的文字信息按照文檔原有的格式進行文本識別和還原。為了能夠更好的還原文字信息和文檔結構,讀光文檔識別在通用全文識別能力(文字定位、行分析、文字識別)的基礎上,增加了文檔結構的版面分析和文檔圖像處理能力,使得文檔類圖像也能按照結構化的方式進行文檔元素提取,進一步提升文檔識別的產品體驗。
產品功能
通用文字識別
讀光OCR通用文字識別適用于各行業場景下的非結構化文字識別,支持返回文字內容和位置坐標信息。
全文識別高精版(推薦)
讀光OCR全文識別高精版支持多格式版面、復雜文檔背景和光照環境的精準識別,文檔識別率超過99.7%。同時,針對有印章、手印的文檔,可實現印章擦除后識別,支持低置信度過濾、圖案檢測等高階功能。
通用手寫體識別
讀光OCR通用手寫體識別模型可以支持中文手寫體、英文手寫體、數字手寫體等各種復雜場景的手寫文字識別,同時具備印刷文字識別能力,適用于識別各類手寫筆記、板書等。
表格識別
讀光OCR表格識別可支持對有線表格、條紋表格、無線表格進行有效識別。
電商圖片文字識別
讀光OCR電商圖片文字識別是專門針對電商商品宣傳圖片、社區貼吧圖片、網絡UGC圖片等網絡場景下圖片字符快速精準識別的原子能力產品,在違規廣告識別、信息審核管理和網絡安全治理等場景下具有極大應用價值。
文檔結構化識別
讀光OCR文檔結構化識別可對文檔信息進行結構化識別,并提供元素平鋪和層級樹兩種視角的版面信息輸出。能夠將文檔中的文字元素(單字、文字塊、行等)和相應的版面格式(標題、段落、表格)抽離并按順序輸出。目前僅支持單頁文檔。
特色優勢
準確率高
利用海量的圖片樣本訓練模型,具有業內領先的準確率。以身份證識別為例,準確率超過99%。
實時性高
依托于阿里自建的EAS在線服務集群,精益求精優化Inference技術,提供彈性伸縮的低延時服務。
技術前沿精深
基于阿里云人工智能平臺 PAI,應用阿里深度優化的深度學習框架PAI-Tensorflow,訓練出業界先進的文本檢測模型及文本識別模型。
服務穩定
根據調用量提供彈性服務,擴展性好,算法持續的迭代優化對用戶穩定性無影響。
應用場景
圖片內容審核
各類通用型接口,可針對不同場景,識別內容進行內容審核。及時發現違規行為,大大降低人力成本,廣泛應用于電商內容治理場景。
合同文檔類識別
通用文字識別可用于識別合同、文檔、小說等圖片,用于合同校對、文檔檢索、PDF提取等場景,廣泛應用于司法卷宗管理、企業法務合同審核、金融/保險自動化流程等行業。
API快捷入口
云市場API快捷入口(舊) | 官網API快捷入口(新) |