文字識別技術基于阿里云深度學習技術,為您提供通用的印刷文字識別和文檔結構化等能力。文字識別技術可以靈活應用于證件文字識別、發票文字識別、文檔識別與整理等行業場景,滿足認證、鑒權、票據流轉審核等業務需求。
服務開通
能力介紹
目前阿里云視覺智能開放平臺提供如下文字識別能力。
類別 | 能力 | 說明 |
個人類卡證識別 | 識別二代身份證關鍵字段內容,關鍵字段包括:姓名、性別、民族、身份證號、出生日期、地址信息、有效起始時間、簽發機關,同時可輸出身份證區域位置和人臉位置信息。 | |
輸入主流銀行卡圖像,輸出3個信息,包括:發卡行、銀行卡號、有效日期。 | ||
識別圖像中是否含有二維碼信息,輸出圖像中二維碼包含的文本信息(每個二維碼對應的URL或文本),可支持圖像中含有多個二維碼識別。 | ||
資產類證件識別 | 識別營業執照關鍵字段內容,包括:公司地址、營業范圍、注冊資本、注冊日期、公司法人、公司名稱、注冊號、公司類型、公司營業期限日期,同時可輸出營業執照上二維碼、印章位置。 | |
通用文字類識別 | 識別圖像中文字內容和文字區域坐標,適用于多場景圖像文字識別。 | |
自動識別表格位置、表格內容信息。適用于黑色的,橫線、豎線都齊全的表格中內容識別。 | ||
可以對PDF上的文字進行結構化識別。 | ||
可以實現對輸入視頻的結構化處理,返回對應的文字內容、文字區域坐標及時間等信息。 | ||
車輛交通類識別 | 識別駕駛證首頁和副頁關鍵字段內容,包括:檔案編號、姓名、有效期時長、性別、發證日期、駕駛證號、駕駛證準駕車型、有效期開始時間、地址,共9個關鍵字段信息。 | |
識別行駛證首頁和副頁關鍵字段內容,輸出品牌型號、車輛類型、車牌號碼、檢驗記錄、核定載質量、核定載人數等21個關鍵字段信息。 | ||
準確識別出圖像中車牌位置,輸出車牌位置坐標、車牌類型、車牌號碼、車牌號碼置信度、車牌置信度,共5個關鍵字段信息。 | ||
識別車輛VIN碼,輸出車輛VIN碼數值。 | ||
行業票證類識別 | 準確識別出全國各大城市出租車發票在圖像中的位置,支持出租車發票結構化識別,輸出發票號碼、代碼、車號、日期、時間、金額,共6個關鍵字段信息。 | |
支持火車票結構化識別,輸出乘車時間、始發站、目的站、座位席別、乘車人姓名、車次號、票價、車廂及座次號,共8個關鍵字段信息。 | ||
可以識別增值稅發票(電子發票和紙質發票)關鍵字段內容,包括:校驗碼、復核人、開票人、發票代碼、收款人等。 | ||
可以對定額發票上的發票號碼、發票代碼、發票金額進行結構化識別。 | ||
支持對卷票上包括價稅合計、發票代碼、發票號碼、合計稅額、合計金額、密碼區、開票日期、稅率、購買方識別號、銷售方識別號等結構化識別。 |
應用場景
文字識別應用場景如下:
注冊登記審核
通過身份證、護照識別、銀行卡識別等能力,在互聯網金融、公共網上辦事大廳等場景,能夠快速準確識別錄入用戶身份、賬戶信息,準確率高達99%,從而降低用戶輸入成本,提高人工審核效率,有效控制業務風險。
報銷憑證錄入
應用于企業稅務核算、金融保費核發及內部報銷等場景,實現對各類稅務發票、醫療發票、交通票據等的自動識別和快速錄入,能夠有效減少人力成本,實現報銷的自動化。
更多產品動態,請您持續關注阿里云視覺智能開放平臺。