在離線環境下,支持在Android或iOS設備端實現通用文字的離線識別,包體小,可達到秒級識別速度。

說明 阿里云視覺智能開放平臺各類目視覺AI能力SDK接入、接口使用或問題咨詢等,請通過釘釘群(23109592)加入阿里云視覺智能開放平臺咨詢群聯系我們。

能力優勢

  • 大文字庫識別:支持6100余種識別能力,模型大小只有1.5 MB,覆蓋絕大部分識別場景。
  • 支持復雜場景:支持視頻流識別模式,多幀識別避免了云端識別強依賴單張圖片采集質量的問題,使用多幀融合策略進一步提升多字段場景的識別精度和識別速度,有效減少不可預測的外界因素(拍攝角度、光照等)帶來的誤識別。
  • 精度與性能融合:離線識別在確保精度的前提下,保證在中低端機器中達到秒級的響應時間,精準快捷。

應用場景

  • 通用文字識別:支持圖書、雜志等各類文字識別場景。
  • 身份證識別:支持中國內地二代身份證正反面識別。
  • 駕駛證識別:支持機動車駕駛證主頁、副頁全部字段識別。
  • 車輛信息識別:支持車牌、車輛VIN碼識別。

前提條件

使用SDK前需完成激活授權,具體請參見激活授權。

計費說明

關于通用文字識別SDK的報價,請參見計費介紹。

支持終端

Android、iOS

約束與限制

  • Android系統:Android 5.0以上,設備包含相機模塊和陀螺儀模塊。
  • iOS系統:iOS 10以上,支持iPhone 5s以上系列機型,設備包含相機模塊。
  • 推薦相機分辨率:原生相機的分辨率大于640×480像素,小于1280×720像素。分辨率過大會降低SDK速度。
  • 如需使用iOS系統iPhone 5s及以下、Android低端機型,請聯系我們

接入使用方式

重要 本SDK不會對SDK原廠商傳輸任何數據。因此,如果您使用本SDK收集個人信息,您將作為數據處理者,原廠商不作為數據處理者或受托處理者。您應當依照相關法律法規,對用戶充分告知并獲得授權。請您注意在告知用戶時,原廠商不應作為數據處理者,亦不應作為受托處理者。