本產品(
文字識別/2021-07-07
)的OpenAPI采用RPC簽名風格,簽名細節參見簽名機制說明。我們已經為開發者封裝了常見編程語言的SDK,開發者可通過下載SDK直接調用本產品OpenAPI而無需關心技術細節。如果現有SDK不能滿足使用需求,可通過簽名機制進行自簽名對接。由于自簽名細節非常復雜,需花費 5個工作日左右。因此建議加入我們的服務釘釘群(78410016550),在專家指導下進行簽名對接。在使用API前,您需要準備好身份賬號及訪問密鑰(AccessKey),才能有效通過客戶端工具(SDK、CLI等)訪問API。細節請參見獲取AccessKey。
OCR統一識別
API | 標題 | API概述 |
---|---|---|
RecognizeAllText | OCR統一識別 | OCR統一識別接口支持識別多種圖片類型,包括通用文字、個人卡證、發票等。您只需要通過Type參數指定圖片類型,無須更換接口。 |
RecognizeGeneralStructure | 通用票證抽取 | 通用票證抽取結合讀光OCR和通義千問大模型的能力,能夠自動抽取非標準、非高頻的長尾票證關鍵信息,適用于票據、合同等場景。 |
通用文字識別
API | 標題 | API概述 |
---|---|---|
RecognizeAdvanced | 全文識別高精版 | 支持多格式版面、復雜文檔背景和光照環境的精準識別。 |
RecognizeHandwriting | 通用手寫體識別 | 支持中文手寫體、英文手寫體、數字手寫體等各種復雜場景的手寫文字識別。 |
RecognizeBasic | 電商圖片文字識別 | 針對電商商品宣傳圖片、社區貼吧圖片、網絡UGC圖片等網絡場景下圖片字符快速精準識別。 |
RecognizeGeneral | 通用文字識別 | 支持返回文字內容和位置坐標信息。 |
RecognizeTableOcr | 表格識別 | 支持對有線表格、條紋表格、無線表格進行有效識別。 |
RecognizeHealthCode | 防疫健康碼識別 | 包括全國主要省市健康碼,支持健康碼圖片的姓名、日期、時間、顏色、備注信息等主要字段的識別結果輸出。 |
RecognizeDocumentStructure | 文檔結構化識別 | 對文檔信息進行結構化識別,并提供元素平鋪和層級樹兩種視角的版面信息輸出。能夠將文檔中的文字元素(單字、文字塊、行等)和相應的版面格式(標題、段落、表格)抽離并按順序輸出。 |
個人證照識別
API | 標題 | API概述 |
---|---|---|
RecognizeIdcard | 身份證識別 | 支持二代身份證正反面,包括姓名、性別、民族、地址、出生日期、身份證號、簽發機關、有效期限等字段的結構化識別。并可進行實拍或復印件判斷及人臉位置檢測。 |
RecognizePassport | 護照識別 | 可對美國、法國、英國、日本、韓國等世界多個主要國家和地區護照提供識別服務,支持字段包括國籍、護照號碼、出生日期、姓名等。 |
RecognizeHousehold | 戶口本識別 | 可結構化識別戶口常住人口登記卡頁面及戶主頁的內容,可有效識別戶口本上的相關戶籍證明信息。 |
RecognizeEstateCertification | 不動產權證識別 | 可準確識別不動產證中的各項關鍵信息,包括戶主信息、房屋地址、面積大小、土地權利類型等,能夠適用于全國各地的不同房產證識別。 |
RecognizeBankCard | 銀行卡識別 | 可精準識別各類銀行卡中的銀行卡卡號和有效期,且支持橫卡、豎卡及銀行卡任意角度偏斜情況的識別與提取,支持中國內地大多數銀行,以及各種位數、凸字卡面、平面卡面等的識別。 |
RecognizeBirthCertification | 出生證明識別 | 可準確識別出生證明中的各項關鍵信息,包括出生日期、出生體重、出生地點等。 |
RecognizeChinesePassport | 中國護照識別 | 支持中國人民共和國護照的結構化內容檢測識別功能,支持中國內地、中國香港、中國澳門和中國臺灣地區的護照識別,識別內容包括出生地、出生日期、國籍、性別、護照號碼、有效期至、簽發國、簽發地等字段。 |
RecognizeExitEntryPermitToMainland | 來往大陸(內地)通行證識別 | 可準確識別通行證中的各項關鍵信息,包括姓名、出生日期、證件號碼等。包括港澳居民來往大陸通行證以及臺灣居民來往大陸通行證。 |
RecognizeExitEntryPermitToHK | 往來港澳臺通行證識別 | 支持通行證中的各項關鍵信息,包括姓名、出生日期、證件號碼等準確識別。 |
RecognizeHKIdcard | 中國香港身份證識別 | 支持香港永久性居民身份證和香港居民身份證兩種類型的證件識別,已支持全字段識別,包括中文姓名(如有)、英文姓名、中文姓名電碼(如有)、出生日期、性別、符號標記、身份證號碼等。 |
RecognizeSocialSecurityCardVersionII | 社保卡識別 | 支持全字段識別,包括標題、姓名、社會保障號碼、社會保障卡號、銀行賬號、發卡日期等。 |
RecognizeInternationalIdcard | 國際身份證識別 | 可對國外身份證件進行結構化識別,目前支持越南、韓國、印度、孟加拉居民身份證,可識別字段包括姓名、出生日期、證件號碼等。 |
票據憑證識別
API | 標題 | API概述 |
---|---|---|
RecognizeMixedInvoices | 混貼發票識別 | 支持各類票據的發票代碼、價稅合計、合計金額、購買方識別號、開票日期等關鍵字段結構化識別輸出。 |
RecognizeInvoice | 增值稅發票識別 | 支持增值稅專用發票、增值稅普通發票、增值稅電子發票識別,支持包括發票代碼、發票號碼、開票日期、發票金額、發票稅額、檢驗碼、購買方稅號、銷售方稅號、發票詳情等關鍵字段結構化識別輸出。 |
RecognizeCarInvoice | 機動車銷售統一發票識別 | 支持包括發票代碼、開票號碼、開票日期、發票金額、增值稅稅額、合格證號、購買方名稱、購買方身份證號/代碼等關鍵字段結構化識別輸出。 |
RecognizeQuotaInvoice | 定額發票識別 | 支持包括發票號碼、發票代碼、發票金額等關鍵字段結構化識別輸出。 |
RecognizeAirItinerary | 航空行程單識別 | 支持包括旅客姓名、身份證號碼、電子客票號碼、填開日期、填開單位等字段結構化識別輸出。 |
RecognizeTrainInvoice | 火車票識別 | 支持包括票號、出發站、到達站、開車時間、票價、座位類型、旅客信息、座位號、車次等字段結構化識別輸出。 |
RecognizeTaxiInvoice | 出租車發票識別 | 支持包括發票代碼、發票號碼、日期、發票金額等關鍵字段結構化識別輸出。 |
RecognizeRollTicket | 增值稅發票卷票識別 | 支持對卷票上包括發票代碼、發票號碼、開票日期、發票金額、校驗碼、大寫金額、銷售方稅號、購買方稅號等關鍵字段結構化識別輸出。 |
RecognizeBankAcceptance | 銀行承兌匯票識別 | 支持包括出票日期、票據號碼、出票人信息、收票人信息、承兌人信息、票據金額等關鍵字段結構化識別輸出。 |
RecognizeBusShipTicket | 客運車船票識別 | 支持包括標題、發票號碼、出發車站、到達車站、日期、金額等關鍵字段結構化識別輸出。 |
RecognizeNonTaxInvoice | 非稅收入發票識別 | 支持包括票據代碼、交款人、票據號碼、合計金額、收款單位等關鍵字段結構化識別輸出。 |
RecognizeCommonPrintedInvoice | 通用機打發票識別 | 支持包括發票代碼、發票號碼、銷售方名稱、銷售方識別號、購買方名稱、購買方識別號、合計金額等關鍵字段結構化識別輸出。 |
RecognizeHotelConsume | 酒店流水識別 | 支持包括房號、入住日期、離店日期、消費總計、付款總計、消費詳單等關鍵字段結構化識別輸出。 |
RecognizePaymentRecord | 支付詳情頁識別 | 支持包括收款方名稱、合計金額、付款方式、商品說明、支付時間等關鍵字段結構化識別輸出。 |
RecognizePurchaseRecord | 電商訂單頁識別 | 支持包括訂單編號、收貨信息、交易金額、店鋪名稱、商品詳單等關鍵字段結構化識別輸出。 |
RecognizeRideHailingItinerary | 網約車行程單識別 | 支持網約車行程單全部字段的識別,包括:服務商、申請日期、行程開始時間、行程結束時間、行程人手機號、總金額等字段。 |
RecognizeShoppingReceipt | 購物小票識別 | 支持包括開票方名稱、開票日期、聯系電話、地址、合計(實際)金額等關鍵字段結構化識別輸出。 |
RecognizeSocialSecurityCard | 社會保障卡識別 | 支持全字段識別,包括標題、姓名、社會保障號碼、社會保障卡號、銀行賬號、發卡日期等。 |
RecognizeTollInvoice | 過路過橋費發票識別 | 支持包括發票代碼、發票號碼、金額、日期、車型、出口、入口等關鍵字段結構化識別輸出。 |
RecognizeTaxClearanceCertificate | 稅收完稅證明識別 | 支持包括稅務機關、納稅人識別號、納稅人名稱、合計金額、填票人、完稅詳單等關鍵字段的結構化識別輸出。 |
RecognizeUsedCarInvoice | 二手車統一銷售發票識別 | 支持包括發票代碼、發票號碼、開票日期、發票金額、購買方名稱、購買方身份證號等關鍵字段結構化識別輸出。 |
企業資質識別
API | 標題 | API概述 |
---|---|---|
RecognizeBusinessLicense | 營業執照識別 | 可快速精準的識別企業營業執照中的統一社會信用代碼、公司名稱、地址、主體類型、法定代表人、注冊資金、組成形式、成立日期、營業期限和經營范圍等關鍵有效字段。支持營業執照、民辦非企業登記證書、社會團體法人登記證書、事業單位法人證書。 |
RecognizeBankAccountLicense | 銀行開戶許可證識別 | 可快速精準的識別銀行開戶許可證中的賬號、法定代表人、開戶銀行、核準號、企業名稱、編號等關鍵信息。 |
RecognizeTradeMarkCertification | 商標注冊證識別 | 可快速精準的識別商標注冊證中所包含的商標名稱、注冊人、注冊人地址以及有效期限、核定服務項目等關鍵有效字段信息。 |
RecognizeFoodProduceLicense | 食品生產許可證識別 | 可快速精準的識別食品生產許可證所包含經營者名稱、社會信用代碼、法定代表人姓名、地址、經營場所、經營項目、有效期、許可證編號等關鍵字段信息。 |
RecognizeFoodManageLicense | 食品經營許可證識別 | 可快速精準的識別食品經營許可證所包含生產者名稱、社會信用代碼、法定代表人姓名、地址、生產場所、食品類別、有效期、許可證編號等關鍵字段信息。 |
RecognizeMedicalDeviceManageLicense | 醫療器械經營許可證識別 | 可快速精準的識別醫療器械經營許可證所包含許可證編號、企業名稱、注冊地址、法定代表人、企業負責人、質量管理人、倉庫地址、經營范圍、許可期限、發證日期等關鍵字段信息。 |
RecognizeMedicalDeviceProduceLicense | 醫療器械生產許可證識別 | 可快速精準的識別醫療器械生產許可證所包含許可證編號、法定代表人、企業名稱、注冊地址、生產地址、生產范圍、企業負責人、有效期限等關鍵字段信息。 |
RecognizeCtwoMedicalDeviceManageLicense | 第二類醫療器械經營備案憑證識別 | 可快速精準的識別第二類醫療器械經營備案憑證所包含備案編號、企業名稱、住所、經營場所、庫房地址、經營方式、法定代表人、企業負責人、經營范圍、許可期限、備案日期等關鍵字段信息。 |
RecognizeCosmeticProduceLicense | 化妝品生產許可證識別 | 支持關鍵字段識別,包括證照名稱、企業名稱、社會信用代碼、住址、法定代表人、許可證編號等。 |
RecognizeInternationalBusinessLicense | 國際企業執照識別 | 支持韓國、印度營業執照類型,提供包括證件類型、公司名稱、注冊號、法人姓名、簽發日期等關鍵字段的識別能力。 |
車輛物流識別
API | 標題 | API概述 |
---|---|---|
RecognizeVehicleLicense | 行駛證識別 | 支持對行駛證正頁、副頁關鍵字段的自動定位和識別,同時也支持對正副頁在同一張圖片的場景進行自動分割與結構化識別。 |
RecognizeDrivingLicense | 駕駛證識別 | 支持對駕駛證上的姓名、證號、國籍、住址、初次領證日期、準駕類型、有效期等字段進行結構化提取。 |
RecognizeWaybill | 電子面單識別 | 支持識別面單上所有關鍵字段。 |
RecognizeCarNumber | 車牌識別 | 可有效識別車輛車牌信息,支持機動車車牌、摩托車車牌以及臨時車牌。 |
RecognizeCarVinCode | 車輛vin碼識別 | 支持識別車輛VIN碼。 |
RecognizeVehicleRegistration | 機動車注冊登記證識別 | 可快速精準的識別機動車注冊證所包含證件類別、條形編碼、登記機關、登記日期、機動車登記編號等關鍵字段信息。 |
RecognizeVehicleCertification | 車輛合格證識別 | 支持車輛型號、車輛識別代號、底盤型號、發動機型號等字段進行結構化提取。 |
教育場景識別
API | 標題 | API概述 |
---|---|---|
RecognizeEduFormula | 印刷體數學公式識別 | 支持印刷體的數學公式識別。 |
RecognizeEduOralCalculation | 口算判題 | 可以識別小學數學口算題目并給出題目判斷結果。可支持整數的加減乘除四則運算、整數的混合運算、大小比較、最大數最小數等。 |
RecognizeEduPaperOcr | 整頁試卷識別 | 支持K12全學科掃描場景的整頁內容文字識別。接口支持印刷體文本及公式的OCR識別和坐標返回,此外,接口還可對題目中的配圖位置進行檢測并返回坐標位置。 |
RecognizeEduPaperCut | 試卷切題識別 | 支持各學科的教輔試卷的結構化電子錄入,將試卷中的題目進行自動化切分和結構化打標,并進行對應題目、題干、選項、答案等內容的結構化輸出。 |
RecognizeEduQuestionOcr | 題目識別 | 可對題目進行有效識別。通過對題目的元素進行打標,提升題目的識別效果。 |
RecognizeEduPaperStructed | 精細版結構化切題 | 支持多學科教輔試卷的結構化識別,將整頁練習冊、試卷或教輔中的題目進行自動切題,并識別出其中的文字內容和坐標位置。 |
小語種文字識別
API | 標題 | API概述 |
---|---|---|
RecognizeMultiLanguage | 通用多語言識別 | 支持國際主流幾大語系的自動語言分類判定并返回對應語言的文字信息。 |
RecognizeEnglish | 英語作文識別 | 針對全英文圖片文檔場景下英文印刷體字符高效檢測和識別,具備英文專項識別和英文分詞功能,支持旋轉、表格、文字坐標等多項基礎功能。 |
RecognizeThai | 泰語識別 | 針對泰語圖片文檔場景下泰文印刷體高效檢測和識別,支持旋轉、表格、文字坐標等多項基礎功能。 |
RecognizeJanpanese | 日語識別 | 針對全日文圖片文檔場景下日文印刷體高效檢測和識別,支持旋轉、表格、文字坐標等多項基礎功能。 |
RecognizeKorean | 韓語識別 | 針對韓語圖片文檔場景下韓文印刷體高效檢測和識別,支持旋轉、表格、文字坐標等多項基礎功能。 |
RecognizeLatin | 拉丁語識別 | 針對拉丁語系的圖片文檔場景下印刷體高效檢測和識別,支持旋轉、表格、文字坐標等多項基礎功能。 |
RecognizeRussian | 俄語識別 | 針對圖片文檔場景下俄文印刷體高效檢測和識別,支持旋轉、表格、文字坐標等多項基礎功能。 |
醫療場景識別
API | 標題 | API概述 |
---|---|---|
RecognizeCovidTestReport | 核酸檢測報告識別 | 支持對全國各地區不同版式的核酸檢測記錄中姓名、證件號碼、采樣日期、采樣時間、檢測機構、檢測結果等6個關鍵字段的結構化結果輸出。 |
票證核驗
API | 標題 | API概述 |
---|---|---|
VerifyBusinessLicense | 營業執照核驗 | 營業執照三要素核驗支持通過輸入營業執照的統一信用社會代碼(工商注冊號)、企業名稱、法人姓名做一致性驗證。 |
VerifyVATInvoice | 發票核驗 | 發票核驗接口支持包括:增值稅專用發票、增值稅普通發票(折疊票)、增值稅普通發票(卷票)、增值稅電子普通發票(含收費公路通行費增值稅電子普通發票)、機動車銷售統一發票、二手車銷售統一發票多種類型發票核驗。您可以通過輸入發票的關鍵驗證字段,返回真實的票面信息,包括發票類型、發票代碼、發票號碼、作廢標志、開票日期、購方稅號及其他發票信息等。當天開具發票當日可查驗(T+0)。注意:可能有幾小時到十幾小時的延遲。 |