阿里云視覺智能開放平臺提供通用文字識別、證件識別、圖片分割等離線SDK,可在無網絡環境下離線使用,不同能力支持Android、iOS、Windows和macOS不同的使用終端。本文為您介紹阿里云視覺智能開放平臺當前支持的離線SDK能力。
阿里云視覺智能開放平臺各類目視覺AI能力SDK接入、接口使用或問題咨詢等,請通過釘釘群(23109592)加入阿里云視覺智能開放平臺咨詢群聯系我們。
能力介紹
能力名稱 | 支持終端 | 描述 |
實時視頻分割 | 實時視頻分割SDK(Android) | 基于深度學習框架,結合檢測識別技術,實現高精視覺分割能力,可實現實時全自動主體、場景像素級識別,對高度鏤空主體、復雜背景等場景都有較好的效果。 |
實時視頻分割SDK (iOS) | ||
實時視頻分割SDK (Windows) | ||
實時視頻分割SDK (macOS) | ||
離線圖片分割 | 離線圖片分割SDK(Android) | 通過檢測識別技術,對用戶拍照或上傳的圖片進行精細化、無瑕疵的摳像處理,實現高精視覺分割能力,支持復雜圖片背景的分割和替換。 |
離線圖片分割SDK(iOS) | ||
實時無損分割 | 實時無損分割SDK(Windows) | 通過顏色過濾和深度學習的融合技術,對直播中的視頻進行實時分割,同時對邊緣瑕疵進行邊緣平滑和去雜色處理,實現影視級無瑕疵的實時視頻分割效果。 |
實時無損分割SDK(macOS) | ||
離線視頻分割 | 離線視頻分割SDK(Android) | 基于客戶端自身計算資源,對采集的視頻實現視頻圖像序列化分割。 |
離線視頻分割SDK(iOS) | ||
文字離線識別 | 證件識別SDK(Android) | 支持身份證、駕駛證、行駛證正反面離線識別,可識別常用多個關鍵字段內容,識別精準度超過95%。 |
證件識別SDK(iOS) | ||
車輛類識別SDK(Android) | 支持掃描識別中國內地所有單行車牌及VIN碼的識別,支持以視頻流形式的識別。 | |
車輛類識別SDK(iOS) | ||
通用文字識別SDK(Android) | 在離線環境下,支持在Android或iOS設備端實現通用文字、身份卡證、駕駛卡證和車牌的離線識別,同時包體很小,可達到秒級識別速度。 | |
通用文字識別SDK(iOS) | ||
肢體關鍵點 | 肢體關鍵點SDK(Android) | 可識別授權人體圖像的15個關鍵點檢測信息,包括鼻子,眼睛,脖子,左肩,右肩等。 |
肢體關鍵點SDK(iOS) | ||
肢體動作計數 | 肢體動作計數SDK(Android) | 通過攝像頭拍攝人像動作視頻,實時識別出人體關鍵點,并根據動作自動計數。已支持的健身動作有15種(跳繩、深蹲、開合跳、仰臥起坐、俯臥撐、平板支撐、臀橋等),還可支持定制健身動作。 |
肢體動作計數SDK(iOS) | ||
肢體動作計數反饋機制 | 肢體動作計數反饋機制SDK(Android) | 通過AI實時檢測,可檢測出15種不規范的肢體動作,同時可實現實時反饋。 |
肢體動作計數反饋機制SDK(iOS) | ||
服務端人臉識別 | 服務端人臉識別SDK(Linux) | 服務端人臉識別離線SDK,包括人臉檢測、人臉跟蹤、人臉關鍵點定位、人臉質量、角度模型、活體檢測和人臉識別等能力,可以直接部署在服務器上。 |
人臉關鍵點 | 人臉關鍵點SDK(Android) | 可快速識別出圖像中人臉數量和人臉區域,輸出人臉數量、106個基礎點位坐標、134個額外精細點位、40個眼瞳點位等信息。 |
人臉關鍵點SDK(iOS) | ||
圖片增強 | 圖片增強SDK(Android) | 將原圖進行無損放大一倍效果,保持圖像質量無損。 |
圖片增強SDK(iOS) | ||
濾鏡 | 濾鏡SDK(Android) | 提供8種濾鏡效果,正常,活力,清新,美食,日系,美顏,薄荷,黑白。保證圖片質量的前提下達到相應的濾鏡效果。 |
濾鏡SDK(iOS) | ||
基礎美顏 | 基礎美顏SDK(Android) | 基于人臉檢測,可以對圖像質感、人像膚質、色調進行自由調節,從而達到均衡膚色、消除面部瑕疵、美化人臉的功效。 |
基礎美顏SDK(iOS) | ||
視頻增強 | 視頻增強SDK(Android) | 基于多維視頻增強算法,對視頻畫面進行清晰度提升、噪聲抑制、損傷問題修復、色彩顯示提升,使視頻在實時播放、離線編輯的場景下獲得顯著的畫質增強,提升用戶體驗,同時降低帶寬傳輸成本。 |
視頻增強SDK(iOS) | ||
動作打分 | 動作打分SDK(Android) | 通過人體姿態估計以及動作打分算法,對人物動作標準度進行打分。支持復雜自遮擋類動作,魯棒性高。 |
動作打分SDK(iOS) |