本文介紹文字識別(ocr)類目下的通用文字識別RecognizeCharacter的語法及示例。
功能描述
通用文字識別能力可以識別圖像中文字內容和文字區域坐標,適用于多場景圖像文字識別。
接入指引
1. 注冊阿里云賬號:打開阿里云官網,在阿里云官網右上角,單擊立即注冊,按照操作提示完成賬號注冊。
2. 開通能力:請確保您已開通文字識別服務,若未開通服務請立即開通。
3. 創建AccessKey:請確保您已創建AccessKey,如果您使用的是子賬號AccessKey,您需要給子賬號賦予AliyunVIAPIFullAccess權限,具體操作,請參見RAM授權。
4. 在線調試(可選):您可以通過OpenAPI Explorer在線調試能力,查看完整的調用示例代碼及SDK依賴信息,也可以下載完整的工程。
5. 開發接入步驟:
- 在SDK總覽中選擇您要接入使用的SDK語言。
- 在對應語言的SDK文檔中找到AI類目為文字識別(ocr)的SDK包進行安裝。
- 參考文檔中提供的示例代碼進行適當修改后調用。
6. 示例代碼:該能力常用語言的示例代碼,請參見通用文字識別示例代碼。
7. 客戶端直接調用:該能力常用的客戶端調用方式包括以下幾種。
輸入限制
- 圖像格式:JPEG、JPG、PNG、BMP、GIF。
- 圖像大小:不超過3 MB。
- 圖像分辨率:大于15×15像素,小于4096×4096像素。
- URL地址中不能包含中文字符。
計費說明
關于通用文字識別的計費方式及報價,請參見計費介紹。
調試
您可以在OpenAPI Explorer中直接運行該接口,免去您計算簽名的困擾。運行成功后,OpenAPI Explorer可以自動生成SDK代碼示例。
請求參數
名稱 | 類型 | 是否必選 | 示例值 | 描述 |
---|---|---|---|---|
Action | String | 是 | RecognizeCharacter | 系統規定參數。取值:RecognizeCharacter。 |
ImageURL | String | 是 | http://viapi-test.oss-cn-shanghai.aliyuncs.com/viapi-3.0domepic/ocr/RecognizeCharacter/RecognizeCharacter5.jpg | 圖像URL地址。推薦使用上海地域的OSS鏈接,對于文件在本地或者非上海地域OSS鏈接的情況,請參見文件URL處理。 |
MinHeight | Integer | 是 | 10 | 圖像中文字的最小高度,單位像素。 |
OutputProbability | Boolean | 是 | true | 是否輸出文字框的概率。取值:
|
返回數據
名稱 | 類型 | 示例值 | 描述 |
---|---|---|---|
RequestId | String | 7A9BC7FE-2D42-57AF-93BC-09A229DD2F1D | 請求ID。 |
Data | Object | 返回的結果數據內容。 |
|
Results | Array of Result | 返回識別信息。 |
|
TextRectangles | Object | 文字框區域位置。 |
|
Top | Integer | 150 | 文字區域左上角y坐標。 |
Width | Integer | 77 | 文字區域寬度。 |
Height | Integer | 409 | 文字區域高度。 |
Angle | Integer | -65 | 文字區域角度,角度范圍 說明 以文字區域中心點為旋轉點,向右旋轉角度為正,向左旋轉角度為負。 |
Left | Integer | 511 | 文字區域左上角x坐標。 |
Text | String | 祝你生日快樂 | 文字內容。 |
Probability | Float | 0.99 | 文字內容的概率,取值范圍為0~1。 |
SDK參考
阿里云視覺AI文字識別類目下的通用文字識別能力推薦使用SDK調用,支持多種編程語言,調用時請選擇AI類目為文字識別(ocr)的SDK包,文件參數通過SDK調用可支持本地文件及任意URL,具體可參見SDK總覽。
示例代碼
該能力常用語言的示例代碼,請參見通用文字識別示例代碼。
示例
請求示例
http(s)://ocr.cn-shanghai.aliyuncs.com/?Action=RecognizeCharacter //更多關于訪問域名(Endpoint)信息,請參見:http://bestwisewords.com/document_detail/143103.html
&ImageURL=http://viapi-test.oss-cn-shanghai.aliyuncs.com/viapi-3.0domepic/ocr/RecognizeCharacter/RecognizeCharacter5.jpg
&MinHeight=10
&OutputProbability=true
&公共請求參數
正常返回示例
XML
格式
HTTP/1.1 200 OK
Content-Type:application/xml
<RecognizeCharacterResponse>
<RequestId>7A9BC7FE-2D42-57AF-93BC-09A229DD2F1D</RequestId>
<Data>
<Results>
<TextRectangles>
<Left>599</Left>
<Top>160</Top>
<Angle>-69</Angle>
<Height>107</Height>
<Width>26</Width>
</TextRectangles>
<Probability>0.99</Probability>
<Text>HAPPY</Text>
</Results>
<Results>
<TextRectangles>
<Left>576</Left>
<Top>150</Top>
<Angle>-63</Angle>
<Height>200</Height>
<Width>37</Width>
</TextRectangles>
<Probability>0.99</Probability>
<Text>birthday</Text>
</Results>
<Results>
<TextRectangles>
<Left>511</Left>
<Top>150</Top>
<Angle>-65</Angle>
<Height>409</Height>
<Width>77</Width>
</TextRectangles>
<Probability>0.99</Probability>
<Text>祝你生日快樂</Text>
</Results>
</Data>
</RecognizeCharacterResponse>
JSON
格式
HTTP/1.1 200 OK
Content-Type:application/json
{
"RequestId" : "7A9BC7FE-2D42-57AF-93BC-09A229DD2F1D",
"Data" : {
"Results" : [ {
"TextRectangles" : {
"Left" : 599,
"Top" : 160,
"Angle" : -69,
"Height" : 107,
"Width" : 26
},
"Probability" : 0.99,
"Text" : "HAPPY"
}, {
"TextRectangles" : {
"Left" : 576,
"Top" : 150,
"Angle" : -63,
"Height" : 200,
"Width" : 37
},
"Probability" : 0.99,
"Text" : "birthday"
}, {
"TextRectangles" : {
"Left" : 511,
"Top" : 150,
"Angle" : -65,
"Height" : 409,
"Width" : 77
},
"Probability" : 0.99,
"Text" : "祝你生日快樂"
} ]
}
}
錯誤碼
關于通用文字識別的錯誤碼,詳情請參見常見錯誤碼。
安全聲明
- 請確保上傳的圖片或文件來源符合相應的法律法規。
- 通過體驗調試上傳的臨時文件有效期為1小時,在24小時后會被系統自動清理刪除。