人工智能图像类快速入门方法是什么?

前言

欢迎使用OCR服务，这里主要为您介绍如何使用OCR的各种服务，如何快速找到需要的帮助信息。下文主要通过身份证识别服务的例子来介绍各个流程。

参考示例 — 身份证识别

云市场调用

购买服务

开通API网关https://www.aliyun.com/product/apigateway
在身份证服务https://market.aliyun.com/products/57124001/cmapi010401.html 页面购买服务

授权API

进入API网关管理控制台，点击左侧调用API—> 应用管理，创建新应用。
应用创建后，点击应用名称，查看应用ID
点击左侧已购买API，在对应的API一行中选择查看API，点击更多,授权，输入步骤2获取的应用ID，进行授权即可。

API调用

API的具体调用方式见身份证服务产品页面

具体的示例代码见产品页面的请求示例代码，通过此页面查看APPCODE，请阅读数据格式说明了解印刷文字识别服务的输入输出格式，阅读 API介绍-身份证了解身份证服务具体的输入输出格式。

示例如下：<divre style='background: rgb(246, 246, 246); font: 12px/1.6 "YaHei Consolas Hybrid", Consolas, "Meiryo UI", "Malgun Gothic", "Segoe UI", "Trebuchet MS", Helvetica, monospace, monospace; margin: 0px 0px 16px; padding: 10px; outline: 0px; border-radius: 3px; border: 1px solid rgb(221, 221, 221); color: rgb(51, 51, 51); text-transform: none; text-indent: 0px; letter-spacing: normal; overflow: auto; word-spacing: 0px; white-space: pre-wrap; word-wrap: break-word; box-sizing: border-box; orphans: 2; widows: 2; font-size-adjust: none; font-stretch: normal; -webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial;' prettyprinted?="" linenums="">

{
"inputs": [
{
"image": {
"dataType": 50, #50表示image的数据类型为字符串
"dataValue": "base64_image_string" #图片以base64编码的string
},
"configure": {
"dataType": 50,
"dataValue": "\"{
\"side\": \"face\", #身份证正反面类型: face/back
}\""
}
}]
}

上面列出的是识别身份证正面图像的输入格式，主要是传输了图像数据和配置字符串，其中图像是经过base64编码后的数据，配置字符串主要传递了一个参数，表示当前图像为身份证正面图像，进行正面识别。
返回结果示例如下：<divre style='background: rgb(246, 246, 246); font: 12px/1.6 "YaHei Consolas Hybrid", Consolas, "Meiryo UI", "Malgun Gothic", "Segoe UI", "Trebuchet MS", Helvetica, monospace, monospace; margin: 0px 0px 16px; padding: 10px; outline: 0px; border-radius: 3px; border: 1px solid rgb(221, 221, 221); color: rgb(51, 51, 51); text-transform: none; text-indent: 0px; letter-spacing: normal; overflow: auto; word-spacing: 0px; white-space: pre-wrap; word-wrap: break-word; box-sizing: border-box; orphans: 2; widows: 2; font-size-adjust: none; font-stretch: normal; -webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial;' prettyprinted?="" linenums="">

{
"outputs": [
{
"outputLabel": "ocr_id",
"outputMulti": {},
"outputValue": {
"dataType": 50,
"dataValue": "{
\"address\" : \"浙江省杭州市余杭区文一西路969号\", #地址信息
\"config_str\" : \"{\"side\":\"face\"}\", #配置信息，同输入configure
\"name\" : \"张三\", #姓名
\"num\" : \"1234567890\", #身份证号
\"success\" : true #识别结果，true表示成功，false表示失败
}"
}
}]
}

通过outpus[0][“outputValue”][“dataValue”]即可索引到输出结果，对应的字段含义具体可以参见 API介绍-身份证。

数加服务调用

开通服务

开通OCR服务，请参考页面 https://data.aliyun.com/product/ocr

了解服务调用方式

参见数加API使用文档了解数加API使用方法，具体包括以下要点：了解API校验方法
了解API请求参数和请求方法
了解发送请求所需的加密方法，参考示例代码或者原理实现对应的加密函数
获取属于用户自己的Access Key ID和Access Key Secret

服务API地址：不同服务的地址可以参见API介绍中各个服务API的说明，依其中方法获取。
用户身份信息：用户信息包括Access Key ID和Access Key Secret。用户可以访问阿里云AK管理平台来查看。
了解识别服务的输入输出格式：具体可以参见数据格式说明。身份证识别服务所需字段具体可以参见 API介绍-身份证。
base64编码：所需识别身份证图片，需要经过base64编码后进行传输。

身份证服务调用示例

首先，登陆阿里云AK管理平台获取Access Key ID和Access Key Secret，阅读API介绍，获取服务对应的url。
其次，参考数加API使用文档实现发送Post请求函数sendPost(url, body, ak_id, ak_secret)，也可参考API中发送请求示例代码。
此后，通过数据格式说明了解输入输出格式，阅读 API介绍-身份证获取身份证识别的url，以及身份证识别服务所接受的json字段参数，示例如下：<divre style='background: rgb(246, 246, 246); font: 12px/1.6 "YaHei Consolas Hybrid", Consolas, "Meiryo UI", "Malgun Gothic", "Segoe UI", "Trebuchet MS", Helvetica, monospace, monospace; margin: 0px 0px 16px; padding: 10px; outline: 0px; border-radius: 3px; border: 1px solid rgb(221, 221, 221); color: rgb(51, 51, 51); text-transform: none; text-indent: 0px; letter-spacing: normal; overflow: auto; word-spacing: 0px; white-space: pre-wrap; word-wrap: break-word; box-sizing: border-box; orphans: 2; widows: 2; font-size-adjust: none; font-stretch: normal; -webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial;' prettyprinted?="" linenums="">

{
"inputs": [
{
"image": {
"dataType": 50, #50表示image的数据类型为字符串
"dataValue": "base64_image_string" #图片以base64编码的string
},
"configure": {
"dataType": 50,
"dataValue": "\"{
\"side\": \"face\", #身份证正反面类型: face/back
}\""
}
}]
}

上面列出的是识别身份证正面图像的输入格式，可以发现，主要是传输了图像数据和配置字符串，其中图像是经过base64编码后的数据，配置字符串主要传递了一个参数，表示当前图像为身份证正面图像，进行正面识别。
最后，调用sendPost函数，传入url， body，ak_id，ak_secret，即可得到返回结果，如下：<divre style='background: rgb(246, 246, 246); font: 12px/1.6 "YaHei Consolas Hybrid", Consolas, "Meiryo UI", "Malgun Gothic", "Segoe UI", "Trebuchet MS", Helvetica, monospace, monospace; margin: 0px 0px 16px; padding: 10px; outline: 0px; border-radius: 3px; border: 1px solid rgb(221, 221, 221); color: rgb(51, 51, 51); text-transform: none; text-indent: 0px; letter-spacing: normal; overflow: auto; word-spacing: 0px; white-space: pre-wrap; word-wrap: break-word; box-sizing: border-box; orphans: 2; widows: 2; font-size-adjust: none; font-stretch: normal; -webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial;' prettyprinted?="" linenums="">

{
"outputs": [
{
"outputLabel": "ocr_id",
"outputMulti": {},
"outputValue": {
"dataType": 50,
"dataValue": "{
\"address\" : \"浙江省杭州市余杭区文一西路969号\", #地址信息
\"config_str\" : \"{\"side\":\"face\"}\", #配置信息，同输入configure
\"name\" : \"张三\", #姓名
\"num\" : \"1234567890\", #身份证号
\"success\" : true #识别结果，true表示成功，false表示失败
}"
}
}]
}

通过outpus[0][“outputValue”][“dataValue”]即可索引到输出结果，对应的字段含义具体可以参见 API介绍-身份证。

人工智能图像类快速入门方法是什么?

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

人工智能图像类快速入门方法是什么?

相关课程

相关文章

相关电子书

相关实验场景