阿里云文字识别(OCR)服务 Quick Start

本文涉及的产品
视觉智能开放平台,视频资源包5000点
视觉智能开放平台,图像资源包5000点
视觉智能开放平台,分割抠图1万点
简介: 阿里云文字识别(Optical Character Recognition,OCR)可以将图片中的文字信息转换为可编辑文本,是一款由阿里巴巴达摩院权威AI团队打造的全栈全场景OCR文本识别类产品。根据客户的业务场景和需求,将产品分为了通用文字识别、个人证照识别、票据凭证识别、教育场景识别、车辆物流识别、企业资质识别、小语种文字识别等,满足各种客户的图片识别需求。由于阿里云视觉智能开放平台和云市场这两个渠道下也具备阿里文字识别服务,一些不熟悉的客户很容易将三者搞混淆,这边简单做下对比。然后再针对个人证照识别下常见的服务-身份证识别功能简单介绍下产品的开通及使用。

一、产品对比

  • 1.1 阿里云文字识别(OCR)与云市场文字识别
    官网阿里云文字识别资源包和云市场一方,都是阿里云官方的渠道,只是产品的服务放在云市场售卖。两者产品能力完全一样,但是两边资源包不通用,调用接口方式不同;另外后续产品上架的新服务,优先上架官网处。

云市场用appcode调用,仅支持资源包,阿里云官网用AccessKey调用,支持资源包和后付费。请参考链接:
官网控制台:https://ocr.console.aliyun.com/overview
官网获取AccessKey:https://help.aliyun.com/document_detail/295361.html
云市场AppCode:https://market.console.aliyun.com/imageconsole/index.htm

  • 1.2 视觉智能开放平台与阿里云文字识别(OCR)

视觉智能平台OCR,则是完全另一个产品,不属于读光OCR,但是其底层技术能力都是达摩院研发,只是不同的开发团队;视觉智能平台除了OCR之外,还有一些别的能力,比如分割抠图、视频理解、视觉生产等。所以相比官网阿里云文字识别(OCR)功能更广一些,而官网文字识别(OCR)做的更加基础一些,对于文字识别的能力更加集中一些。

二、开通服务

  • 2.1 阿里云页面搜索文字识别服务

image.png


image.png


  • 2.2 确认服务后开通

image.png


image.png


image.png


三、调用服务

  • 3.1 读光体验馆体验测试

    • 测试方法:选择所需的产品并在体验馆中上传测试图片或者添加URL地址进行图片解析,右侧为返回的结果。
  • 选择需要的服务

image.png

  • 传测试图片或者添加URL地址进行图片解析

image.png

  • 查看识别结果

image.png

  • 3.2 openAPI快速调试

    • 查看API接口文档获取请求参数

image.png

  • 填入参数发起调用

image.png

  • 3.3 JavaSDK调用身份证识别

    • 导入Maven依赖文件
<dependency>
  <groupId>com.aliyun</groupId>
  <artifactId>ocr_api20210707</artifactId>
  <version>1.1.3</version>
</dependency>
  • java SDK Code
import com.aliyun.ocr_api20210707.models.RecognizeIdcardResponse;
import com.aliyun.tea.TeaException;
import com.google.gson.Gson;

//印刷文字识别-身份证识别
public class RecognizeIdcardTest {

        /**
         * 使用AK&SK初始化账号Client
         *
         * @param accessKeyId
         * @param accessKeySecret
         * @return Client
         * @throws Exception
         */
        public static com.aliyun.ocr_api20210707.Client createClient(String accessKeyId, String accessKeySecret) throws Exception {
            com.aliyun.teaopenapi.models.Config config = new com.aliyun.teaopenapi.models.Config()
                    // 必填,您的 AccessKey ID
                    .setAccessKeyId(accessKeyId)
                    // 必填,您的 AccessKey Secret
                    .setAccessKeySecret(accessKeySecret);
            // 访问的域名
            config.endpoint = "ocr-api.cn-hangzhou.aliyuncs.com";
            return new com.aliyun.ocr_api20210707.Client(config);
        }

        public static void main(String[] args_) throws Exception {
            java.util.List<String> args = java.util.Arrays.asList(args_);
            // 初始化 Client,采用 AK&SK 鉴权访问的方式,此方式可能会存在泄漏风险,建议使用 STS 方式。鉴权访问方式请参考:https://help.aliyun.com/document_detail/378657.html
            // 获取 AK 链接:https://usercenter.console.aliyun.com
            com.aliyun.ocr_api20210707.Client client = RecognizeIdcardTest.createClient("AccessKeyId", "accessKeySecret");
            com.aliyun.ocr_api20210707.models.RecognizeIdcardRequest recognizeIdcardRequest = new com.aliyun.ocr_api20210707.models.RecognizeIdcardRequest()
                    .setUrl("https://img.alicdn.com/tfs/TB1q5IeXAvoK1RjSZFNXXcxMVXa-483-307.jpg");
            com.aliyun.teautil.models.RuntimeOptions runtime = new com.aliyun.teautil.models.RuntimeOptions();
            try {
                // 复制代码运行请自行打印 API 的返回值
                RecognizeIdcardResponse recognizeIdcardResponse = client.recognizeIdcardWithOptions(recognizeIdcardRequest, runtime);
                //打印返回数据
                System.out.println(new Gson().toJson(recognizeIdcardResponse));


            } catch (TeaException error) {
                // 如有需要,请打印 error
                com.aliyun.teautil.Common.assertAsString(error.message);
            } catch (Exception _error) {
                TeaException error = new TeaException(_error.getMessage(), _error);
                // 如有需要,请打印 error
                com.aliyun.teautil.Common.assertAsString(error.message);
            }
        }

}
  • 测试结果
{"headers":{"access-control-allow-origin":"*","date":"Thu, 17 Nov 2022 08:01:02 GMT","transfer-encoding":"chunked","vary":"Accept-Encoding","x-acs-request-id":"D70CEC76-7BC5-5528-A3AF-70B8B028F949","connection":"keep-alive","content-type":"application/json;charset\u003dutf-8","x-acs-trace-id":"873340aa87af04fa65ecfe6c189e282f"},"statusCode":200,"body":{"data":"{\"algo_version\":\"0122410b9bb1f2a16e432e55d491b446b16e1600\",\"data\":{\"face\":{\"algo_version\":\"0122410b9bb1f2a16e432e55d491b446b16e1600\",\"angle\":0,\"data\":{\"name\":\"方大呆\",\"sex\":\"女\",\"ethnicity\":\"汉\",\"birthDate\":\"2006年10月2日\",\"address\":\"上海市西藏南路-瞿溪路弘辉名苑\",\"idNumber\":\"371002200610020000\"},\"ftype\":0,\"height\":307,\"orgHeight\":307,\"orgWidth\":483,\"prism_keyValueInfo\":[{\"key\":\"name\",\"keyProb\":100,\"value\":\"方大呆\",\"valuePos\":[{\"x\":82,\"y\":40},{\"x\":142,\"y\":40},{\"x\":142,\"y\":60},{\"x\":82,\"y\":60}],\"valueProb\":100},{\"key\":\"sex\",\"keyProb\":100,\"value\":\"女\",\"valuePos\":[{\"x\":85,\"y\":77},{\"x\":104,\"y\":77},{\"x\":104,\"y\":96},{\"x\":85,\"y\":96}],\"valueProb\":100},{\"key\":\"ethnicity\",\"keyProb\":100,\"value\":\"汉\",\"valuePos\":[{\"x\":192,\"y\":75},{\"x\":212,\"y\":75},{\"x\":212,\"y\":95},{\"x\":192,\"y\":95}],\"valueProb\":100},{\"key\":\"birthDate\",\"keyProb\":100,\"value\":\"2006年10月2日\",\"valuePos\":[{\"x\":76,\"y\":116},{\"x\":214,\"y\":116},{\"x\":214,\"y\":131},{\"x\":76,\"y\":131}],\"valueProb\":100},{\"key\":\"address\",\"keyProb\":100,\"value\":\"上海市西藏南路-瞿溪路弘辉名苑\",\"valuePos\":[{\"x\":73,\"y\":154},{\"x\":278,\"y\":154},{\"x\":278,\"y\":196},{\"x\":73,\"y\":196}],\"valueProb\":100},{\"key\":\"idNumber\",\"keyProb\":100,\"value\":\"371002200610020000\",\"valuePos\":[{\"x\":162,\"y\":256},{\"x\":379,\"y\":256},{\"x\":379,\"y\":274},{\"x\":162,\"y\":274}],\"valueProb\":100}],\"sliceRect\":{\"x0\":0,\"y0\":0,\"x1\":482,\"y1\":0,\"x2\":483,\"y2\":307,\"x3\":0,\"y3\":307},\"width\":483}},\"height\":307,\"orgHeight\":307,\"orgWidth\":483,\"width\":483}","requestId":"D70CEC76-7BC5-5528-A3AF-70B8B028F949"}}

更多参考

新手指引
开发指南

目录
相关文章
|
2月前
|
存储 人工智能 文字识别
AI与OCR:数字档案馆图像扫描与文字识别技术实现与项目案例
本文介绍了纸质档案数字化的技术流程,包括高精度扫描、图像预处理、自动边界检测与切割、文字与图片分离抽取、档案识别与文本提取,以及识别结果的自动保存。通过去噪、增强对比度、校正倾斜等预处理技术,提高图像质量,确保OCR识别的准确性。平台还支持多字体识别、批量处理和结构化存储,实现了高效、准确的档案数字化。具体应用案例显示,该技术在江西省某地质资料档案馆中显著提升了档案管理的效率和质量。
|
6月前
|
文字识别
印刷文字识别使用问题之影响印刷体文字识别率包括哪些
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
6月前
|
文字识别 API 开发工具
印刷文字识别使用问题之如何提高OCR的识别率
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
6月前
|
文字识别 前端开发 API
印刷文字识别操作报错合集之通过HTTPS连接到OCR服务的API时报错,该如何处理
在使用印刷文字识别(OCR)服务时,可能会遇到各种错误。例如:1.Java异常、2.配置文件错误、3.服务未开通、4.HTTP错误码、5.权限问题(403 Forbidden)、6.调用拒绝(Refused)、7.智能纠错问题、8.图片质量或格式问题,以下是一些常见错误及其可能的原因和解决方案的合集。
|
5月前
|
机器学习/深度学习 文字识别 算法
百度飞桨(PaddlePaddle) - PaddleHub OCR 文字识别简单使用
百度飞桨(PaddlePaddle) - PaddleHub OCR 文字识别简单使用
354 0
|
6月前
|
存储 文字识别 算法
印刷文字识别使用问题之电商图片文字识别是否支持一次调用识别多张图片
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
6月前
|
文字识别 API
印刷文字识别使用问题之遇到个人证照识别文字识别错误,该怎么办
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
6月前
|
文字识别 Java API
印刷文字识别使用问题之如何指定调用的服务
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
6月前
|
文字识别 Java API
印刷文字识别操作报错合集之复制文字识别OCR的标注任务时出现报错,该怎么办
在使用印刷文字识别(OCR)服务时,可能会遇到各种错误。例如:1.Java异常、2.配置文件错误、3.服务未开通、4.HTTP错误码、5.权限问题(403 Forbidden)、6.调用拒绝(Refused)、7.智能纠错问题、8.图片质量或格式问题,以下是一些常见错误及其可能的原因和解决方案的合集。
|
6月前
|
人工智能 文字识别 开发工具
印刷文字识别使用问题之是否支持识别并返回文字在图片中的位置信息
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。