旷视Face++人工智能开放平台上线自定义模板文字识别功能 实用教程看这里

本文涉及的产品
OCR统一识别,每月200次
文档理解,免费额度 各100页
教育场景识别,教育场景识别 200次/月
简介: 传统OCR对于没有制作对应模板的票据、卡证只能按行返回识别结果,因此容易产生误识与格式错误,增加了数据录入与处理的难度。为了破解传统OCR识别与卡证识别的困局,Face++人工智能开放平台上线自定义模板文字识别功能,通过自助的模板制作,生成识别规则,配合自动分类功能,实现自动化、便捷化的数据获取与录入。

传统OCR对于没有制作对应模板的票据、卡证只能按行返回识别结果,因此容易产生误识与格式错误,增加了数据录入与处理的难度;而单一的卡证识别只能获得某一类型的识别结果。为了破解传统OCR识别与卡证识别的困局,Face++人工智能开放平台上线自定义模板文字识别功能,通过自助的模板制作,生成识别规则,配合自动分类功能,实现自动化、便捷化的数据获取与录入。

自定义文字模版功能

Face++平台的自定义模板文字识别,提供高精度、普适的格式化文本识别服务,支持各类票据、文书、卡证等识别。用户通过简单的标注创建专属自己的模板后,便可通过API接口批量识别同类图片内容信息,获得定义好的输出结果,满足用户的个性化OCR需求。自定义模板文字识别功能在传统卡证审核、信息录入等行业应用广泛,大幅度降低了人力和时间成本,帮助带来更高效和优质的服务。

技术亮点

1、无需设置识别域参考点

现有的OCR技术必须通过设置参考点、辅助线找到字段位置。而Face++人工智能开放平台提供的业内独家技术无需手动设置参考点,简化了模板制作步骤,上手更容易更省时。

2、有效应对任意角度图片

通常我们在上传待识别图片时,必须手动调整图片角度,费时费力。而Face++人工智能开放平台的算法能针对各角度图片自适应,支持任意旋转的图片识别与同等优质的结果输出,节省上传时间,从细节处优化用户体验。

3、多种模板识别能力突出

Face++人工智能开放平台算法支持多类型票据、文书、卡证等识别,其中北京社保卡、顺丰快递单、电子发票识别效果尤为突出。

功能演示

1、在批量识别同一类型的卡证之前,首先您需要制作一个通用模板。在官网技术能力“自定义模板文字识别”页面中点击“立即体验”,即可进入制作页面。


2、进入模板制作页,点击“新建模板”。

图注:演示人员为虚假身份

3、选择您希望识别的类型(此处以识别北京社保卡为例),进入制作页面。

除了推荐模板,您还可以通过“空白模板”建立您需要识别的模板类型。只需上传一张图片作为示例,即可同样进入制作页面。

4、进入社保卡模板制作页面,选取识别域。

什么是识别域呢?通俗来讲,指需要识别的字段,例如图中被选中的字段“乐乐”、“女”、“汉”、“199934日”、“210204199903045789”、“122510100000”。

如果您还希望识别图片上的更多字段,比如文字信息“社会保障号码”,只需选中该部分即可创建一个新识别域(如下图)。如果不小心勾选错误,可以直接删除。

当您创建完成后,务必填写右侧的“字段名称”及“字段类型”。“字段名称”是为了区分每个字段代表的含义,“字段类型”是为了定义字段的属性范围,给予算法指示。显然,您既定的范围越精细,算法得到的指示就越清晰,识别准确率也就越高。

如果您未找到合适的字段类型,还可以自由创建:

请注意:新建字段类型相当于由您制定的一套新规则,因此返回的识别结果也间接由您限定。假设您需要识别员工卡号,那么您需要在“字段值”处提供所有员工卡号,保障返回的结果是其中一个数字,否则结果将为空值或返回错误。

如果您无法判断字段的属性,选择“常规”类型即可。填好信息后如图:

5、完成这一步,点击“发布模板”,您已经成功建立一个专属模板。

6、回到模板界面,点击“测试模板”开始进行测试。

7、上传图片测试效果,仅支持jpg, jpeg, png, bmp格式,不支持PDF等格式。同时建议您尽量上传清晰、背景干净、角度端正的图片。测试结果如图:

如果您在测试过程中遇到任何识别问题,欢迎通过Face++人工智能开放平台在线智能客服提交反馈!

8、现在,您可以根据API文档指示进行批量调用啦。

相关文章
|
3月前
|
文字识别 算法
印刷文字识别产品使用合集之开通了阿里云发票识别验真功能,其他人可以调用我的这个接口吗
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
18天前
|
机器学习/深度学习 文字识别 前端开发
基于 Spring Boot 3.3 + OCR 实现图片转文字功能
【8月更文挑战第30天】在当今数字化信息时代,图像中的文字信息越来越重要。无论是文档扫描、名片识别,还是车辆牌照识别,OCR(Optical Character Recognition,光学字符识别)技术都发挥着关键作用。本文将围绕如何使用Spring Boot 3.3结合OCR技术,实现图片转文字的功能,分享工作学习中的技术干货。
45 2
|
2月前
|
文字识别 Java API
印刷文字识别使用问题之发票凭证识别功能是否可以对接ERP系统
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
2月前
|
机器学习/深度学习 人工智能 分布式计算
人工智能平台PAI使用问题之部署时是否可以自定义资源的区域
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
2月前
|
文字识别 API
印刷文字识别使用问题之如何进行自定义KV模版的操作
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
2月前
|
文字识别
印刷文字识别使用问题之自定义模板功能在什么地方
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
2月前
|
文字识别 自然语言处理 算法
印刷文字识别使用问题之如何选择模板
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
2月前
|
文字识别 API 开发工具
印刷文字识别使用问题之自定义识别无法识别名字是什么原因
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
3月前
|
机器学习/深度学习 数据采集 人工智能
人工智能:构建自定义机器学习模型的步骤与技巧
【6月更文挑战第25天】构建自定义机器学习模型涉及明确问题、数据收集预处理、特征工程、模型选择训练、评估优化及部署监控。关键技巧包括选择适配的算法、重视数据预处理、精巧的特征工程、有效评估优化和适时的模型更新。通过这些步骤和技巧,可提升模型性能与泛化能力。
|
3月前
|
文字识别 自然语言处理 开发工具
印刷文字识别产品使用合集之OCR统一识别功能已开通,响应为200但没有content信息,是什么原因
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。