备案控制台

开发者社区人工智能文章正文

谈谈OCR

2023-10-18 126

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 谈谈OCR

OCR 图形识别技术，主要应用领域一些识别一些网页内容，监控系统，鉴别人脸，估计得上深度学习了。我项目中用到了这个OCR ，结合那个OpenCV 的分析，搞了个开源的 PaddleOCR 百度飞桨的，识别度能达到85%左右，对一些带干扰线的验证码，基本识别不出来。我们这边的应用场景是让这个分析页面的内容，定位对应的元素，进行操作。就是所谓的模拟用户操作网页。进行测试，所谓的自动化测试。做这个，还是要依靠大量的图片处理，像什么图片腐蚀，图像膨胀，这些都是依赖于OpenCV 来进行对图片的一些处理，使其能更好的识别页面内容。 OpenCV这块对于Python语言编写的比较多。用Java 做图片分析的还是比较少，不过还是有的，毕竟提供的jar包引入，使用起来还是比较方便的。弄好的图片再调用PaddleOCR 将元素在元素的坐标位置返回回来，是否存在该页面之类的都可以做到。这些底层的可以上paddlerOCR 官网上去看看，它有个开源的仓库。

https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/detection.md

其实很多数据都要通过训练才能提高准确性。

文章标签：

文字识别

Java

计算机视觉

机器学习/深度学习

监控

Go先锋

目录

相关文章

真的很搞笑

|

9月前

|

文字识别前端开发 API

文字识别OCR常见问题之处理产品图片识别如何解决

文字识别OCR（Optical Character Recognition）技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。

真的很搞笑

173 3 3

真的很搞笑

|

9月前

|

文字识别容器

文字识别OCR常见问题之本地部署如何解决

文字识别OCR（Optical Character Recognition）技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。

真的很搞笑

230 3 3

风吹落叶花飘荡

|

6月前

|

文字识别 PyTorch Go

从零开始的OCR之旅

本文介绍了如何配置环境并使用EasyOCR库进行OCR任务，包括安装依赖、下载必要的模型包，并提供了一个简单的使用示例。

风吹落叶花飘荡

80 0 0

三分钟热度的鱼

|

7月前

|

文字识别文件存储

印刷文字识别使用问题之如何提高并发限制

印刷文字识别产品，通常称为OCR（Optical Character Recognition）技术，是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中，显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。

三分钟热度的鱼

45 0 0

三分钟热度的鱼

|

8月前

|

文字识别测试技术

印刷文字识别产品使用合集之阿里云通用文字识别和文字识别有啥区别

印刷文字识别产品，通常称为OCR（Optical Character Recognition）技术，是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中，显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。

三分钟热度的鱼

63 1 1

真的很搞笑

|

9月前

|

文字识别数据库数据格式

印刷文字识别产品使用合集之部署失败如何解决

印刷文字识别（Optical Character Recognition, OCR）技术能够将图片、扫描文档或 PDF 中的印刷文字转化为可编辑和可搜索的数据。这项技术广泛应用于多个领域，以提高工作效率、促进信息数字化。以下是一些印刷文字识别产品使用的典型场景合集。

真的很搞笑

77 7 8

真的很搞笑

|

9月前

|

文字识别 API 开发工具

印刷文字识别产品使用合集之API接口无法调用如何解决

印刷文字识别（Optical Character Recognition, OCR）技术能够将图片、扫描文档或 PDF 中的印刷文字转化为可编辑和可搜索的数据。这项技术广泛应用于多个领域，以提高工作效率、促进信息数字化。以下是一些印刷文字识别产品使用的典型场景合集。

真的很搞笑

99 6 6

真的很搞笑

|

9月前

|

文字识别

印刷文字识别产品使用合集之OCR调用为什么会失败

印刷文字识别（Optical Character Recognition, OCR）技术能够将图片、扫描文档或 PDF 中的印刷文字转化为可编辑和可搜索的数据。这项技术广泛应用于多个领域，以提高工作效率、促进信息数字化。以下是一些印刷文字识别产品使用的典型场景合集。

真的很搞笑

70 1 1

八百标兵奔北坡

|

9月前

|

机器学习/深度学习存储文字识别

OCR技术原理

OCR技术通过识别图像中的字符转化为可编辑文本，涉及图像获取、预处理、字符分割、特征提取、字符识别和后处理等步骤。现代OCR利用机器学习和深度学习提升识别准确性，应对各种图像质量和文本类型挑战。随着技术进步，OCR广泛应用于文档扫描、数据录入和车牌识别等领域。

八百标兵奔北坡

255 5 5

真的很搞笑

|

9月前

|

文字识别 API 开发工具

文字识别OCR常见问题之本地化部署如何解决

文字识别OCR（Optical Character Recognition）技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。

真的很搞笑

211 2 2

热门文章

最新文章

解决kafka集群由于默认的__consumer_offsets这个topic的默认的副本数为1而存在的单点故障问题

使用 Docker 高效搭建本地开发环境（详细教程）

如何使用java代码导出word

《Python编程从0到1》笔记1——表达式的风格（前缀、中缀、后缀）

Nginx目录文件列表显示

中移动与阿里巴巴将在四大领域展开全面战略合作

mysql 主从复制配置

google guice @inject comments

html页面中event的常见应用

微软要在年内推出IPTV平台抢占客厅市场

一级倒立摆平衡控制系统MATLAB仿真,可显示倒立摆平衡动画,对比极点配置,线性二次型,PID,PI及PD五种算法

基于SOA海鸥优化算法的三维曲面最高点搜索matlab仿真

基于PI控制的三相整流器控制系统的simulink建模与仿真,包含超级电容充电和电机

MCMS：Star 28.1k,还在为CMS系统发愁？这款开源神器让内容管理变得像搭积木一样简单！

XJ-Survey：这个让滴滴日均处理1.2亿次问卷请求的开源系统，今天终于公开了它的架构密码！

CPU can only see the threads

Java+机器学习基础：打造AI学习基础

使用 pipx 安装并执行 Python 应用程序 (1)

国产AI神器Deepseek，本地离线使用教程！

短视频创作助手 | AI剧本生成与动画创作

相关课程

更多

自然语言处理入门与实践

相关电子书

更多

OCR：图文结构理解探索和实践

阿里巴巴读光OCR

印刷文字识别算法设计与在线服务

下一篇

PAI Model Gallery 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型