谈谈OCR

简介: 谈谈OCR

OCR   图形识别技术, 主要应用领域 一些 识别一些网页内容,  监控系统, 鉴别人脸,估计得上深度学习了。  我项目中用到 了 这个OCR , 结合那个OpenCV  的分析, 搞了个开源的  PaddleOCR 百度飞桨的, 识别度能达到85%左右,  对一些带干扰线的验证码, 基本识别不出来。  我们这边的应用场景是让 这个 分析页面的内容, 定位对应的元素,进行操作。就是所谓的模拟用户操作 网页。进行测试, 所谓的自动化测试。做这个, 还是要依靠大量的图片处理, 像什么  图片腐蚀,图像膨胀 , 这些都是依赖于OpenCV 来进行对图片的一些处理, 使其能更好的识别页面内容。 OpenCV这块对于Python语言编写的比较多。用Java 做图片分析的还是比较少, 不过还是有的, 毕竟提供的jar包引入, 使用起来还是比较方便的。  弄好的图片再调用PaddleOCR 将元素在元素的坐标位置 返回回来, 是否存在该页面之类的都可以做到。  这些底层的可以上paddlerOCR 官网上去看看 ,它有个开源的仓库。

https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/detection.md

其实很多数据都要通过训练才能提高准确性。

目录
相关文章
|
9月前
|
文字识别 前端开发 API
文字识别OCR常见问题之处理产品图片识别如何解决
文字识别OCR(Optical Character Recognition)技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。
173 3
|
9月前
|
文字识别 容器
文字识别OCR常见问题之本地部署如何解决
文字识别OCR(Optical Character Recognition)技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。
230 3
|
6月前
|
文字识别 PyTorch Go
从零开始的OCR之旅
本文介绍了如何配置环境并使用EasyOCR库进行OCR任务,包括安装依赖、下载必要的模型包,并提供了一个简单的使用示例。
从零开始的OCR之旅
|
7月前
|
文字识别 文件存储
印刷文字识别使用问题之如何提高并发限制
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
8月前
|
文字识别 测试技术
印刷文字识别产品使用合集之阿里云通用文字识别和文字识别有啥区别
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
9月前
|
文字识别 数据库 数据格式
印刷文字识别产品使用合集之部署失败如何解决
印刷文字识别(Optical Character Recognition, OCR)技术能够将图片、扫描文档或 PDF 中的印刷文字转化为可编辑和可搜索的数据。这项技术广泛应用于多个领域,以提高工作效率、促进信息数字化。以下是一些印刷文字识别产品使用的典型场景合集。
|
9月前
|
文字识别 API 开发工具
印刷文字识别产品使用合集之API接口无法调用如何解决
印刷文字识别(Optical Character Recognition, OCR)技术能够将图片、扫描文档或 PDF 中的印刷文字转化为可编辑和可搜索的数据。这项技术广泛应用于多个领域,以提高工作效率、促进信息数字化。以下是一些印刷文字识别产品使用的典型场景合集。
|
9月前
|
文字识别
印刷文字识别产品使用合集之OCR调用为什么会失败
印刷文字识别(Optical Character Recognition, OCR)技术能够将图片、扫描文档或 PDF 中的印刷文字转化为可编辑和可搜索的数据。这项技术广泛应用于多个领域,以提高工作效率、促进信息数字化。以下是一些印刷文字识别产品使用的典型场景合集。
|
9月前
|
机器学习/深度学习 存储 文字识别
OCR技术原理
OCR技术通过识别图像中的字符转化为可编辑文本,涉及图像获取、预处理、字符分割、特征提取、字符识别和后处理等步骤。现代OCR利用机器学习和深度学习提升识别准确性,应对各种图像质量和文本类型挑战。随着技术进步,OCR广泛应用于文档扫描、数据录入和车牌识别等领域。
|
9月前
|
文字识别 API 开发工具
文字识别OCR常见问题之本地化部署如何解决
文字识别OCR(Optical Character Recognition)技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。
211 2