谈谈OCR

简介: 谈谈OCR

OCR   图形识别技术, 主要应用领域 一些 识别一些网页内容,  监控系统, 鉴别人脸,估计得上深度学习了。  我项目中用到 了 这个OCR , 结合那个OpenCV  的分析, 搞了个开源的  PaddleOCR 百度飞桨的, 识别度能达到85%左右,  对一些带干扰线的验证码, 基本识别不出来。  我们这边的应用场景是让 这个 分析页面的内容, 定位对应的元素,进行操作。就是所谓的模拟用户操作 网页。进行测试, 所谓的自动化测试。做这个, 还是要依靠大量的图片处理, 像什么  图片腐蚀,图像膨胀 , 这些都是依赖于OpenCV 来进行对图片的一些处理, 使其能更好的识别页面内容。 OpenCV这块对于Python语言编写的比较多。用Java 做图片分析的还是比较少, 不过还是有的, 毕竟提供的jar包引入, 使用起来还是比较方便的。  弄好的图片再调用PaddleOCR 将元素在元素的坐标位置 返回回来, 是否存在该页面之类的都可以做到。  这些底层的可以上paddlerOCR 官网上去看看 ,它有个开源的仓库。

https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/detection.md

其实很多数据都要通过训练才能提高准确性。

目录
相关文章
|
5月前
|
文字识别 容器
文字识别OCR常见问题之本地部署如何解决
文字识别OCR(Optical Character Recognition)技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。
185 3
|
5月前
|
文字识别 前端开发 API
文字识别OCR常见问题之处理产品图片识别如何解决
文字识别OCR(Optical Character Recognition)技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。
|
机器学习/深度学习 编解码 文字识别
一个很早期的ocr归纳
19的文章同步过来。
|
2月前
|
文字识别 PyTorch Go
从零开始的OCR之旅
本文介绍了如何配置环境并使用EasyOCR库进行OCR任务,包括安装依赖、下载必要的模型包,并提供了一个简单的使用示例。
从零开始的OCR之旅
|
3月前
|
文字识别 API
印刷文字识别操作报错合集之遇到“unmatchedImageType”错误,该如何解决
在使用印刷文字识别(OCR)服务时,可能会遇到各种错误。例如:1.Java异常、2.配置文件错误、3.服务未开通、4.HTTP错误码、5.权限问题(403 Forbidden)、6.调用拒绝(Refused)、7.智能纠错问题、8.图片质量或格式问题,以下是一些常见错误及其可能的原因和解决方案的合集。
|
4月前
|
JSON 文字识别 API
印刷文字识别操作报错合集之在识别过程中报错403,是什么原因
在使用印刷文字识别(OCR)服务时,可能会遇到各种错误。例如:1.Java异常、2.配置文件错误、3.服务未开通、4.HTTP错误码、5.权限问题(403 Forbidden)、6.调用拒绝(Refused)、7.智能纠错问题、8.图片质量或格式问题,以下是一些常见错误及其可能的原因和解决方案的合集。
|
4月前
|
JSON 文字识别 API
印刷文字识别操作报错合集之识别过程中,报错464是什么原因
在使用印刷文字识别(OCR)服务时,可能会遇到各种错误。例如:1.Java异常、2.配置文件错误、3.服务未开通、4.HTTP错误码、5.权限问题(403 Forbidden)、6.调用拒绝(Refused)、7.智能纠错问题、8.图片质量或格式问题,以下是一些常见错误及其可能的原因和解决方案的合集。
|
4月前
|
文字识别 API PHP
印刷文字识别操作报错合集之识别过程中,报错463是什么原因
在使用印刷文字识别(OCR)服务时,可能会遇到各种错误。例如:1.Java异常、2.配置文件错误、3.服务未开通、4.HTTP错误码、5.权限问题(403 Forbidden)、6.调用拒绝(Refused)、7.智能纠错问题、8.图片质量或格式问题,以下是一些常见错误及其可能的原因和解决方案的合集。
|
5月前
|
机器学习/深度学习 存储 文字识别
OCR技术原理
OCR技术通过识别图像中的字符转化为可编辑文本,涉及图像获取、预处理、字符分割、特征提取、字符识别和后处理等步骤。现代OCR利用机器学习和深度学习提升识别准确性,应对各种图像质量和文本类型挑战。随着技术进步,OCR广泛应用于文档扫描、数据录入和车牌识别等领域。
|
5月前
|
文字识别
文字识别OCR常见问题之图片识别不出来如何解决
文字识别OCR(Optical Character Recognition)技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。
115 2