备案控制台

开发者社区 > 视觉智能 > 文字识别 > 正文

文字识别OCR 给出来的所有识别出来的文字的坐标都是错的，要怎么解决？

文字识别OCR 给出来的所有识别出来的文字的坐标都是错的，要怎么解决？

这张图，“营业执照”这四个字的坐标如下：

按照这个坐标在原图上画框，位置是错的，如图红框

但是在线的demo里很明显看到，矫正后的图片，上面的国徽都少了半个，这个返回的坐标是不是按照矫正后的图片算的

展开

收起

嘟嘟嘟嘟嘟嘟 2024-02-06 21:28:16 100 0

2 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
要解决文字识别OCR给出的所有识别出来的文字的坐标错误的问题，可以采取以下几种方法：
1. 优化图像质量：确保输入OCR系统的图像清晰度高，对比度适中，没有模糊或扭曲，因为图像质量直接影响识别准确性。如果原始图像区域太小或模糊，可能会导致识别出的文字内容错误较多。
2. 调整识别设置：大多数OCR软件都提供了调整识别参数的选项，比如识别模式、语言、字符集等。根据文档的具体特征调整这些设置，可以提高识别的准确性。
3. 使用先进的OCR技术：考虑使用一些先进的OCR工具或服务，如EasyOCR，它使用PyTorch作为后端处理程序，支持多种语言检测，并且在准确性上更可靠。
4. 检查文字摆放方式：如果文字摆放不是横平竖直，会增加识别的难度。在这种情况下，可能需要预处理图像，比如进行旋转校正，以确保文字方向正确。
5. 利用置信度评估：一些OCR系统会提供每个识别字符的置信度评分。这个置信度可以表征识别错误的可能性。通过设置阈值过滤掉低置信度的识别结果，可以提高整体的识别准确率。
6. 后处理校验：在OCR识别后，可以采用一些文本校验算法，如拼写检查、语法检查等，来纠正可能的错误。
7. 人工复核：对于关键信息，可以增加人工复核环节，确保识别结果的准确性。
8. 技术支持：如果问题依然存在，可以联系OCR服务提供商的技术支持团队，他们可能会提供专业的解决方案或直接对问题进行调查。
9. 持续学习和优化：如果使用的是自定义OCR模型，可以通过不断收集错误样本并进行模型训练，逐步提高模型的识别准确性。
10. 多工具对比：可以尝试使用不同的OCR工具或服务进行对比，选择最适合当前文档类型的识别工具。
综上所述，通过上述方法，您应该能够有效解决OCR文字识别中的坐标错误问题，提高识别结果的准确性。
2024-02-07 14:05:14

赞同展开评论打赏
番茄酱脑袋

校正后的图片可以通过sliceRect 的坐标获取。此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”

2024-02-06 21:54:05

赞同展开评论打赏

问答分类：

文字识别文字识别

问答标签：

印刷文字识别文字识别文字识别ocr 印刷文字识别ocr 印刷文字识别文字文字识别印刷文字识别文字

问答地址：

开发者社区 > 视觉智能 > 文字识别 > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

印刷文字识别

文字识别OCR，名片文字识别，可以按使用量付费吗？

26

2

0

文字识别OCR什么时候能支持这类发票？

57

2

0

文字识别OCR之前用的测试版没有问题，现在购买了共享资源包1W点再去识别为啥提示403？

23

2

0

文字识别OCR身份证接口直接用余额可以吗？而且显示有赠送次数。

30

2

0

文字识别OCR如果是excel图片，如何让OCR识别出来的内容按行输出呢？

69

2

0

文字识别OCR异步OCR支持指定线程池吗？

38

1

0

在文字识别OCR中，体验工具哪里可以去除水印？

54

2

0

在文字识别OCR中，带有水印的pdf解析应该使用哪个产品？

33

3

0

文字识别OCR使用混贴接口，请求体的形式是form—data，此时附件的参数名应该是啥？

33

1

0

文字识别OCR PDF里面有多张发票的话，可以全部识别嘛？

30

2

0

视觉智能

文字识别

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景，满足认证、鉴权、票据流转审核等业务需求。

我要提问

热门讨论

热门文章

文字识别OCR ALIBABA_CLOUD_ACCESS_KEY_ID在哪里查看？

文字识别OCR识别失败是因为什么？报错 code 464

在文字识别OCR为什么模型的准确率会这么低的？有什么办法能提高吗？

文字识别OCR中464是什么意思？

文字识别OCR接口中的accessKeyId、accessKeySecret在哪里获取？

文字识别OCR里问一下access_key_id和access_key_secret是在哪里获取的？

文字识别OCR怎么做作业&试卷的自动批改？

文字识别OCR能否识别checkbox的勾选状态？

OCR发票识别不到？

文字识别OCR 教育场景识别，如何分别提取出试卷的题目和选项呢？

展开全部

OCR文字识别技术总结（一）

阿里云文字识别（OCR）服务 Quick Start

一个基于C#开发的轻量级OCR文字识别开源工具

印刷文字识别操作报错合集之在识别过程中报错403，是什么原因

印刷文字识别操作报错合集之API调用过程中报错469，是什么导致的

印刷文字识别使用问题之如何进行私有化部署

OCR文字识别方法综述

JavaCV不到十行代码实现图片OCR文字识别

印刷文字操作报错合集之出现“图片和服务类型不匹配”，该怎么解决

OCR文字识别技术总结（二）

展开全部

相关电子书

更多

阿里云智能-印刷文字识别OCR-产品介绍 立即下载

阿里巴巴读光OCR 立即下载

印刷文字识别算法设计与在线服务 立即下载

相关实验场景

更多