文档备案控制台

开发者社区视觉智能文字识别正文

文字识别OCR 给出来的所有识别出来的文字的坐标都是错的，要怎么解决？

文字识别OCR 给出来的所有识别出来的文字的坐标都是错的，要怎么解决？

这张图，“营业执照”这四个字的坐标如下：

按照这个坐标在原图上画框，位置是错的，如图红框

但是在线的demo里很明显看到，矫正后的图片，上面的国徽都少了半个，这个返回的坐标是不是按照矫正后的图片算的

展开

收起

嘟嘟嘟嘟嘟嘟 2024-02-06 21:28:16 565 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
要解决文字识别OCR给出的所有识别出来的文字的坐标错误的问题，可以采取以下几种方法：
1. 优化图像质量：确保输入OCR系统的图像清晰度高，对比度适中，没有模糊或扭曲，因为图像质量直接影响识别准确性。如果原始图像区域太小或模糊，可能会导致识别出的文字内容错误较多。
2. 调整识别设置：大多数OCR软件都提供了调整识别参数的选项，比如识别模式、语言、字符集等。根据文档的具体特征调整这些设置，可以提高识别的准确性。
3. 使用先进的OCR技术：考虑使用一些先进的OCR工具或服务，如EasyOCR，它使用PyTorch作为后端处理程序，支持多种语言检测，并且在准确性上更可靠。
4. 检查文字摆放方式：如果文字摆放不是横平竖直，会增加识别的难度。在这种情况下，可能需要预处理图像，比如进行旋转校正，以确保文字方向正确。
5. 利用置信度评估：一些OCR系统会提供每个识别字符的置信度评分。这个置信度可以表征识别错误的可能性。通过设置阈值过滤掉低置信度的识别结果，可以提高整体的识别准确率。
6. 后处理校验：在OCR识别后，可以采用一些文本校验算法，如拼写检查、语法检查等，来纠正可能的错误。
7. 人工复核：对于关键信息，可以增加人工复核环节，确保识别结果的准确性。
8. 技术支持：如果问题依然存在，可以联系OCR服务提供商的技术支持团队，他们可能会提供专业的解决方案或直接对问题进行调查。
9. 持续学习和优化：如果使用的是自定义OCR模型，可以通过不断收集错误样本并进行模型训练，逐步提高模型的识别准确性。
10. 多工具对比：可以尝试使用不同的OCR工具或服务进行对比，选择最适合当前文档类型的识别工具。
综上所述，通过上述方法，您应该能够有效解决OCR文字识别中的坐标错误问题，提高识别结果的准确性。
2024-02-07 14:05:14

赞同展开评论
番茄酱脑袋

校正后的图片可以通过sliceRect 的坐标获取。此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”

2024-02-06 21:54:05

赞同展开评论

问答分类：

文字识别文字识别视觉智能开放平台

问答标签：

印刷文字识别文字识别文字识别ocr 印刷文字识别文字印刷文字识别ocr 文字识别印刷文字识别文字

问答地址：

开发者社区 > 视觉智能 > 文字识别 > 问答

相关问答

印刷文字识别

文字识别OCR有没有手写离线版的图片转文字 Android版的sdk？

271

2

0

这个营业执照OCR文字识是识别成功计费吗，还是按照识别次数计费？

281

2

0

调用【身份证OCR文字】接口返回403(Forbidden)

482

0

0

在文字识别OCR中，请教一个关于通过pdf文字识别获得文字后如何结构化整理的问题?

290

1

0

在文字识别OCR中，为什么能获取紫色框的内容？但是没有绿色框的坐标。

166

1

0

你好，接入OCR精细化切题接口成功后，描述绿色框的坐标没有找到，只有紫色框的四个坐标，这是为什么？

227

1

0

在文字识别OCR中程序怎么替换图片中指定部分文字?

231

0

0

文字识别OCR 识别越南银行凭证提取凭证图片的文字调用哪个接口吗？

201

1

0

文字识别OCR 这种图片的文字能识别吗？

225

1

0

在文字识别OCR中，endpoint是统一的只有这个？

255

2

0

视觉智能

文字识别

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景，满足认证、鉴权、票据流转审核等业务需求。

我要提问

相关文章

Quishing 二维码钓鱼攻击识别技术与多层防御体系实证研究

阿里云百炼CLI最新版全功能详解与实操命令指南

AI Agent时代的流程自动化：RPA、Workflow与LLM协同架构实践

金融AI技能库：104个开源Skill即插即用

阿里云Token收费完整手册：Token Plan、Coding Plan和AI节省计划省钱方案

热门讨论

热门文章

我购买了OCR证照识别，请问在哪里看appcode呢？

身份证识别ocr，每次购买需要更换url地址吗？

为什么我们这边的文字识别OCR现在出现了发票类型识别不稳定的情况？

OCR中有接口能够识别学历证书上的，学校名称，专业，编号等信息的吗？

文字识别OCR目前有哪些情况会导致识别失败？

文字识别OCR有没有文章自然段落识别的接口呀？

OCR有没有c#调用票据识别示例？网页上面的调用不成功。难道要买了才可以调试吗？

生僻字OCR无法识别的情况怎么办？

请问有人脸识别的demo吗？

你好，我想问下，python调用接口，Sample.main() 函数，会return 文字识别的结

展开全部

阿里宜搭发布OCR文字识别插件助力合作伙伴升级

使用图像文字识别技术获取失信黑名单

【繁体图片文字识别】竖排的繁体图片文字识别翻译，竖排的繁体图片文字如何识别，竖排繁体图片识别后转横排，竖排的繁体识别比较友好的方法

文字识别OCR开源框架的对比--Tesseract vs EasyOCR

【PDF提取全自动改名】如何批量提取PDF指定区域的文字内容，用内容批量给PDF命名或者导出表格，学会全自动解放双手

分析对比大模型OCR、传统OCR和深度学习OCR

合合信息——用智能文字识别技术赋能古彝文原籍数字化

【全自动改PDF名】批量OCR识别提取PDF自定义指定区域内容保存到 Excel 以及根据PDF文件内容的标题来批量重命名

OCR文字识别技术总结（一）

【PDF提取内容改名】批量提取PDF指定区域内容重命名PDF文件，PDF自动提取内容命名的方案和详细步骤

展开全部

还有其他疑问?