开发者社区 > 视觉智能 > 文字识别 > 正文

文字识别OCR 给出来的所有识别出来的文字的坐标都是错的,要怎么解决?

文字识别OCR 给出来的所有识别出来的文字的坐标都是错的,要怎么解决?
95b32d0a1dac8ae1f679bf48e72a2c73.jpg
这张图,“营业执照”这四个字的坐标如下:
4606fd85919433706c98c785cbeca6bd.png
按照这个坐标在原图上画框,位置是错的,如图红框
4df8c0274fd2bb56dc02d715a01fd031.png
但是在线的demo里很明显看到,矫正后的图片,上面的国徽都少了半个,这个返回的坐标是不是按照矫正后的图片算的
1654f94ff9e68db5359f3f2de45ad6db.png

展开
收起
嘟嘟嘟嘟嘟嘟 2024-02-06 21:28:16 97 0
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    要解决文字识别OCR给出的所有识别出来的文字的坐标错误的问题,可以采取以下几种方法:

    1. 优化图像质量:确保输入OCR系统的图像清晰度高,对比度适中,没有模糊或扭曲,因为图像质量直接影响识别准确性。如果原始图像区域太小或模糊,可能会导致识别出的文字内容错误较多。
    2. 调整识别设置:大多数OCR软件都提供了调整识别参数的选项,比如识别模式、语言、字符集等。根据文档的具体特征调整这些设置,可以提高识别的准确性。
    3. 使用先进的OCR技术:考虑使用一些先进的OCR工具或服务,如EasyOCR,它使用PyTorch作为后端处理程序,支持多种语言检测,并且在准确性上更可靠。
    4. 检查文字摆放方式:如果文字摆放不是横平竖直,会增加识别的难度。在这种情况下,可能需要预处理图像,比如进行旋转校正,以确保文字方向正确。
    5. 利用置信度评估:一些OCR系统会提供每个识别字符的置信度评分。这个置信度可以表征识别错误的可能性。通过设置阈值过滤掉低置信度的识别结果,可以提高整体的识别准确率。
    6. 后处理校验:在OCR识别后,可以采用一些文本校验算法,如拼写检查、语法检查等,来纠正可能的错误。
    7. 人工复核:对于关键信息,可以增加人工复核环节,确保识别结果的准确性。
    8. 技术支持:如果问题依然存在,可以联系OCR服务提供商的技术支持团队,他们可能会提供专业的解决方案或直接对问题进行调查。
    9. 持续学习和优化:如果使用的是自定义OCR模型,可以通过不断收集错误样本并进行模型训练,逐步提高模型的识别准确性。
    10. 多工具对比:可以尝试使用不同的OCR工具或服务进行对比,选择最适合当前文档类型的识别工具。

    综上所述,通过上述方法,您应该能够有效解决OCR文字识别中的坐标错误问题,提高识别结果的准确性。

    2024-02-07 14:05:14
    赞同 展开评论 打赏
  • 校正后的图片可以通过sliceRect 的坐标获取。此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”

    2024-02-06 21:54:05
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载