为什么我用多边型选框的时候 文字识别OCR就不识别框内文字了呢?

为什么我用多边型选框的时候 文字识别OCR就不识别框内文字了呢?01a189bca44a633e15c9c92d92f96746.png

展开
收起
三分钟热度的鱼 2024-04-17 19:00:05 81 分享 版权
阿里云 AI 助理回答

在使用多边形选框时,文字识别OCR无法识别框内文字的原因可能与以下几个因素有关:

  1. 多边形标注工具的限制
    根据知识库资料,「多边形标注」工具暂不支持预识别功能,您需要手动输入识别结果到识别框内。这意味着,使用多边形选框时,系统不会自动对框内文字进行识别,而是依赖用户手动填写内容。因此,如果您未手动输入识别结果,框内文字将不会被识别。

  2. 标注框的贴合度和规范性
    在使用多边形选框时,标注框的贴合度对识别效果有直接影响。如果标注框未能紧密贴合待识别文字,尤其是文字倾斜或不规则的情况下,可能导致识别失败。建议确保标注框尽可能贴合文字区域,并避免跨行或包含无关内容。

  3. 图片质量和文字特征
    文字识别的效果还受到图片质量和文字特征的影响。如果图片清晰度不足、文字过小(小于10像素)或过大(超过50像素),或者图片存在反光、模糊等问题,可能导致识别失败。此外,单张图片的最长边不应超过8192像素,最短边不应小于15像素,长宽比应控制在50:1以内。

  4. 字段类型和高级配置
    在配置识别字段时,需要正确选择字段类型和高级配置以提高识别准确率。如果字段类型选择不当或未进行必要的高级配置(如日期归一化、金额提取等),可能导致识别失败。请确保为每个识别字段正确设置字段名、Value值、字段类型及高级配置。

解决方法

  • 如果使用多边形选框,请确保手动输入识别结果,因为该工具暂不支持自动预识别。
  • 检查标注框是否紧密贴合文字区域,避免跨行或包含无关内容。
  • 确保图片质量符合要求,文字大小适中且清晰可见。
  • 正确配置字段类型和高级选项,以优化识别效果。

通过以上调整,您可以有效解决多边形选框无法识别框内文字的问题。如果问题仍然存在,建议联系技术支持团队进一步排查。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

热门讨论

热门文章

还有其他疑问?
咨询AI助理