开发者社区 > 视觉智能 > 文字识别 > 正文

文字识别OCR中其他信息会不会也出现这种情况?

使用的时候发现一个问题,如果发票里车架号换行了,换行之后的内容都识别不出来了,那么文字识别OCR中其他信息会不会也出现这种情况?这样如果车架号换行了识别的准确率基本为0了

展开
收起
陈幕白 2024-03-26 13:00:58 22 0
3 条回答
写回答
取消 提交回答
  • 虽然OCR技术普遍具备一定的版面分析和连贯文本识别能力,但遇到类似车架号换行这样的特殊情况,识别效果可能会受到影响。对于车架号这种特定格式且具有固定长度的字段,若换行导致其断裂,识别软件可能无法正确关联两部分信息,从而影响识别准确率。

    其他信息是否会同样出现识别问题,取决于信息的类型、格式以及OCR系统的特异性处理能力:

    • 标准格式文本:如日期、金额、税率等,通常有固定的模式和位置,OCR系统可能针对这些常见字段进行了优化,即使换行,也可能通过上下文逻辑或规则匹配进行恢复。
    • 非标准文本:如商品描述、备注等自由格式文本,换行对其识别影响相对较小,因为这些信息本身就有自然语言的连贯性,OCR系统可以通过词汇、语法分析来连接断开的文本。
    • 特定格式标识符:如条形码、二维码等,只要整体图案完整且清晰,即使跨行,专用的识别算法也能准确识别。

    虽然车架号换行导致的识别问题较为明显,但对于其他信息,识别准确率并不一定会大幅降低。不过,具体情况还需参考所使用的OCR系统的特性和针对复杂布局文档的处理能力。

    2024-03-26 15:12:45
    赞同 展开评论 打赏
  • 从事java行业8年至今,热爱技术,热爱以博文记录日常工作,csdn博主,座右铭是:让技术不再枯燥,让每一位技术人爱上技术

    您好,目前文字识别的机动车统一销售发票识别对于车辆识别代号/车架号码 vinCode 的识别还是单行的,换行的部分暂时无法识别。官方提供的示例如图
    image.png
    正常情况下这个车架号码应该都是单行的吧,对于换行的车架号码您可以加入官方钉钉群:35208328(【官方】阿里云OCR公共云客户交流群)咨询一下后续的优化计划。其他关于机动车统一销售发票识别的内容可以参考文档:文档

    2024-03-26 14:39:52
    赞同 展开评论 打赏
  • 双行检测后续会进行优化,请耐心等待。此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”

    2024-03-26 13:10:35
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载