文字识别OCR新上线的 单证票据信息抽取 跟原来的 表格信息抽取 的区别是什么?

文字识别OCR新上线的 单证票据信息抽取 跟原来的 表格信息抽取 的区别是什么?我试了一下,这个标注的时候会有个 目标区域lQLPJw7DtTIVEk_NAqvNCS2wyaexXz_X0T0Gp-0RJ9a2AA_2349_683.png

展开
收起
三分钟热度的鱼 2024-08-21 19:18:24 72 分享 版权
3 条回答
写回答
取消 提交回答
  • 资深 C++与人工智能程序员。精通 C++,善用其特性构建稳健架构。在人工智能领域,深入研习机器学习算法,借 C++与 OpenCV 等实现计算机视觉应用,于自然语言处理构建文本处理引擎。以敏锐洞察探索技术融合边界,用代码塑造智能未来。

    文字识别OCR中的单证票据信息抽取与表格信息抽取存在多方面区别:

    适用对象

    • 单证票据信息抽取:主要针对各种单证、票据,如增值税发票、定额发票、机打发票、火车票、船票、报关单据、国际发票、箱单、海运单、空运单、合同等,这些单证票据格式相对固定,但内容和版式细节各有不同.
    • 表格信息抽取:适用于各类表格,包括有框、无框、半线表格等,其版式相对固定,但表头、行列数量和内容等可能存在差异,如财务报表、统计表格、问卷调查表等.

    抽取方式

    • 单证票据信息抽取:通常需逐行标注数据,按照单证票据上的信息排列顺序,依次对每行的关键信息进行提取和标注,以获取如发票代码、发票号码、开票日期、金额等具体内容.
    • 表格信息抽取:可根据表格特点选择整块标注或按行列标注。对于结构简单、行列规律的表格,整块标注可提高效率;对于复杂表格,按行列标注更能准确提取信息.

    数据结构化程度

    • 单证票据信息抽取:更强调将抽取的信息转化为高度结构化的数据,以键值对(K:V)形式呈现,如“发票号码:123456789”,便于直接查询和管理,可与企业的ERP、CRM等系统无缝结合,实现信息的快速流转和自动化处理.
    • 表格信息抽取:除了将表格内容转换为可编辑的表格格式数据外,也可根据用户需求进行一定程度的结构化处理,但相对而言,其数据结构化程度可能不如单证票据信息抽取高,有时需进一步整理和转换才能满足特定业务需求.

    对模型的要求

    • 单证票据信息抽取:由于单证票据种类繁多、版式细节差异大,要求模型具有更强的泛化能力和对不同版式的适应能力,能够准确识别各种票据上的关键信息,即使在票据存在一定程度的变形、模糊或噪声干扰等情况下,也能保证较高的抽取准确率.
    • 表格信息抽取:模型需重点关注表格的结构和内容识别,对表格的行列规律、表头与内容的对应关系等有较好的理解和把握,在处理不同版式表格时,能够通过学习和训练,快速适应并准确抽取表格中的信息.

    应用场景

    • 单证票据信息抽取:广泛应用于财务、金融、物流、国际贸易等领域,可实现票据的自动化审核、数据录入和信息管理,提高工作效率,降低人工成本,减少错误率,如银行的票据审核、企业的财务报销等.
    • 表格信息抽取:在数据统计、分析、报表生成等场景中应用较多,可将纸质表格快速转换为电子表格,方便进行数据处理和分析,如市场调研数据的整理、企业财务报表的编制等.
    2024-12-28 23:26:18
    赞同 展开评论
  • 从事java行业9年至今,热爱技术,热爱以博文记录日常工作,csdn博主,座右铭是:让技术不再枯燥,让每一位技术人爱上技术

    您好,文字识别OCR的单据票证信息抽取可对版式相对固定的单据、证件、凭证等类型数据有较好的效果
    image.png
    详细内容参考文档:https://help.aliyun.com/zh/ocr/product-overview/ticket-and-invoice-information-extraction?spm=a2c4g.11186623.0.0.78fa17e0PXQXQx
    表格信息抽取可对版式相对固定的表格、表单的等类型数据有较好的效果
    image.png
    这两个能力针对的场景不同,关于表格信息抽取详细内容参考文档:https://help.aliyun.com/zh/ocr/product-overview/table-information-extraction?spm=a2c4g.11186623.0.0.342e4069hbd5eU

    2024-08-21 21:26:01
    赞同 5 展开评论
  • 目标区域不需要标注,单证票据模型功能近期会下线,不建议使用 。此回答整理自钉群“【官方】阿里云OCR文档自学习用户答疑群”

    2024-08-21 20:27:55
    赞同 5 展开评论

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

热门讨论

热门文章

还有其他疑问?
咨询AI助理