开发者社区 > 视觉智能 > 文字识别 > 正文

OCR中票据凭证识别 - (增值税发票识别 || 混贴发票识别) 是否支持识别一个PDF包含多页?

问题1:OCR中票据凭证识别 - (增值税发票识别 || 混贴发票识别) 是否支持识别一个PDF包含多页(多张图片)?请问有人知道吗? 问题2:有点好奇哈,基于什么考虑的呢?既然都能识别第一张了,为什么不把剩下的都识别了。我们的情况是一个PDF里面每一页是一张增值税发票。我觉得对于这种情况应该可以满足一下,不存在费用问题(这种就按识别成功量计费)。虽然我们自己拆分PDF也不麻烦。

展开
收起
真的很搞笑 2023-06-07 16:27:41 132 0
4 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    于OCR中票据凭证识别,具体是否支持识别一个PDF包含多页(多张图片)需要根据具体的OCR技术和API接口来确定。一般来说,OCR技术可以支持识别多页PDF文档,并将每一页的图像转换为文本或结构化数据,以方便进行后续的处理和分析。不过,不同的OCR技术和API接口可能对文档格式、图像质量、分页方式等有不同的要求和限制,需要进行相应的参数设置和优化,以获得更好的识别效果和精度。

    针对您的第二个问题,具体的考虑因素可能包括以下几点:

    效率和成本因素。识别一个PDF文档包含多页可能需要更长的时间和更多的计算资源,对于OCR服务提供商来说,可能需要投入更多的成本和资源来支持这种需求。因此,一些OCR服务提供商可能会对多页PDF文档的识别进行限制或者额外收费。

    技术难度和精度问题。对于包含多张图片的PDF文档,每页的图像质量、排版方式、文字大小等可能存在较大差异,可能需要使用不同的OCR算法和参数设置来进行识别。同时,由于多张图片之间可能存在重叠、边界等问题,也可能会对识别准确率造成影响,需要进行相应的处理和优化。

    用户需求和使用场景。对于票据凭证识别这种应用场景,用户通常需要快速地识别大量的票据凭证,以进行后续的财务结算、统计分析等工作。对于一个PDF文档包含多张图片的情况,用户通常可以通过相关的工具将PDF文档拆分为单页图片进行处理,也不会对用户的使用造成较大的影响。

    2023-06-08 21:44:51
    赞同 展开评论 打赏
  • 公众号:网络技术联盟站,InfoQ签约作者,阿里云社区签约作者,华为云 云享专家,BOSS直聘 创作王者,腾讯课堂创作领航员,博客+论坛:https://www.wljslmz.cn,工程师导航:https://www.wljslmz.com

    问题1:阿里云OCR中的票据凭证识别功能支持识别一个PDF包含多页(多张图片)。您可以使用阿里云OCR中的PDF识别功能,将包含多张图片的PDF文件上传到OCR服务端进行识别。

    具体操作步骤如下:

    1. 在阿里云OCR控制台中创建一个票据凭证识别应用,并获取应用的AppCode。

    2. 在OCR应用中使用PDF识别功能,将包含多张图片的PDF文件上传到OCR服务端进行识别。

    3. OCR服务端会自动将PDF文件中的每一页转换为一张图片,并进行识别。您可以通过API接口获取每一页的识别结果。

    问题2:阿里云OCR之所以不支持自动识别一个PDF文件中的所有页面,是因为OCR服务端需要对每一页进行独立的处理和计费。如果将一个PDF文件中的所有页面合并成一张图片进行识别,可能会导致计费不准确或者出现其他问题。

    对于您提到的情况,如果每一页都是一张增值税发票,您可以使用PDF识别功能对每一页进行独立的识别,然后将结果合并起来。虽然需要手动拆分PDF文件,但是可以保证计费准确,并且可以更好地控制每一页的识别效果。

    2023-06-07 19:37:08
    赞同 展开评论 打赏
  • 从事java行业9年至今,热爱技术,热爱以博文记录日常工作,csdn博主,座右铭是:让技术不再枯燥,让每一位技术人爱上技术

    您好,阿里云文字识别OCR主要是针对单一图片内容的识别,应用场景也是致力于不断提高单一图片的识别精准度,部分业务场景的功能支持PDF文件格式的内容识别,比如您用到的混贴发票识别,目前您遇到的混贴发票识别 PDF内容识别只能识别第一页不能识别后面页内容的问题,个人还未找到官方关于是否会增加多页识别功能的通知,目前还是只能通过人工的方式来单页识别。

    2023-06-07 16:42:07
    赞同 展开评论 打赏
  • 回答1:支持PDF格式,不过只支持识别第一张 回答2:PDF格式全页识别我们有专门的文档AI产品支持,两个产品的技术方案/需求不同 对于常见的发票,支持第一页足够了(也有价格的考虑,后面的文件如果全部识别的话也是很高昂的)image.png ,此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”

    2023-06-07 16:42:03
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
对象存储实战指南-试读 立即下载
OpenAnolis 龙蜥操作系统开源社区技术创新白皮书 立即下载
使用CNFS搭建弹性Web服务 立即下载