OCR中票据凭证识别 - （增值税发票识别 || 混贴发票识别）是否支持识别一个PDF包含多页？

问题1:OCR中票据凭证识别 - （增值税发票识别 || 混贴发票识别）是否支持识别一个PDF包含多页（多张图片）？请问有人知道吗？问题2:有点好奇哈，基于什么考虑的呢？既然都能识别第一张了，为什么不把剩下的都识别了。我们的情况是一个PDF里面每一页是一张增值税发票。我觉得对于这种情况应该可以满足一下，不存在费用问题（这种就按识别成功量计费）。虽然我们自己拆分PDF也不麻烦。

展开

收起

真的很搞笑 2023-06-07 16:27:41 355 版权

4 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

于OCR中票据凭证识别，具体是否支持识别一个PDF包含多页（多张图片）需要根据具体的OCR技术和API接口来确定。一般来说，OCR技术可以支持识别多页PDF文档，并将每一页的图像转换为文本或结构化数据，以方便进行后续的处理和分析。不过，不同的OCR技术和API接口可能对文档格式、图像质量、分页方式等有不同的要求和限制，需要进行相应的参数设置和优化，以获得更好的识别效果和精度。

针对您的第二个问题，具体的考虑因素可能包括以下几点：

效率和成本因素。识别一个PDF文档包含多页可能需要更长的时间和更多的计算资源，对于OCR服务提供商来说，可能需要投入更多的成本和资源来支持这种需求。因此，一些OCR服务提供商可能会对多页PDF文档的识别进行限制或者额外收费。

技术难度和精度问题。对于包含多张图片的PDF文档，每页的图像质量、排版方式、文字大小等可能存在较大差异，可能需要使用不同的OCR算法和参数设置来进行识别。同时，由于多张图片之间可能存在重叠、边界等问题，也可能会对识别准确率造成影响，需要进行相应的处理和优化。

用户需求和使用场景。对于票据凭证识别这种应用场景，用户通常需要快速地识别大量的票据凭证，以进行后续的财务结算、统计分析等工作。对于一个PDF文档包含多张图片的情况，用户通常可以通过相关的工具将PDF文档拆分为单页图片进行处理，也不会对用户的使用造成较大的影响。

2023-06-08 21:44:51

赞同展开评论
wljslmz

公众号：网络技术联盟站，InfoQ签约作者，阿里云社区签约作者，华为云云享专家，BOSS直聘创作王者，腾讯课堂创作领航员，博客+论坛：https://www.wljslmz.cn，工程师导航：https://www.wljslmz.com
问题1：阿里云OCR中的票据凭证识别功能支持识别一个PDF包含多页（多张图片）。您可以使用阿里云OCR中的PDF识别功能，将包含多张图片的PDF文件上传到OCR服务端进行识别。

具体操作步骤如下：
1. 在阿里云OCR控制台中创建一个票据凭证识别应用，并获取应用的AppCode。
2. 在OCR应用中使用PDF识别功能，将包含多张图片的PDF文件上传到OCR服务端进行识别。
3. OCR服务端会自动将PDF文件中的每一页转换为一张图片，并进行识别。您可以通过API接口获取每一页的识别结果。
问题2：阿里云OCR之所以不支持自动识别一个PDF文件中的所有页面，是因为OCR服务端需要对每一页进行独立的处理和计费。如果将一个PDF文件中的所有页面合并成一张图片进行识别，可能会导致计费不准确或者出现其他问题。

对于您提到的情况，如果每一页都是一张增值税发票，您可以使用PDF识别功能对每一页进行独立的识别，然后将结果合并起来。虽然需要手动拆分PDF文件，但是可以保证计费准确，并且可以更好地控制每一页的识别效果。
2023-06-07 19:37:08

赞同展开评论
六月的雨在钉钉

从事java行业9年至今，热爱技术，热爱以博文记录日常工作，csdn博主，座右铭是：让技术不再枯燥，让每一位技术人爱上技术

您好，阿里云文字识别OCR主要是针对单一图片内容的识别，应用场景也是致力于不断提高单一图片的识别精准度，部分业务场景的功能支持PDF文件格式的内容识别，比如您用到的混贴发票识别，目前您遇到的混贴发票识别 PDF内容识别只能识别第一页不能识别后面页内容的问题，个人还未找到官方关于是否会增加多页识别功能的通知，目前还是只能通过人工的方式来单页识别。

2023-06-07 16:42:07

赞同展开评论
芯在这

回答1:支持PDF格式，不过只支持识别第一张回答2:PDF格式全页识别我们有专门的文档AI产品支持，两个产品的技术方案/需求不同对于常见的发票，支持第一页足够了（也有价格的考虑，后面的文件如果全部识别的话也是很高昂的），此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”

2023-06-07 16:42:03

赞同展开评论

OCR中票据凭证识别 - （增值税发票识别 || 混贴发票识别）是否支持识别一个PDF包含多页？

文字识别

相关文章

热门讨论

热门文章

OCR中票据凭证识别 - （增值税发票识别 || 混贴发票识别） 是否支持识别一个PDF包含多页？

文字识别

相关文章

热门讨论

热门文章

OCR中票据凭证识别 - （增值税发票识别 || 混贴发票识别）是否支持识别一个PDF包含多页？