问题1:OCR中票据凭证识别 - (增值税发票识别 || 混贴发票识别) 是否支持识别一个PDF包含多页(多张图片)?请问有人知道吗? 问题2:有点好奇哈,基于什么考虑的呢?既然都能识别第一张了,为什么不把剩下的都识别了。我们的情况是一个PDF里面每一页是一张增值税发票。我觉得对于这种情况应该可以满足一下,不存在费用问题(这种就按识别成功量计费)。虽然我们自己拆分PDF也不麻烦。
于OCR中票据凭证识别,具体是否支持识别一个PDF包含多页(多张图片)需要根据具体的OCR技术和API接口来确定。一般来说,OCR技术可以支持识别多页PDF文档,并将每一页的图像转换为文本或结构化数据,以方便进行后续的处理和分析。不过,不同的OCR技术和API接口可能对文档格式、图像质量、分页方式等有不同的要求和限制,需要进行相应的参数设置和优化,以获得更好的识别效果和精度。
针对您的第二个问题,具体的考虑因素可能包括以下几点:
效率和成本因素。识别一个PDF文档包含多页可能需要更长的时间和更多的计算资源,对于OCR服务提供商来说,可能需要投入更多的成本和资源来支持这种需求。因此,一些OCR服务提供商可能会对多页PDF文档的识别进行限制或者额外收费。
技术难度和精度问题。对于包含多张图片的PDF文档,每页的图像质量、排版方式、文字大小等可能存在较大差异,可能需要使用不同的OCR算法和参数设置来进行识别。同时,由于多张图片之间可能存在重叠、边界等问题,也可能会对识别准确率造成影响,需要进行相应的处理和优化。
用户需求和使用场景。对于票据凭证识别这种应用场景,用户通常需要快速地识别大量的票据凭证,以进行后续的财务结算、统计分析等工作。对于一个PDF文档包含多张图片的情况,用户通常可以通过相关的工具将PDF文档拆分为单页图片进行处理,也不会对用户的使用造成较大的影响。
问题1:阿里云OCR中的票据凭证识别功能支持识别一个PDF包含多页(多张图片)。您可以使用阿里云OCR中的PDF识别功能,将包含多张图片的PDF文件上传到OCR服务端进行识别。
具体操作步骤如下:
在阿里云OCR控制台中创建一个票据凭证识别应用,并获取应用的AppCode。
在OCR应用中使用PDF识别功能,将包含多张图片的PDF文件上传到OCR服务端进行识别。
OCR服务端会自动将PDF文件中的每一页转换为一张图片,并进行识别。您可以通过API接口获取每一页的识别结果。
问题2:阿里云OCR之所以不支持自动识别一个PDF文件中的所有页面,是因为OCR服务端需要对每一页进行独立的处理和计费。如果将一个PDF文件中的所有页面合并成一张图片进行识别,可能会导致计费不准确或者出现其他问题。
对于您提到的情况,如果每一页都是一张增值税发票,您可以使用PDF识别功能对每一页进行独立的识别,然后将结果合并起来。虽然需要手动拆分PDF文件,但是可以保证计费准确,并且可以更好地控制每一页的识别效果。
您好,阿里云文字识别OCR主要是针对单一图片内容的识别,应用场景也是致力于不断提高单一图片的识别精准度,部分业务场景的功能支持PDF文件格式的内容识别,比如您用到的混贴发票识别,目前您遇到的混贴发票识别 PDF内容识别只能识别第一页不能识别后面页内容的问题,个人还未找到官方关于是否会增加多页识别功能的通知,目前还是只能通过人工的方式来单页识别。
回答1:支持PDF格式,不过只支持识别第一张 回答2:PDF格式全页识别我们有专门的文档AI产品支持,两个产品的技术方案/需求不同 对于常见的发票,支持第一页足够了(也有价格的考虑,后面的文件如果全部识别的话也是很高昂的) ,此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。