请问下文档智能哪个接口可以处理pdf多页图片文件?我看直接识别多页PDF上的文字好像没有。是不是可以用PDF转图片然后再用咱们的通用文字识别这样结合适用呢?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
您可以使用OCR文字识别类的接口处理PDF文件,其中文档识别接口可以处理多页的PDF文件。但是,需要注意的是,如果PDF文件是扫描件或者图像文件,那么建议先使用PDF转图片接口将其转换为图片格式,然后使用通用OCR文字识别接口进行识别。
具体操作步骤为:
使用PDF转图片接口将PDF文件转换为图片格式,可以选择将其转换为JPG、PNG、BMP等格式的图片。 将转换后的图片文件传递给通用OCR文字识别接口进行识别。 如果PDF文件中包含多页,那么需要多次重复步骤1和步骤2以处理每一页图片。 需要注意的是,使用OCR文字识别类的接口处理图片识别时,要保证图片的清晰度、亮度、对比度等因素,以便提高识别的准确率。
有文档智能解析的API可以实现哈 https://docmind.console.aliyun.com/service-manager,此回答整理自钉群“【官方】阿里云文档智能客户交流群”