开发者社区 问答 正文

请问下文档智能哪个接口可以处理pdf多页图片文件?我看直接识别多页PDF上的文字好像没有。是不是可以

请问下文档智能哪个接口可以处理pdf多页图片文件?我看直接识别多页PDF上的文字好像没有。是不是可以用PDF转图片然后再用咱们的通用文字识别这样结合适用呢?

展开
收起
真的很搞笑 2023-04-11 13:44:31 205 分享 版权
2 条回答
写回答
取消 提交回答
  • 值得去的地方都没有捷径

    您可以使用OCR文字识别类的接口处理PDF文件,其中文档识别接口可以处理多页的PDF文件。但是,需要注意的是,如果PDF文件是扫描件或者图像文件,那么建议先使用PDF转图片接口将其转换为图片格式,然后使用通用OCR文字识别接口进行识别。

    具体操作步骤为:

    使用PDF转图片接口将PDF文件转换为图片格式,可以选择将其转换为JPG、PNG、BMP等格式的图片。 将转换后的图片文件传递给通用OCR文字识别接口进行识别。 如果PDF文件中包含多页,那么需要多次重复步骤1和步骤2以处理每一页图片。 需要注意的是,使用OCR文字识别类的接口处理图片识别时,要保证图片的清晰度、亮度、对比度等因素,以便提高识别的准确率。

    2023-04-18 14:15:48
    赞同 展开评论
  • 有文档智能解析的API可以实现哈 https://docmind.console.aliyun.com/service-manager,此回答整理自钉群“【官方】阿里云文档智能客户交流群”

    2023-04-11 22:03:25
    赞同 展开评论