备案控制台

开发者社区问答正文

请问下文档智能哪个接口可以处理pdf多页图片文件？我看直接识别多页PDF上的文字好像没有。是不是可以

请问下文档智能哪个接口可以处理pdf多页图片文件？我看直接识别多页PDF上的文字好像没有。是不是可以用PDF转图片然后再用咱们的通用文字识别这样结合适用呢？

展开

收起

真的很搞笑 2023-04-11 13:44:31 222 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

ReaganYoung

值得去的地方都没有捷径

您可以使用OCR文字识别类的接口处理PDF文件，其中文档识别接口可以处理多页的PDF文件。但是，需要注意的是，如果PDF文件是扫描件或者图像文件，那么建议先使用PDF转图片接口将其转换为图片格式，然后使用通用OCR文字识别接口进行识别。

具体操作步骤为：

使用PDF转图片接口将PDF文件转换为图片格式，可以选择将其转换为JPG、PNG、BMP等格式的图片。将转换后的图片文件传递给通用OCR文字识别接口进行识别。如果PDF文件中包含多页，那么需要多次重复步骤1和步骤2以处理每一页图片。需要注意的是，使用OCR文字识别类的接口处理图片识别时，要保证图片的清晰度、亮度、对比度等因素，以便提高识别的准确率。

2023-04-18 14:15:48

赞同展开评论
芯在这

有文档智能解析的API可以实现哈 https://docmind.console.aliyun.com/service-manager，此回答整理自钉群“【官方】阿里云文档智能客户交流群”

2023-04-11 22:03:25

赞同展开评论

问答分类：

文字识别文字识别

问答标签：

PDF文字 PDF图片 PDF文件 PDF图片文件 PDF接口

问答地址：

开发者社区 > 人工智能 > 问答

相关问答

AddFile接口上传pdf文档找不到入参category

241

1

0

AddFile接口上传pdf文档会解析失败

604

3

0

文档智能接口可以识别图片、PDF、Excel、Word的内容，然后自动分析内容吗？

306

2

0

在文字识别OCR中，请教一个关于通过pdf文字识别获得文字后如何结构化整理的问题?

101

1

0

在文档智能中接口是异步的吗？

62

1

0

在文档智能中这个 PDF 转word 没法看，如何解决？

97

0

0

文字识别OCR现在有pdf识别发票的接口吗？

166

1

0

在文档智能中接口包含这个预览和标注功能吗？

90

1

0

大写PDF后缀的文件智能媒体管理是否支持预览？

296

1

0

OSS上传的pdf文件如何调整成html格式显示

213

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

阿里云双十一优惠活动开始了？2025年的是这个吗？

钉钉:因安全管控限制,16位参与人无法直接添加到日程

阿里云PAI是什么？怎么用？

如何训练属于自己的AI大模型呢？有没有大佬有相关文档参考学习下

阿里云2核2G3M适合搭建个人博客或小型项目吗？

相关文章

全新框架 Glyph 开源：用视觉理解文本，3–4 倍上下文压缩，近 5 倍推理提速！

图像与视频页面的数据提取

uTools软件安装教程及使用教程!一个跨平台的桌面效率工具!快速办公软件

为什么别人用 DevPod 秒启 DeepSeek-OCR，你还在装环境？

闲鱼API接口的术应用场景分析

还有其他疑问?