文档备案控制台

开发者社区问答正文

请问下文档智能哪个接口可以处理pdf多页图片文件？我看直接识别多页PDF上的文字好像没有。是不是可以

请问下文档智能哪个接口可以处理pdf多页图片文件？我看直接识别多页PDF上的文字好像没有。是不是可以用PDF转图片然后再用咱们的通用文字识别这样结合适用呢？

展开

收起

真的很搞笑 2023-04-11 13:44:31 265 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

ReaganYoung

值得去的地方都没有捷径

您可以使用OCR文字识别类的接口处理PDF文件，其中文档识别接口可以处理多页的PDF文件。但是，需要注意的是，如果PDF文件是扫描件或者图像文件，那么建议先使用PDF转图片接口将其转换为图片格式，然后使用通用OCR文字识别接口进行识别。

具体操作步骤为：

使用PDF转图片接口将PDF文件转换为图片格式，可以选择将其转换为JPG、PNG、BMP等格式的图片。将转换后的图片文件传递给通用OCR文字识别接口进行识别。如果PDF文件中包含多页，那么需要多次重复步骤1和步骤2以处理每一页图片。需要注意的是，使用OCR文字识别类的接口处理图片识别时，要保证图片的清晰度、亮度、对比度等因素，以便提高识别的准确率。

2023-04-18 14:15:48

赞同展开评论
芯在这

有文档智能解析的API可以实现哈 https://docmind.console.aliyun.com/service-manager，此回答整理自钉群“【官方】阿里云文档智能客户交流群”

2023-04-11 22:03:25

赞同展开评论

问答分类：

文字识别文字识别

问答标签：

PDF文字 PDF图片 PDF文件 PDF图片文件 PDF接口

问答地址：

开发者社区 > 人工智能 > 问答

相关问答

文档智能接口可以识别图片、PDF、Excel、Word的内容，然后自动分析内容吗？

358

2

0

在文档智能中接口是异步的吗？

81

1

0

在文档智能中这个 PDF 转word 没法看，如何解决？

137

0

0

在文档智能中除了把文本按层级关系解析出来，像这种图片现在能支持也按层级解析出来吗？

110

1

0

在文档智能中接口包含这个预览和标注功能吗？

125

1

0

在文档智能中有思维导图的接口吗?

91

1

0

在文档智能中咱们文档转换不支持pdf转ppt吗？

182

1

0

在文档智能中如下调用接口返回这个，是什么原因？

115

1

0

在文档智能中官网上贸易单证识别的产品介绍是不是没有了？

136

1

0

文档智能 api文档里有word，测试页面只能是图片类或pdf，这个接口到底是否支持word文件？

173

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

内存被通义灵码吃光了。我电脑总共48G的内存，被通义灵码吃掉了30几G，你们搞什么飞机？

我下载的gguf文件，最新的LMSTUDIO仍然无法识别什么问题

CoPAW配置后，对话，出现 AGENT_UNKNOWN_ERROR 如何解决

copaw安装后，出现这个情况，在设置模型的过程中出现这个问题，如何解决

Qwen OpenAI-Responses 兼容模式有问题

相关文章

阿里云AI产品免费试用：7000万Tokens+30款产品零成本体验！

AI行业开卷智能体，看完这篇文章，让你快速了解智能体是如何构建的

文档变形记：用SpringBoot让Word和PDF“相亲相爱”的魔幻操作

养活OpenClaw这只“大龙虾”的是人，是配置，是算力，不是它自己！

医院随访系统如何实现数据整合？

还有其他疑问?