文档备案控制台

开发者社区视觉智能文字识别正文

文字识别ocr中我们的需求是要识别 pdf 中的内容，包含文本，图片以及图片格式的表格哪个合适呢？

文字识别ocr中我们的需求是要识别 pdf 中的内容，包含文本，图片以及图片格式的表格，图片可能是横向的。哪个接口更合适呢？类似与这样的 pdf 文件。

展开

收起

小小鹿鹿鹿 2023-11-20 21:57:20 244 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
文字识别 OCR 提供几种不同的识别方案，包括文本识别、图片识别和表格识别。
对于 PDF 文件中的内容，可以根据不同的需求选用相应的 OCR 方案，一般情况下可以采用以下方法：
1. 文本识别：适用于 PDF 文件中的文本。
2. 图片识别：适用于 PDF 文件中的图片内容。
3. 表格识别：适用于 PDF 文件中的表格。
此外，文字识别 OCR 可以智能识别 PDF 文件中的表格内容，并返回表格结构信息。
最后，在使用文字识别 OCR 解决 PDF 文件的文本、图片和表格时，应根据实际需要选取相应的方案。
2023-11-21 21:51:21

赞同 1 展开评论
三掌柜666

十分耕耘，一定会有一分收获！

楼主你好，看了你的问题，阿里云OCR中的pdf表格识别和pdf文档识别接口可能更适合你。

pdf表格识别接口可以识别 PDF 中的表格，支持表格中包含文字和图片。

pdf文档识别接口可以识别 PDF 中的文字和图片，包括横向的图片。

这里，你可以根据实际情况选择使用相应的接口。

2023-11-20 22:08:17

赞同展开评论

问答分类：

文字识别文字识别视觉智能开放平台

问答标签：

印刷文字识别文本印刷文字识别文字识别文字识别ocr PDF表格印刷文字识别表格

问答地址：

开发者社区 > 视觉智能 > 文字识别 > 问答

相关问答

印刷文字识别

OCR入参图片链接不支持 OSS 带有效时间的图片链接？

315

2

0

文字识别OCR ocr可以识别pdf么？

396

3

0

文字识别OCR PDF里面有多张发票的话，可以全部识别嘛？

324

2

0

对于体检报告pdf要想提取里边的所有数据用文字识别OCR什么产品比较好？

227

1

0

在文字识别OCR中，带有水印的pdf解析应该使用哪个产品？

278

3

0

在文字识别OCR中，如果图片上有签章，用表格识别的话，OCR内部是否可以预处理签章后识别呢？

283

2

0

文字识别OCR中ocr有没有专门针对国家标准文件/行业标准文件的pdf识别接口？

192

1

0

阿里云网盘与相册这个方式现在只能发PDF，有办法发其他格式的文件吗？

242

1

0

在宜搭普通表单里面，怎么实现pdf转换成图片，同时保留pdf文件，

738

3

0

请问下OSS里存的大写后缀的PDF文件，智能媒体管理是不支持预览吗，只能修改源文件后缀嘛？

331

1

0

视觉智能

文字识别

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景，满足认证、鉴权、票据流转审核等业务需求。

我要提问

相关文章

内网环境跑通RPA自动化：企业级私有化部署实战

AI办公高频问题汇总梳理清单

Deepseek大语言模型在多语种手稿数字化中的工程实践与策略

阿里云Qwen 3.7 Plus与Max实测对比：2026年多模态能力与性价比深度解析

热门讨论

热门文章

身份证识别ocr，每次购买需要更换url地址吗？

你好，我想问下，python调用接口，Sample.main() 函数，会return 文字识别的结

文字识别ocr支持android吗，android sdk文档链接有不？

文字识别OCR体验了一下，识别不出来，麻烦帮我看下怎么解决？

OCR中java 代码示例，返回这个是什么意思？

文字识别OCR目前有哪些情况会导致识别失败？

请问文字识别OCR的TaskId这个参数是什么意思？不是只要唯一就可以吗？

文字识别OCR API有没有Delphi的demo哦？

为什么我们这边的文字识别OCR现在出现了发票类型识别不稳定的情况？

目前OCR中如果部署在本地的话，识别速度怎么样？一张图片平均多久可以识别到

展开全部

基于深度学习的自然场景文字检测及端到端的OCR中文文字识别

图像文字识别(OCR)用什么算法小结

浪潮发布业界最高GPU密度的SR-AI整机柜

阿里宜搭发布OCR文字识别插件助力合作伙伴升级

使用图像文字识别技术获取失信黑名单

【全自动改PDF名】批量OCR识别提取PDF自定义指定区域内容保存到 Excel 以及根据PDF文件内容的标题来批量重命名

OCR文字识别技术总结（一）

分析对比大模型OCR、传统OCR和深度学习OCR

【繁体图片文字识别】竖排的繁体图片文字识别翻译，竖排的繁体图片文字如何识别，竖排繁体图片识别后转横排，竖排的繁体识别比较友好的方法

【PDF提取全自动改名】如何批量提取PDF指定区域的文字内容，用内容批量给PDF命名或者导出表格，学会全自动解放双手

展开全部

还有其他疑问?