文档备案控制台

开发者社区视觉智能文字识别正文

pdf里面有个表格，我想通过文字识别OCR识别成结构化数据，可以吗？

pdf里面有个表格，我想通过文字识别OCR识别成结构化数据，可以吗？

展开

收起

三分钟热度的鱼 2024-07-31 20:44:51 434 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

技术员阿伟

资深 C++与人工智能程序员。精通 C++，善用其特性构建稳健架构。在人工智能领域，深入研习机器学习算法，借 C++与 OpenCV 等实现计算机视觉应用，于自然语言处理构建文本处理引擎。以敏锐洞察探索技术融合边界，用代码塑造智能未来。
可以的，有很多OCR工具能将PDF中的表格识别成结构化数据，以下为你推荐：

在线OCR工具
- TextIn Tools：是一款免费的在线OCR工具，支持快速准确的表格识别，能将PDF中的表格转化为可编辑的结构化数据，还提供PDF转Markdown等多种功能，支持PDF、WORD、EXCEL、JPG、PPT等各类格式文件的转化，每日有200页免费额度。
- CatOCR：是一款完全免费的网页端文字识别工具，支持图片、PDF等输入源，可以在电脑端和移动端使用，识别速度快，效果好，识别结果支持按照原版格式进行排版，能较好地处理表格数据的识别和结构化输出。
- PearOCR：免费的在线文字提取OCR工具网站，界面简洁，支持多语言，可上传文档或从电脑剪切板粘贴，识别结果能导出为PDF、TXT或者DOC文档，对表格数据的识别和结构化处理也有一定的支持能力。
开源OCR工具
- Tesseract：由Google维护的开源OCR引擎，开源、免费、支持多语言和多平台，可以处理多种类型的图像及多种字体和文本布局，配合一些插件或扩展，能够对PDF中的表格进行识别和结构化处理。
- PaddleOCR：百度开源的OCR库，包括文本检测模型和文本识别模型，支持多种语言和复杂情况下的文字识别，对于表格识别和结构化数据提取也有相应的功能和工具支持。
手机端OCR工具
- OCR图文识别：是一款全能OCR图片转文字识别软件，能扫描识别各种文件、图片并提取文字，支持二次编辑、翻译、复制、导出等功能，可处理PDF中的表格，将其转化为可编辑的文本内容。
2025-03-10 23:20:32

赞同展开评论
圆不溜秋的小猫猫

参考https://help.aliyun.com/zh/document-mind/developer-reference/tableunderstanding?spm=a2c4g.11186623.0.0.374910fa3UcINC
此回答整理自钉群“阿里云读光OCR客户交流反馈群 1”

2024-07-31 22:46:32

赞同 4 展开评论

问答分类：

文字识别文字识别视觉智能开放平台

问答标签：

文字识别ocr 文字识别ocr识别 PDF ocr识别 pdf印刷文字识别 PDF结构化数据

问答地址：

开发者社区 > 视觉智能 > 文字识别 > 问答

相关问答

印刷文字识别

文字识别OCR ocr可以识别pdf么？

461

3

0

文字识别OCR PDF里面有多张发票的话，可以全部识别嘛？

376

2

0

文字识别OCR 识别发票是不是只能一张一张的识别，多张发票在一个图片里也只能识别一张是吗？

442

2

0

文字识别OCR 识别过路费，怎么识别不了？

244

2

0

对于体检报告pdf要想提取里边的所有数据用文字识别OCR什么产品比较好？

258

1

0

文字识别OCR如果是excel图片，如何让OCR识别出来的内容按行输出呢？

369

2

0

文字识别OCR有支持外国人永久居留证的OCR识别计划吗？

239

2

0

文字识别OCR识别身份证正反面这个返回结果是什么原因？

324

2

0

在文字识别OCR中，带有水印的pdf解析应该使用哪个产品？

316

3

0

在文字识别OCR中，在微信小程序里面调用ocr识别失败这是什么原因？

1088

3

0

视觉智能

文字识别

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景，满足认证、鉴权、票据流转审核等业务需求。

我要提问

相关文章

阿里云通义千问大模型最新功能介绍

阿里云Qwen3.7 Max与Plus全维度实测对比：多模态能力、架构、资费与选型指南

多模态大模型与OCR有什么区别？从“识别文字”到“理解文档”的工程科普

AIGC 广告素材审核实践：从垂类模型到多模态合规治理

AI生图无法编辑？Crop2Draw —— 把论文架构图「拆」进 draw.io

热门讨论

热门文章

文字识别ocr中身份证识别响应状态码 463 什么意思？

文字识别OCR银行卡识别，为何一直识别都为空，是因为什么原因呢？

文字识别OCR怎么识别身份证？

文字识别OCR表格识别在线测试在哪？

DIY 多种场景文字识别

ocr通用文字识别后付费和资源包价格是不一样吗？

OCR离线部署多通道的价格怎么算的？

OCR身份证如何识别？

文字识别OCR目前有哪些情况会导致识别失败？

你好，OCR中按照阿里云网上的例子，一个公网可以访问的营业执照照片，请求返回的是空的？有人能处理问题

展开全部

基于深度学习的自然场景文字检测及端到端的OCR中文文字识别

图像文字识别(OCR)用什么算法小结

吴恩达《机器学习》课程总结（18）应用实例：图片文字识别

浪潮发布业界最高GPU密度的SR-AI整机柜

阿里宜搭发布OCR文字识别插件助力合作伙伴升级

使用图像文字识别技术获取失信黑名单

阿里云视觉智能开放平台--文字识别使用教程

印刷文字识别产品使用合集之手写识别服务，能单独识别出来手写的选项吗

【PDF提取内容改名】批量提取PDF指定区域内容重命名PDF文件，PDF自动提取内容命名的方案和详细步骤

分析对比大模型OCR、传统OCR和深度学习OCR

展开全部

还有其他疑问?