文字识别OCRpfd文件第一页中既有普通的文字，也有表格，需要把表格的内容识别出来要用那个API呢？

展开

收起

青城山下庄文杰 2023-07-31 13:23:48 134 版权

6 条回答

写回答

取消提交回答

wljslmz

公众号：网络技术联盟站，InfoQ签约作者，阿里云社区签约作者，华为云云享专家，BOSS直聘创作王者，腾讯课堂创作领航员，博客+论坛：https://www.wljslmz.cn，工程师导航：https://www.wljslmz.com
对于识别PFD文件中既有普通文字又有表格的情况，您可以使用阿里云文字识别OCR服务中的"表格文字识别"（Table Recognition）功能来识别表格内容。这需要使用阿里云OCR的"ocr_table_parse"接口。

以下是一般的步骤：
1. 准备PDF文件：将包含表格的PDF文件上传至阿里云OCR服务。
2. 调用OCR服务接口：使用"ocr_table_parse"接口调用OCR服务，并传入PDF文件路径或二进制文件数据。
3. 解析表格内容：OCR服务会对PDF中的表格进行解析，并识别表格中的文字和结构。您可以通过解析返回的数据来获取表格的结构信息和文字内容。
2023-08-28 14:57:33

赞同展开评论
Ð

有图片吗 -此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”

2023-08-01 10:20:22

赞同展开评论
Star时光
如果你的PDF文件的第一页既包含普通文本又包含表格，并且你希望将表格内容单独识别出来，你可以使用OCR服务的表格识别（Table Recognition）API。这个API专门用于识别和提取表格中的内容。

表格识别API通常具有以下特点：
- 识别表格结构：表格识别API能够检测并识别PDF中的表格结构，包括表格的行、列和单元格。
- 提取表格数据：通过表格识别API，你可以获取每个单元格中的文字或数字内容，并以结构化形式返回表格数据。
- 表格重构和格式化：一些表格识别API还可以对识别结果进行表格重构和格式化，使其更易于阅读和处理。
请注意，不同的OCR服务提供商可能会使用不同的名称和接口来实现表格识别。因此，在选择OCR服务时，建议查看所选服务提供商的相关文档，并找到适合你需求的表格识别功能。
2023-07-31 20:27:57

赞同展开评论
算精通

北京阿里云ACE会长

如果您需要识别 PDF 文件中的表格内容，可以使用 OCR 文字识别服务提供的表格识别 API 接口。表格识别 API 接口通常可以将 PDF 文件中的表格内容提取出来，并转换成结构化数据，例如表格、Excel 文件等等。

一些 OCR 文字识别服务提供商，例如百度 OCR、阿里云 OCR、腾讯 OCR 等，都提供了表格识别 API 接口，可以方便地将 PDF 文件中的表格内容提取出来。具体使用方法和参数设置可以参考对应 OCR 文字识别服务提供商的 API 文档和示例代码。

2023-07-31 19:54:53

赞同展开评论
穿过生命散发芬芳

RecognizeTableOcr - 表格识别

阿里云表格识别，是阿里云官方自研OCR文字识别产品，支持对多种表格格式（有线表格、条纹表格、无线表格）进行智能文字识别并结构化输出识别结果。

2023-07-31 19:11:52

赞同展开评论
魏红斌

天下风云出我辈，一入江湖岁月催，皇图霸业谈笑中，不胜人生一场醉。

OCR可以直接输出Excel表格吗
您好，官网OCR文字识别，目前接口返回的数据都是以json格式进行出参，暂时并不能将数据直接返回为Excel表格。如需Excel导出可查看云市场印刷文字识别—表格提取与excel导出，可支持对有线表格、条纹表格进行识别，并支持导出Excel功能，用户可进行二次编辑。

2023-07-31 16:11:45

赞同展开评论

滑动查看更多

文字识别OCRpfd文件第一页中既有普通的文字，也有表格，需要把表格的内容识别出来要用那个API呢？

文字识别

相关文章

热门讨论

热门文章