ocr介绍里有分栏输出的介绍，不知道那个接口，可否试用下？

展开

收起

真的很搞笑 2023-05-30 20:29:49 161 版权

4 条回答

写回答

取消提交回答

一位隐者
阿里云OCR提供了“表格文字识别”接口，可以实现对表格类文档的识别，并支持输出分栏结果。您可以通过以下步骤来试用该功能：
1. 在阿里云控制台中开通阿里云OCR服务，并获取AccessKey ID和AccessKey Secret。
2. 调用“表格文字识别”接口，传入待识别的图片或PDF文件，并设置识别参数（如语言、表格边框检测等），在请求参数中添加“output_word_split_num”字段并设置其值为大于0的整数，表示需要输出分栏结果。
3. 接口返回的JSON格式结果中，每个单元格的内容将按照分栏结果进行组织，并在每个单元格对象中添加“split_words”字段，表示该单元格的分栏结果。如果某行或某列没有分栏，则该字段的值为null。
注意事项：
- “表格文字识别”接口仅能识别表格类文档，而且要求表格边框比较明显，否则可能会影响识别效果。
- 分栏结果的数量受到多种因素的影响，如表格布局、字体大小、单元格内容等，因此具体情况需根据实际情况而定。
- 分栏结果仅适用于表格类文档，不适用于一般的文本识别场景。
2023-05-31 16:14:12

赞同展开评论
魏红斌

天下风云出我辈，一入江湖岁月催，皇图霸业谈笑中，不胜人生一场醉。

阿里云的OCR服务支持分栏输出功能，您可以通过以下接口进行使用：

使用阿里云OSS SDK调用OSS API，获取OCR识别结果。使用阿里云API调用OCR服务API，获取OCR识别结果。

2023-05-31 14:45:26

赞同展开评论

wljslmz

公众号：网络技术联盟站，InfoQ签约作者，阿里云社区签约作者，华为云云享专家，BOSS直聘创作王者，腾讯课堂创作领航员，博客+论坛：https://www.wljslmz.cn，工程师导航：https://www.wljslmz.com

您好，阿里云OCR（Optical Character Recognition）提供了多个接口，其中包括“分栏输出”的接口。以下是基于阿里云官方文档的介绍：

接口名称：ocr_table_recognize
功能描述：支持表格识别和指定区域文字识别，可输出分栏结果。
请求方式：HTTP POST
请求参数：

参数名	类型	是否必填	描述
image	binary	是	图像二进制数据，需base64编码
output_prob	boolean	否	是否返回单字符置信度信息，默认为false
output_keypoints	boolean	否	是否返回单字位置信息，默认为false
min_size	integer	否	指定表格中文字最小高度，默认10
table_border_confidence	float	否	表格边界置信度阈值，默认0.5
form_content_confidence	float	否	表格内容行置信度阈值，默认0.5
cell_content_confidence	float	否	表格单元格置信度阈值，默认0.5

返回参数：

参数名	类型	描述
request_id	string	请求ID
result	object	识别结果

在请求中设置output_keypoints为true，则result中的单字位置信息会被返回，从而实现分栏输出的功能。

在使用此接口时需要先进行阿里云OCR的认证并获取相应的Access Key和Access Secret，以便进行API请求。

2023-05-30 23:21:00

赞同展开评论

芯在这

分栏输出也还不能把上面那张图片的2列分开，此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”

2023-05-30 21:12:46

赞同展开评论

ocr介绍里有分栏输出的介绍，不知道那个接口，可否试用下？

文字识别

相关文章

热门讨论

热门文章