ocr介绍里有分栏输出的介绍,不知道那个接口,可否试用下?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
阿里云OCR提供了“表格文字识别”接口,可以实现对表格类文档的识别,并支持输出分栏结果。您可以通过以下步骤来试用该功能:
在阿里云控制台中开通阿里云OCR服务,并获取AccessKey ID和AccessKey Secret。
调用“表格文字识别”接口,传入待识别的图片或PDF文件,并设置识别参数(如语言、表格边框检测等),在请求参数中添加“output_word_split_num”字段并设置其值为大于0的整数,表示需要输出分栏结果。
接口返回的JSON格式结果中,每个单元格的内容将按照分栏结果进行组织,并在每个单元格对象中添加“split_words”字段,表示该单元格的分栏结果。如果某行或某列没有分栏,则该字段的值为null。
注意事项:
阿里云的OCR服务支持分栏输出功能,您可以通过以下接口进行使用:
使用阿里云OSS SDK调用OSS API,获取OCR识别结果。 使用阿里云API调用OCR服务API,获取OCR识别结果。
您好,阿里云OCR(Optical Character Recognition)提供了多个接口,其中包括“分栏输出”的接口。以下是基于阿里云官方文档的介绍:
参数名 | 类型 | 是否必填 | 描述 |
---|---|---|---|
image | binary | 是 | 图像二进制数据,需base64编码 |
output_prob | boolean | 否 | 是否返回单字符置信度信息,默认为false |
output_keypoints | boolean | 否 | 是否返回单字位置信息,默认为false |
min_size | integer | 否 | 指定表格中文字最小高度,默认10 |
table_border_confidence | float | 否 | 表格边界置信度阈值,默认0.5 |
form_content_confidence | float | 否 | 表格内容行置信度阈值,默认0.5 |
cell_content_confidence | float | 否 | 表格单元格置信度阈值,默认0.5 |
参数名 | 类型 | 描述 |
---|---|---|
request_id | string | 请求ID |
result | object | 识别结果 |
在请求中设置output_keypoints为true,则result中的单字位置信息会被返回,从而实现分栏输出的功能。
在使用此接口时需要先进行阿里云OCR的认证并获取相应的Access Key和Access Secret,以便进行API请求。