ocr介绍里有分栏输出的介绍,不知道那个接口,可否试用下?

ocr介绍里有分栏输出的介绍,不知道那个接口,可否试用下?626991dbbb0123b0e366b4df464f8de0.png

展开
收起
真的很搞笑 2023-05-30 20:29:49 135 分享 版权
4 条回答
写回答
取消 提交回答
  • 阿里云OCR提供了“表格文字识别”接口,可以实现对表格类文档的识别,并支持输出分栏结果。您可以通过以下步骤来试用该功能:

    1. 在阿里云控制台中开通阿里云OCR服务,并获取AccessKey ID和AccessKey Secret。

    2. 调用“表格文字识别”接口,传入待识别的图片或PDF文件,并设置识别参数(如语言、表格边框检测等),在请求参数中添加“output_word_split_num”字段并设置其值为大于0的整数,表示需要输出分栏结果。

    3. 接口返回的JSON格式结果中,每个单元格的内容将按照分栏结果进行组织,并在每个单元格对象中添加“split_words”字段,表示该单元格的分栏结果。如果某行或某列没有分栏,则该字段的值为null。

    注意事项:

    • “表格文字识别”接口仅能识别表格类文档,而且要求表格边框比较明显,否则可能会影响识别效果。
    • 分栏结果的数量受到多种因素的影响,如表格布局、字体大小、单元格内容等,因此具体情况需根据实际情况而定。
    • 分栏结果仅适用于表格类文档,不适用于一般的文本识别场景。
    2023-05-31 16:14:12
    赞同 展开评论
  • 天下风云出我辈,一入江湖岁月催,皇图霸业谈笑中,不胜人生一场醉。

    阿里云的OCR服务支持分栏输出功能,您可以通过以下接口进行使用:

    使用阿里云OSS SDK调用OSS API,获取OCR识别结果。 使用阿里云API调用OCR服务API,获取OCR识别结果。

    2023-05-31 14:45:26
    赞同 展开评论
  • 公众号:网络技术联盟站,InfoQ签约作者,阿里云社区签约作者,华为云 云享专家,BOSS直聘 创作王者,腾讯课堂创作领航员,博客+论坛:https://www.wljslmz.cn,工程师导航:https://www.wljslmz.com

    您好,阿里云OCR(Optical Character Recognition)提供了多个接口,其中包括“分栏输出”的接口。以下是基于阿里云官方文档的介绍:

    • 接口名称:ocr_table_recognize
    • 功能描述:支持表格识别和指定区域文字识别,可输出分栏结果。
    • 请求方式:HTTP POST
    • 请求参数:
    参数名类型是否必填描述
    imagebinary图像二进制数据,需base64编码
    output_probboolean是否返回单字符置信度信息,默认为false
    output_keypointsboolean是否返回单字位置信息,默认为false
    min_sizeinteger指定表格中文字最小高度,默认10
    table_border_confidencefloat表格边界置信度阈值,默认0.5
    form_content_confidencefloat表格内容行置信度阈值,默认0.5
    cell_content_confidencefloat表格单元格置信度阈值,默认0.5
    • 返回参数:
    参数名类型描述
    request_idstring请求ID
    resultobject识别结果

    在请求中设置output_keypoints为true,则result中的单字位置信息会被返回,从而实现分栏输出的功能。

    在使用此接口时需要先进行阿里云OCR的认证并获取相应的Access Key和Access Secret,以便进行API请求。

    2023-05-30 23:21:00
    赞同 展开评论
  • 分栏输出也还不能把上面那张图片的2列分开,此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”

    2023-05-30 21:12:46
    赞同 展开评论

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

热门讨论

热门文章

还有其他疑问?
咨询AI助理