开发者社区 > 视觉智能 > 文字识别 > 正文

请问文字识别OCR识别表格的话,准备用的是自学习的表格模型,表格中有勾选框,应该怎么去识别?

请问文字识别OCR识别表格的话,准备用的是自学习的表格模型,表格中有勾选框,应该怎么去识别?

展开
收起
2401。 2023-07-15 19:16:22 221 0
7 条回答
写回答
取消 提交回答
  • 公众号:网络技术联盟站,InfoQ签约作者,阿里云社区签约作者,华为云 云享专家,BOSS直聘 创作王者,腾讯课堂创作领航员,博客+论坛:https://www.wljslmz.cn,工程师导航:https://www.wljslmz.com

    若您准备使用自学习的表格模型进行阿里云文字识别OCR服务中的表格识别,并且表格中含有勾选框,您可以考虑以下方法进行识别:

    1. 自定义勾选框识别:使用自学习的表格模型,可以自定义识别规则,将勾选框识别为特定的标志或字符。在训练模型时,您可以标注勾选框对应的区域,并将其与相应的标记或字符进行关联,以便在识别时能够正确识别勾选框的状态。

    2. 预处理方式:在进行表格识别之前,可以对表格进行预处理。通过图像处理技术,可以尝试将勾选框进行二值化、边缘检测或形态学操作,以便更好地区分勾选框的位置和状态。

    3. 后期处理:在进行表格识别后,根据勾选框的位置信息,可以进一步进行后期处理。例如,可以使用图像处理和机器学习算法判断勾选框的状态,或者根据识别结果和其他上下文信息来确定勾选框的选中状态。

    2023-08-28 07:57:21
    赞同 展开评论 打赏
  • 我们输出的是文字信息, 暂时不支持这个勾选☑️框。
    此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”。

    2023-07-18 12:16:53
    赞同 展开评论 打赏
  • 从事java行业9年至今,热爱技术,热爱以博文记录日常工作,csdn博主,座右铭是:让技术不再枯燥,让每一位技术人爱上技术

    您好,目前来看文字识别OCR 不支持勾选框的识别的,文字识别OCR主要是针对于图片中的内容信息识别为可编辑的文本,对于符号类的识别能力有限。

    2023-07-18 10:50:46
    赞同 展开评论 打赏
  • 天下风云出我辈,一入江湖岁月催,皇图霸业谈笑中,不胜人生一场醉。

    表格信息抽取是基于深度学习的信息抽取自学习模型任务,可对版式相对固定的表格、表单的等类型数据有较好的效果,支持用户自定义抽取字段,通过平台可视化引导,完成数据标注和模型训练。https://help.aliyun.com/document_detail/603351.html?spm=a2c4g.603350.0.i2

    在图像质量较好情况下,通过100+训练样本标注,调优后模型识别准确率可超95%+。

    2023-07-18 09:06:01
    赞同 展开评论 打赏
  • 月移花影,暗香浮动

    阿里云文字识别OCR支持使用自学习的表格模型进行表格识别,包括勾选框的识别。以下是一般的步骤:

    1. 准备训练数据:将包含勾选框的表格图片作为训练数据,并按照阿里云要求的格式进行标注,标注勾选框的位置信息。

    2. 创建表格识别模型:在阿里云控制台中选择文字识别OCR服务,进入表格识别模型管理页面,按照指引创建自学习的表格模型,上传并训练准备好的训练数据。

    3. 调用接口进行识别:使用创建好的表格模型,调用文字识别OCR的接口,传入待识别的表格图片,接口会返回识别结果,包括勾选框信息。

    需要注意的是,自学习的表格模型对于不同类型的表格可能需要调优,您可以根据实际情况进行训练和调整模型参数,以提高勾选框的识别准确率。

    2023-07-17 09:37:57
    赞同 展开评论 打赏
  • 北京阿里云ACE会长

    如果表格中包含勾选框,您可以考虑使用OCR技术结合图像处理技术进行识别。

    一种常见的方法是使用模板匹配技术,即根据勾选框的位置和形状,对表格图像进行模板匹配,以确定勾选框的位置和状态。具体步骤如下:

    提取勾选框区域:根据表格的结构和布局,确定勾选框所在的区域,并进行图像分割和二值化处理,提取出勾选框区域的二值图像。

    生成勾选框模板:根据勾选框的形状和大小,生成勾选框的模板图像。可以使用图像处理库,例如OpenCV,在勾选框区域中提取特征点并进行特征描述,生成勾选框的特征向量,并根据特征向量生成勾选框的模板图像。

    进行模板匹配:将生成的勾选框模板应用于表格图像中,进行模板匹配,以确定勾选框的位置和状态。可以使用图像处理库,例如OpenCV,在表格图像中进行滑动窗口匹配,计算勾选框区域与模板图像的相似度,并确定勾选框的位置和状态。

    2023-07-15 21:01:46
    赞同 展开评论 打赏
  • 要识别包含勾选框的表格,您可以考虑以下方法:

    1. 预处理和图像增强:在应用OCR之前,对图像进行预处理和增强。这包括调整图像的清晰度、对比度和亮度等参数,以提高勾选框的可见性。

    2. 检测和定位勾选框:使用计算机视觉技术,如边缘检测、轮廓检测、模板匹配等,来检测和定位勾选框的位置。可以基于形状、颜色或其他特征来识别勾选框。

    3. 训练自定义模型:如果通用OCR服务无法满足需求,可以考虑使用自定义模型来识别勾选框。通过收集并标记带有勾选框的样本数据,并使用深度学习、卷积神经网络(CNN)等技术进行训练,以构建专门针对勾选框的OCR模型。

    4. 结合文本识别:除了勾选框外,还需要对表格中的文本进行识别。将文本识别和勾选框识别结合起来,可以实现对表格内容的完整识别。

    5. 后处理和结果校验:在完成识别后,进行后处理和结果校验,确保识别结果的准确性。例如,可以检查勾选框的状态(勾选/未勾选),并对识别的文本进行格式化和验证。

    请注意,这些方法中的每一步都可能需要针对您的具体需求进行调整和优化,取决于表格的结构、复杂性和数据质量等因素。

    2023-07-15 19:51:53
    赞同 展开评论 打赏
滑动查看更多

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

热门讨论

热门文章

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载