请问文字识别OCR识别表格的话，准备用的是自学习的表格模型，表格中有勾选框，应该怎么去识别？

展开

收起

2401。 2023-07-15 19:16:22 426 版权

7 条回答

写回答

取消提交回答

wljslmz

公众号：网络技术联盟站，InfoQ签约作者，阿里云社区签约作者，华为云云享专家，BOSS直聘创作王者，腾讯课堂创作领航员，博客+论坛：https://www.wljslmz.cn，工程师导航：https://www.wljslmz.com
若您准备使用自学习的表格模型进行阿里云文字识别OCR服务中的表格识别，并且表格中含有勾选框，您可以考虑以下方法进行识别：
1. 自定义勾选框识别：使用自学习的表格模型，可以自定义识别规则，将勾选框识别为特定的标志或字符。在训练模型时，您可以标注勾选框对应的区域，并将其与相应的标记或字符进行关联，以便在识别时能够正确识别勾选框的状态。
2. 预处理方式：在进行表格识别之前，可以对表格进行预处理。通过图像处理技术，可以尝试将勾选框进行二值化、边缘检测或形态学操作，以便更好地区分勾选框的位置和状态。
3. 后期处理：在进行表格识别后，根据勾选框的位置信息，可以进一步进行后期处理。例如，可以使用图像处理和机器学习算法判断勾选框的状态，或者根据识别结果和其他上下文信息来确定勾选框的选中状态。
2023-08-28 07:57:21

赞同展开评论
挚爱长虹

我们输出的是文字信息，暂时不支持这个勾选☑️框。
此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”。

2023-07-18 12:16:53

赞同展开评论
六月的雨在钉钉

从事java行业9年至今，热爱技术，热爱以博文记录日常工作，csdn博主，座右铭是：让技术不再枯燥，让每一位技术人爱上技术

您好，目前来看文字识别OCR 不支持勾选框的识别的，文字识别OCR主要是针对于图片中的内容信息识别为可编辑的文本，对于符号类的识别能力有限。

2023-07-18 10:50:46

赞同展开评论
魏红斌

天下风云出我辈，一入江湖岁月催，皇图霸业谈笑中，不胜人生一场醉。

表格信息抽取是基于深度学习的信息抽取自学习模型任务，可对版式相对固定的表格、表单的等类型数据有较好的效果，支持用户自定义抽取字段，通过平台可视化引导，完成数据标注和模型训练。https://help.aliyun.com/document_detail/603351.html?spm=a2c4g.603350.0.i2

在图像质量较好情况下，通过100+训练样本标注，调优后模型识别准确率可超95%+。

2023-07-18 09:06:01

赞同展开评论
牧羊吖

月移花影，暗香浮动
阿里云文字识别OCR支持使用自学习的表格模型进行表格识别，包括勾选框的识别。以下是一般的步骤：
1. 准备训练数据：将包含勾选框的表格图片作为训练数据，并按照阿里云要求的格式进行标注，标注勾选框的位置信息。
2. 创建表格识别模型：在阿里云控制台中选择文字识别OCR服务，进入表格识别模型管理页面，按照指引创建自学习的表格模型，上传并训练准备好的训练数据。
3. 调用接口进行识别：使用创建好的表格模型，调用文字识别OCR的接口，传入待识别的表格图片，接口会返回识别结果，包括勾选框信息。
需要注意的是，自学习的表格模型对于不同类型的表格可能需要调优，您可以根据实际情况进行训练和调整模型参数，以提高勾选框的识别准确率。
2023-07-17 09:37:57

赞同展开评论
算精通

北京阿里云ACE会长

如果表格中包含勾选框，您可以考虑使用OCR技术结合图像处理技术进行识别。

一种常见的方法是使用模板匹配技术，即根据勾选框的位置和形状，对表格图像进行模板匹配，以确定勾选框的位置和状态。具体步骤如下：

提取勾选框区域：根据表格的结构和布局，确定勾选框所在的区域，并进行图像分割和二值化处理，提取出勾选框区域的二值图像。

生成勾选框模板：根据勾选框的形状和大小，生成勾选框的模板图像。可以使用图像处理库，例如OpenCV，在勾选框区域中提取特征点并进行特征描述，生成勾选框的特征向量，并根据特征向量生成勾选框的模板图像。

进行模板匹配：将生成的勾选框模板应用于表格图像中，进行模板匹配，以确定勾选框的位置和状态。可以使用图像处理库，例如OpenCV，在表格图像中进行滑动窗口匹配，计算勾选框区域与模板图像的相似度，并确定勾选框的位置和状态。

2023-07-15 21:01:46

赞同展开评论
Star时光
要识别包含勾选框的表格，您可以考虑以下方法：
1. 预处理和图像增强：在应用OCR之前，对图像进行预处理和增强。这包括调整图像的清晰度、对比度和亮度等参数，以提高勾选框的可见性。
2. 检测和定位勾选框：使用计算机视觉技术，如边缘检测、轮廓检测、模板匹配等，来检测和定位勾选框的位置。可以基于形状、颜色或其他特征来识别勾选框。
3. 训练自定义模型：如果通用OCR服务无法满足需求，可以考虑使用自定义模型来识别勾选框。通过收集并标记带有勾选框的样本数据，并使用深度学习、卷积神经网络（CNN）等技术进行训练，以构建专门针对勾选框的OCR模型。
4. 结合文本识别：除了勾选框外，还需要对表格中的文本进行识别。将文本识别和勾选框识别结合起来，可以实现对表格内容的完整识别。
5. 后处理和结果校验：在完成识别后，进行后处理和结果校验，确保识别结果的准确性。例如，可以检查勾选框的状态（勾选/未勾选），并对识别的文本进行格式化和验证。
请注意，这些方法中的每一步都可能需要针对您的具体需求进行调整和优化，取决于表格的结构、复杂性和数据质量等因素。
2023-07-15 19:51:53

赞同展开评论

滑动查看更多

请问文字识别OCR识别表格的话，准备用的是自学习的表格模型，表格中有勾选框，应该怎么去识别？

文字识别

相关文章

热门讨论

热门文章