开发者社区 > 视觉智能 > 文字识别 > 正文

为什么在训练模型勾选了自动选择十分之一的训练集作为测试集,但文字识别OCR的有效测试集数不显示呢?

为什么在训练模型的时候勾选了自动选择十分之一的训练集作为测试集,但是文字识别OCR这里的有效测试集数不显示呢?2c2ae50a11ba1eef92702cba0717433f.png

展开
收起
三分钟热度的鱼 2023-09-13 19:07:07 84 0
6 条回答
写回答
取消 提交回答
  • 在训练模型时勾选了自动选择十分之一的训练集作为测试集,但是文字识别OCR这里的有效测试集数不显示,可能是因为OCR系统的测试集数量与训练集数量并不是简单的十分之一关系。OCR系统需要根据具体情况选择合适的测试集数量,以确保模型的准确性和稳定性。因此,OCR系统可能会自动选择其他数量的测试集,或者需要手动指定测试集数量。建议您查看OCR系统的文档或者联系技术支持,了解具体情况并进行调整。

    2023-09-18 08:04:03
    赞同 展开评论 打赏
  • 十分耕耘,一定会有一分收获!

    楼主你好,可能是因为您的训练集太小而导致的。在使用自动选择十分之一的训练集作为测试集时,如果训练集的大小不足以支持进行有效的测试,那么系统就无法显示有效测试集的数量。建议您扩大训练集的大小或使用其他测试方法来确保模型的准确性。

    2023-09-17 07:47:14
    赞同 展开评论 打赏
  • 从事java行业9年至今,热爱技术,热爱以博文记录日常工作,csdn博主,座右铭是:让技术不再枯燥,让每一位技术人爱上技术

    您好,文字识别OCR文档自学习这里的有效测试集未展示并不影响训练数据集的训练效果,训练集数量达到一定的数量后对于模版识别准确率的提升是一致的。

    2023-09-16 11:10:22
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在训练模型时,勾选了自动选择十分之一的训练集作为测试集,是为了评估模型的性能和准确率。但是,在OCR文字识别服务中,有效测试集数并不是根据训练时的测试集大小来计算的,而是根据您在OCR服务中设置的测试集大小来计算的。

    2023-09-14 13:51:33
    赞同 展开评论 打赏
  • 这个对后续的训练和评测没有影响的,这个展示问题我们后续优化下哈。此回答整理自钉群“【官方】阿里云OCR文档自学习用户答疑群”

    2023-09-13 19:21:34
    赞同 展开评论 打赏
  • 在文字识别OCR中,自动选择训练集的十分之一作为测试集是一个常见的做法来评估模型的性能。然而,阿里云OCR服务并不直接提供显示有效测试集数的功能。

    在OCR服务中,模型的性能和准确度是通过针对多个真实场景下的数据进行训练和调优来确定的。在训练过程中,使用的数据集包含了大量的样本和标注信息,以帮助模型学习和识别各种类型的文本。

    由于OCR涉及到广泛的应用领域和多样化的场景,有效测试集的具体定义可能会因具体的任务和需求而有所不同。即使没有直接显示有效测试集数,但您仍然可以通过以下方式来评估OCR模型的性能:

    1. 使用真实场景下的数据进行测试:将真实的图片或扫描件输入OCR服务,观察模型在各种情况下的识别效果。评估模型是否能够准确识别文本,并根据您的需求提取所需的信息。

    2. 手动创建测试集:为了更系统地评估OCR模型的性能,您可以手动创建一个专门用于测试的数据集。该数据集应包含不同类型、不同难度和不同场景下的文本图像,以全面评估模型的性能。

    3. 定期监测和迭代:OCR模型的性能是一个动态过程,随着您的应用场景和需求的变化,需要持续评估和改进。定期监测模型的准确度,并根据实际反馈和问题进行调整和改进。

    2023-09-13 19:18:58
    赞同 展开评论 打赏
滑动查看更多

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
移动互联网测试到质量的转变 立即下载
给ITer的技术实战进阶课-阿里CIO学院独家教材(四) 立即下载
F2etest — 多浏览器兼容性测试整体解决方案 立即下载