开发者社区 > 视觉智能 > 文字识别 > 正文

文字识别OCR只标注了这四个字段,识别率特别低现在,能多上传样本数据提高识别率吗?

文字识别OCR只标注了这四个字段,识别率特别低现在,能多上传样本数据提高识别率吗?08dad7243694582263c78fd208678f70.png

展开
收起
三分钟热度的鱼 2023-11-15 20:57:12 55 0
2 条回答
写回答
取消 提交回答
  • 是的,通过增加更多的训练样本,可以提高模型的识别率。这是因为深度学习模型,如OCR,通常通过大量的训练样本来学习如何从输入数据中提取有用的信息。如果您发现模型在某些特定情况下的识别率较低,那么增加这些情况的训练样本可能会有所帮助。

    然而,需要注意的是,仅仅增加训练样本并不总是能提高模型的性能。有时候,可能需要调整模型的结构或参数,或者使用更复杂的模型来处理更复杂的问题。此外,训练样本的选择也很重要,应该尽可能覆盖各种可能的情况,并且样本的质量也应该足够高。

    2023-11-30 09:16:16
    赞同 展开评论 打赏
  • 您可以考虑用 单证票据信息抽取 项目,可以标注多样本优化模型效果。此回答整理自钉群“【官方】阿里云OCR文档自学习用户答疑群”

    2023-11-15 21:10:32
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载