开发者社区 问答 正文

文档智能用自学习这个识别,极氪 的 氪 老识别不对,这个有办法调整吗?

文档智能用自学习这个识别,极氪 的 氪 老识别不对,这个有办法调整吗?
5d6711a4780b3489115860285f42ffcf.png
b78c04918057d261b624fdf80eb01672.jpg

展开
收起
青城山下庄文杰 2023-08-06 15:37:42 77 分享 版权
3 条回答
写回答
取消 提交回答
  • 底层OCR识别存在问题没有办法调整OCR识别模型。但是如果一直是用于“极氪 ”的租赁,可以考虑使用高级配置中的文字替换,或者使用字段属性-此回答整理自钉群“【官方】阿里云文档智能客户交流群”

    2023-08-08 12:11:00
    赞同 展开评论
  • 北京阿里云ACE会长

    如果智能文档引擎在识别过程中存在错误,有以下几种方法可以调整和改进:

    提供更多标注数据
    提供更多已经标注好的文档数据,让模型学习这些标注的数据,从而更准确地识别新文档。

    重新训练模型
    使用改进后的标注数据,重新训练整个模型,生成新的模型参数。新的模型会考虑到新增的标注数据,识别效果可能会改进。

    调整模型超参数
    优化模型的一些超参数,如学习率、dropout率等,有可能提高模型的性能。

    采用数据增强
    为数据采用技术手段实现数据增强,如随机替换单词、添加噪声等,让模型学习到更丰富的样本,增强泛化能力。

    使用额外知识
    提供额外的知识或词汇表,让模型可以参考这些知识来改进识别效果。

    多模型融合
    训练多个模型,然后进行模型融合,融合后的模型可能整体效果更好。

    关注错误样本
    关注出现错误的样本,分析原因,可能发现模型存在的盲点。针对这些盲点,采取相应的调整措施。

    主要是从以上几个方面来调整和改进智能文档引擎的识别效果。

    对于您提到的具体问题,建议:

    收集更多已标注好的极氪 和 氪 相关的数据作为训练数据
    重新训练模型,使用更新的数据
    分析其识别错误的样本,看能否找到错误的根本原因

    2023-08-07 14:59:33
    赞同 展开评论
  • 可以加入官方钉钉群:44854217(【官方】阿里云文档智能客户交流群)来咨询。

    2023-08-07 07:59:30
    赞同 展开评论