开发者社区 问答 正文

在文档智能中口报关单识别准确率可以到多少?

在文档智能中口报关单识别准确率可以到多少?

展开
收起
花开富贵111 2024-02-06 10:38:43 83 分享 版权
阿里云 AI 助理回答

在文档智能中,报关单识别的准确率可以通过信息抽取模型实现较高的精度。根据知识库资料,以下是对报关单识别准确率的具体说明:

  1. 高精度模型支持
    基于深度学习的信息抽取模型(如单据票证信息抽取和表格信息抽取),经过调优训练后,识别准确率可达到95%以上。这适用于版式相对固定或可枚举的单据、票证和表格数据。

  2. 影响准确率的关键因素

    • 数据质量:清晰端正的字迹和高质量的图像能够显著提升识别效果。建议单字大小保持在10-50像素内以获得最佳效果。
    • 数据量:标注数据量越大,模型效果越好。通常情况下,标注100+份样本时,模型表现会较为理想;若数据量达到200+份,准确率会有进一步提升。
    • 字段标注完整性:标注框需尽量贴合字段文字,并确保字段类型选择正确。通过调整字段类型或高级选项,可以进一步提高精准度。
  3. 预置能力支持
    如果使用预置能力(如FormUIE),在不进行模型训练的情况下,预标注准确率预估在50%-80%之间。但此方法适用于快速验证阶段,若对准确率要求较高,则需要通过标注数据和模型训练来优化。

  4. 调优建议

    • 确保测试图片与模板图片为同一版式,避免因版式差异导致匹配失败。
    • 调整字段框选范围,覆盖字段可能出现的最大区域,避免识别结果不完整。
    • 检查字段类型设置是否合理,例如将数字字段设置为“数字”类型,而非“常规”类型,以提高识别准确性。

综上所述,在满足高质量数据、充分标注和合理配置的前提下,报关单识别的准确率可以达到95%以上。如果仅使用预置能力而不进行模型训练,准确率可能在50%-80%之间。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答