开发者社区 问答 正文

文档智能里的进出口报关单识别,是针对固定的中国海关进出口报关单格式,还是说自定义的那种格式?

文档智能里的进出口报关单识别,是针对固定的中国海关进出口报关单格式,还是说自定义的那种格式?

展开
收起
十一0204 2023-12-19 19:20:38 149 分享 版权
阿里云 AI 助理回答

文档智能中的进出口报关单识别功能,主要针对的是固定版式的中国海关进出口报关单格式。根据知识库资料,文档智能提供了两种主要的技术方案:自定义KV模板信息抽取模型,分别适用于不同的场景需求。

1. 固定版式场景

如果您的业务涉及的是固定版式的中国海关进出口报关单,可以使用自定义KV模板功能。该功能通过可视化拖拉拽的方式配置模板,仅需提供一张样图即可完成模板搭建,无需进行数据标注和模型训练。这种方式适用于以下特点的场景: - 数据版式固定,字段位置明确且不变。 - 对字段抽取准确率要求不高(准确率可达85%以上)。 - 适合少样本冷启动阶段,快速上线验证。

因此,如果您的报关单是中国海关的标准格式,且版式固定,推荐使用自定义KV模板来实现结构化信息抽取。

2. 自定义或多样版式场景

如果您的报关单格式并非完全固定,或者存在多种版式(例如不同国家或地区的报关单),则需要使用信息抽取模型。该模型通过标注少量数据(至少20张图片)并进行训练,能够实现对版式相对固定的单据、票证类数据的高精度识别(准确率可达95%以上)。这种方式适用于以下特点的场景: - 数据版式相对固定或可枚举(不超过50种)。 - 需要较高的字段抽取准确率。 - 样本数量较为充足,支持持续优化模型效果。

总结

  • 如果是固定版式的中国海关进出口报关单,建议使用自定义KV模板功能。
  • 如果是自定义或多样版式的报关单,建议使用信息抽取模型功能。

重要提示:在选择方案时,请确保数据质量清晰端正,并根据实际业务需求评估对字段抽取准确率的要求。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答