在文字识别OCR哪种识别率/准确率会更高？

想问一下...."表格抽取"20+个模板....
1.直接混着训练出结果
2.分开20个模板单独训练+分类器

在文字识别OCR哪种识别率/准确率会更高？20个模板算是同一类型的数据....板式差别巨大...而且同一版式都有可能位置有偏差(歪了,移位了,表格同一列宽度不一样等)

展开

收起

三分钟热度的鱼 2023-11-01 10:05:00 105 0

3 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

通常来说，对于相同类型的表格，分开20个模板单独训练+分类器的方式可以获得更高的识别率和准确率。因为这种方式允许模型针对每种模板的特点进行专门的学习，从而更好地捕获各种不同表格之间的差异。
但是，由于您的表格样式差别较大，同一版式的表格也可能存在位置偏移等情况，因此可能需要额外的努力来克服这些问题。例如，可以考虑增加更多的样本，以覆盖更多的变化情况；或者采用更加复杂的模型架构，以便更好地应对表格的多样性和变化性。
此外，建议您在模型训练完成后，通过交叉验证和评估等方式来确认模型的实际表现，并据此调整模型的参数和超参数，以进一步提升识别率和准确率。

2023-11-01 13:19:15

赞同展开评论打赏
sunrr
在文字识别OCR中，识别率和准确率主要取决于训练数据和模型的选择。对于你的问题，我有以下几点建议：
1. 混合训练：如果你的20个模板之间有足够的差异，那么混合训练可能会得到更好的结果。因为这样可以利用更多的数据来训练模型，提高模型的泛化能力。但是，如果模板之间的差异很小，那么混合训练可能会导致模型过拟合，降低识别率和准确率。
2. 分开训练：如果你的20个模板之间的差异很大，那么分开训练可能会有更好的效果。因为这样可以避免模型学习到错误的模式，提高模型的鲁棒性。但是，如果模板之间的差异很小，那么分开训练可能会导致模型欠拟合，降低识别率和准确率。
3. 分类器：对于你的情况，我建议你可以使用一种叫做多任务学习的技术。在这种技术中，你可以同时训练多个模型（每个模型对应一个模板），然后使用一个分类器来决定使用哪个模型。这种方法可以在保持模型鲁棒性的同时，充分利用所有的数据。
总的来说，选择哪种方法取决于你的具体需求和数据。我建议你尝试不同的方法，然后比较它们的效果，选择最好的方法。
2023-11-01 11:56:55

赞同展开评论打赏
圆不溜秋的小猫猫

可以放一起训练，每个板式都覆盖到，训练数据越多效果越好。此回答整理自钉群“【官方】阿里云OCR文档自学习用户答疑群”

2023-11-01 10:13:06

赞同展开评论打赏