文字识别OCR文档自学习里的自定义KV模板只能上传一张样板图，那一些旋转的图片是怎么识别？

展开

收起

三分钟热度的鱼 2023-09-27 14:32:14 288 版权

4 条回答

写回答

取消提交回答

三掌柜666

十分耕耘，一定会有一分收获！
楼主你好，阿里云文字识别OCR文档自学习里的自定义KV模板可以通过训练来识别旋转的图片。具体来说，可以采用以下两种方法：
1. 通过训练样本来识别旋转的图片。在训练时，可以将不同角度的图片作为训练样本，让模型自动学习如何识别旋转的图片。
2. 在上传样板图时，可以选择将样板图进行旋转，使其包含不同角度的信息。这样，模型就能够学习到不同角度下的特征，从而提高识别准确率。
需要注意的是，如果旋转的角度过大或出现了扭曲等情况，可能会对识别准确率造成影响。因此，在训练时需要尽可能考虑各种情况，以获得更好的效果。
2023-09-30 08:25:04

赞同展开评论
六月的雨在钉钉

从事java行业9年至今，热爱技术，热爱以博文记录日常工作，csdn博主，座右铭是：让技术不再枯燥，让每一位技术人爱上技术

您好，文字识别OCR文档自学习的自定义KV模版需上传字迹清晰且无旋转的模板图片

然后框选参照字段，配置识别字段，最后测试和发布后即可在线调用，目前应是不支持旋转图片，建议参照官方文档上传符合条件的模版图片。

2023-09-28 21:49:31

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
对于文字识别OCR的文档自学习功能中的自定义KV模板，目前只支持上传一张样本图片进行标注。这意味着如果你的图片包含旋转的文本，可能无法直接使用自定义KV模板来正确识别旋转的文本。

在处理旋转的图片时，你可以尝试以下方案：
1. 预处理图像：在使用自定义KV模板之前，先对旋转的图片进行预处理。使用图像处理库（如PIL、OpenCV等）可以进行图像旋转操作，将旋转的文本调整为水平或垂直方向。这样，你就能够使用自定义KV模板来正确识别文本。
2. 使用通用OCR功能：如果旋转的文本较多或难以预测，并且自定义KV模板无法应对，你可以考虑使用文字识别OCR的通用OCR功能。通用OCR功能对于不同角度和旋转程度的文本具有更好的适应性和鲁棒性，在某些情况下可以正确识别旋转的文本。
2023-09-27 17:24:55

赞同展开评论
圆不溜秋的小猫猫

我们是有内置自动旋转能力的，在配置的时候勾选即可。此回答整理自钉群“【官方】阿里云OCR文档自学习用户答疑群”

2023-09-27 15:01:51

赞同展开评论

文字识别OCR文档自学习里的自定义KV模板只能上传一张样板图，那一些旋转的图片是怎么识别？

文字识别

相关文章

热门讨论

热门文章