文字识别OCR还有空格怎么也保留呢？

文字识别OCR还有空格怎么也保留呢？标注的时候空格是有的，但是模型训练完之后体验的时候就都没有空格了 lQLPJxv5NYaXGPTNAQnNAtCw5TTWadZkCJAE6rS9oIC5AA_720_265.png

展开

收起

三分钟热度的鱼 2023-09-13 19:02:02 819 版权

4 条回答

写回答

取消提交回答

六月的雨在钉钉

从事java行业9年至今，热爱技术，热爱以博文记录日常工作，csdn博主，座右铭是：让技术不再枯燥，让每一位技术人爱上技术

您好，您可以尝试一下文字识别OCR文档自学习的自定义表格模板，通过一张模板数据的可视化拖拉拽配置参照字段、识别字段或表头&待识别的列表区域，字段属性等，无需进行数据标注和模型训练，即可实现相同版式数据的自定义结构化识别抽取。

具体的操作步骤可以参考文档：文档

2023-09-22 14:41:12

赞同展开评论
三掌柜666

十分耕耘，一定会有一分收获！

楼主你好，阿里云文字识别OCR的识别结果可能会去掉空格。如果您需要保留空格，可以尝试在识别结果中添加空格并重新训练模型。另外，您可以尝试在OCR识别之前使用文本清洗技术，例如移除多余空格或添加缺失空格，以帮助提高OCR的准确性和空格的保留。

2023-09-17 13:01:56

赞同展开评论
Star时光
要保留文字识别OCR中的空格，您可以尝试以下方法：
1. 调整OCR参数：某些OCR服务提供商可能具有用于调整识别结果的参数设置。您可以查看相关文档或API参考，了解是否有与空格相关的参数选项。尝试更改参数设置以确保空格被正确识别和保留。
2. 使用特殊字符处理：有些OCR服务会将空格识别为普通字符，而不是保留其作为空格。在处理识别结果时，您可以使用特殊字符处理功能来替换这些字符为实际的空格。例如，您可以将特殊字符替换为Unicode编码中的空格字符（U+0020）。
3. 后处理和规则定义：在进行OCR后，您可以应用后处理步骤来处理识别结果并保留空格。这可以通过使用正则表达式或其他字符串处理技术来实现。您可以编写适当的规则和逻辑来检测和保留空格。
4. 自定义模型训练：对于一些OCR服务，您可能有机会使用自定义模型进行训练。通过提供包含空格样本的训练数据，您可以训练OCR模型以更好地识别和保留空格。这需要更多的工作和资源，但可以提高空格保留的准确性。
2023-09-13 21:01:37

赞同展开评论
圆不溜秋的小猫猫

这个用表格模型就可以解决。此回答整理自钉群“【官方】阿里云OCR文档自学习用户答疑群”

2023-09-13 19:18:58

赞同展开评论

文字识别OCR还有空格怎么也保留呢？

文字识别

相关文章

热门讨论

热门文章