开发者社区 > 视觉智能 > 文字识别 > 正文

文字识别OCR还有空格怎么也保留呢?

文字识别OCR还有空格怎么也保留呢?标注的时候空格是有的,但是模型训练完之后体验的时候就都没有空格了lQLPJxv5NYaXGPTNAQnNAtCw5TTWadZkCJAE6rS9oIC5AA_720_265.png

展开
收起
三分钟热度的鱼 2023-09-13 19:02:02 228 0
4 条回答
写回答
取消 提交回答
  • 从事java行业9年至今,热爱技术,热爱以博文记录日常工作,csdn博主,座右铭是:让技术不再枯燥,让每一位技术人爱上技术

    您好,您可以尝试一下文字识别OCR文档自学习的自定义表格模板,通过一张模板数据的可视化拖拉拽配置参照字段、识别字段或表头&待识别的列表区域,字段属性等,无需进行数据标注和模型训练,即可实现相同版式数据的自定义结构化识别抽取。
    image.png
    具体的操作步骤可以参考文档:文档

    2023-09-22 14:41:12
    赞同 展开评论 打赏
  • 十分耕耘,一定会有一分收获!

    楼主你好,阿里云文字识别OCR的识别结果可能会去掉空格。如果您需要保留空格,可以尝试在识别结果中添加空格并重新训练模型。另外,您可以尝试在OCR识别之前使用文本清洗技术,例如移除多余空格或添加缺失空格,以帮助提高OCR的准确性和空格的保留。

    2023-09-17 13:01:56
    赞同 展开评论 打赏
  • 要保留文字识别OCR中的空格,您可以尝试以下方法:
    image.png
    image.png

    1. 调整OCR参数:某些OCR服务提供商可能具有用于调整识别结果的参数设置。您可以查看相关文档或API参考,了解是否有与空格相关的参数选项。尝试更改参数设置以确保空格被正确识别和保留。

    2. 使用特殊字符处理:有些OCR服务会将空格识别为普通字符,而不是保留其作为空格。在处理识别结果时,您可以使用特殊字符处理功能来替换这些字符为实际的空格。例如,您可以将特殊字符替换为Unicode编码中的空格字符(U+0020)。

    3. 后处理和规则定义:在进行OCR后,您可以应用后处理步骤来处理识别结果并保留空格。这可以通过使用正则表达式或其他字符串处理技术来实现。您可以编写适当的规则和逻辑来检测和保留空格。

    4. 自定义模型训练:对于一些OCR服务,您可能有机会使用自定义模型进行训练。通过提供包含空格样本的训练数据,您可以训练OCR模型以更好地识别和保留空格。这需要更多的工作和资源,但可以提高空格保留的准确性。

    2023-09-13 21:01:37
    赞同 展开评论 打赏
  • 这个用表格模型就可以解决。此回答整理自钉群“【官方】阿里云OCR文档自学习用户答疑群”

    2023-09-13 19:18:58
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载