开发者社区 > 视觉智能 > 文字识别 > 正文

文字识别OCR这里为什么不是一条数据二十每一行一条数据?

文字识别OCR这里为什么不是一条数据二十每一行一条数据?题目都是一样的,以前是一条数据515b86c8acfd680d060da53232c16ed9.png
381e218907aa0026cce9baa59eb4c1e1.png

展开
收起
真的很搞笑 2024-01-04 14:05:17 68 0
2 条回答
写回答
取消 提交回答
  • 要按照一个大框去标的才可以,和单证票据模型标注粒度不一样 ,此回答整理自钉群“【官方】阿里云OCR文档自学习用户答疑群”

    2024-01-04 17:08:01
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    文字识别OCR(Optical Character Recognition)是一种将图像中的文字转换为可编辑文本的技术。在处理包含多行文字的图像时,通常会按照每一行生成一条数据的方式进行处理。

    这样做的原因有以下几点:

    1. 语义理解:每行文字通常代表一个完整的句子或段落,将其作为一条数据进行处理可以更好地保留原文的语义信息。如果将多行文字合并为一条数据,可能会导致语义信息的丢失或混淆。

    2. 文本处理:对于包含多行文字的图像,每行文字可能需要进行不同的后续处理操作,例如分词、命名实体识别等。将每行文字作为一条数据进行处理可以更方便地进行这些操作。

    3. 错误纠正:在文字识别过程中,可能会出现误识别的情况。将每行文字作为一条数据进行处理可以提高错误纠正的准确性和灵活性。如果将多行文字合并为一条数据,可能会增加错误纠正的难度。

    2024-01-04 16:25:58
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载