开发者社区 > 视觉智能 > 文字识别 > 正文

文字识别OCR这个地方添加数据集,不一样的图片模版加到这里面也能识别吗?

文字识别OCR这个地方添加数据集,不一样的图片模版加到这里面也能识别吗?分类器这边都有分类,上面的那个是自动分类是吗?lQLPJxqfmduep3jNAc7NBkGwsTTyRDuemr4EvDbiIoD0AA_1601_462.png
lQLPJwAw9flQG_jNAezNBhawXDUjMKqqmoMEvDcWQ8D0AA_1558_492.png

展开
收起
三分钟热度的鱼 2023-08-08 10:11:25 104 0
8 条回答
写回答
取消 提交回答
  • 十分耕耘,一定会有一分收获!

    楼主你好,阿里云文字识别OCR可以通过添加不同的数据集来训练不同的模型,从而实现对不同类型的图片进行识别。如果你添加了新的模板图片,可以将其添加到相应的数据集中进行训练,从而提高识别准确率。分类器是一种用于将不同的数据分为不同类别的算法,而自动分类是指系统自己学习出不同的类别并对数据进行分类。一般来说,阿里云OCR会根据训练数据自动学习不同的类别并对数据进行分类,但也可以手动指定类别进行分类。

    2023-08-29 14:33:26
    赞同 展开评论 打赏
  • 北京阿里云ACE会长

    一个OCR数据集对应一个特定的识别场景,如身份证、驾驶证、银行卡等。

    添加到同一个数据集里的文本图像,必须保持相似的格式、字体、大小、位置等特征。

    OCR模型是基于一个数据集训练生成的,只能识别与该数据集相似的文本图像。

    所以添加不同类型的文本图像到同一个OCR数据集, 是不可行的。
    模型无法很好的处理这种 heterogeneity。

    至于"分类器", 是指OCR服务能自动识别添加的文本图像属于哪一类。
    但你必须先建立好这些类,将不同的图像加到对应的类中。

    所以答案是否定的,你描述的场景目前阿里云OCR不支持。

    如果需要识别不同类型的文本图像,需要建立多个OCR数据集,每一个对应一个识别类型。
    然后训练生成对应的模型。

    2023-08-09 19:02:52
    赞同 展开评论 打赏
  • 文字识别OCR的数据集通常用于训练机器学习模型,以便提高对不同字体、样式和布局的图片的识别准确性。如果你有不同的图片模板,可以将它们添加到数据集中进行训练,以帮助OCR系统更好地适应不同的图片样式。

    然而,需要明确的是,OCR的自动分类功能和使用分类器进行表格信息抽取是两个不同的概念:

    1. OCR的自动分类:当涉及到文字识别OCR时,自动分类一般指文本元素的自动识别和分类,例如识别和区分不同的文本行、标题、段落等。这种自动分类是在OCR系统内部实现的,并且通常会基于一些预定义的规则或算法进行处理。

    2. 使用分类器进行表格信息抽取:与OCR的自动分类不同,使用分类器进行表格信息抽取是一种额外的处理步骤,用于进一步解析和分类表格中的内容。这种分类器可以根据预定义的规则或使用机器学习算法来判断表格中不同元素的类别,如表头、行标题、列标题和数据单元格。

    总结起来,OCR的自动分类是指内部实现的自动识别和分类文本元素的功能,而使用分类器进行表格信息抽取是一种额外的处理步骤,用于解析和分类表格中的内容。这两个概念可以相互结合,以提高整体的文字识别和信息抽取准确性。

    2023-08-08 19:02:51
    赞同 展开评论 打赏
  • 天下风云出我辈,一入江湖岁月催,皇图霸业谈笑中,不胜人生一场醉。

    是的,您可以将不同的图片模板添加到OCR中,这样OCR就可以根据不同的图片模板来识别不同的文字内容。在OCR中,分类器是用来对识别出的文字进行分类的,例如将文字分类为中文、英文、数字等。如果您的OCR系统已经有了分类器,那么在识别文字时,OCR系统会将识别出的文字与分类器进行匹配,以确定文字的类别。这样,OCR系统就可以根据文字的类别来进行自动分类。

    2023-08-08 17:33:35
    赞同 展开评论 打赏
  • 发表文章、提出问题、分享经验、结交志同道合的朋友

    可以支持的,通过添加多个不同的数据集或模板,可以显著提升识别系统的适应性和准确性。这使OCR系统能够根据不同的图像样式、布局和内容类型进行自适应,从而更精准地识别各类文档。

    每个不同类型的文档可以有预定义的模板,其中包括结构、位置和预期文本字段。当进行图像识别时,OCR系统会尝试将图像与已定义模板匹配,然后提取模板中的文本字段。

    优点在于它在处理不同类型文档时提供更高准确性。通过为发票、身份证、表格等文档类型分别定义模板,可以有针对性地提取关键信息。

    2023-08-08 15:13:24
    赞同 展开评论 打赏
  • 从事java行业9年至今,热爱技术,热爱以博文记录日常工作,csdn博主,座右铭是:让技术不再枯燥,让每一位技术人爱上技术

    您好,文字识别OCR文档自学习添加数据集,对于同类型不一样的图片模板添加数据集是可以识别的,比如自定义表格模板,那么只要保持您添加的数据集都是表格数据即可。对于没有指定分类器的训练模型,用户通过设定分类器中的关键词或训练样本建立分类标准,完成对于已发布的自定义模板、信息抽取模型的自动匹配。

    2023-08-08 14:56:42
    赞同 展开评论 打赏
  • 不同版式的图片放到一个模型中训练,这个模型是可以自动识别已经训练过的版式的.此回答整理自钉群“【官方】阿里云OCR文档自学习用户答疑群”

    2023-08-08 13:51:00
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    是的,文字识别OCR通常支持添加多个不同的数据集或模板来进行识别。通过添加不同的图片模板,OCR系统可以学习和适应各种不同的布局、格式和样式的文本。

    当你使用OCR服务时,你可以预先定义一组模板,每个模板包含了特定类型的图像布局和要提取的文本字段。这些模板可以涵盖不同的发票、表格、身份证等文档类型。

    在识别过程中,OCR系统会针对输入的图像与已定义的模板进行匹配,并尝试提取对应的文本字段。如果输入的图像与某个模板匹配,则相应的文本字段将被提取出来。

    需要注意的是,添加数据集或模板并不是一种通用的方法,它通常是特定OCR服务提供商所提供的功能。具体支持和实现方式可能因OCR服务的平台和API而有所不同。

    2023-08-08 13:41:17
    赞同 展开评论 打赏
滑动查看更多

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载