开发者社区 > 视觉智能 > 文字识别 > 正文

文档智能和文字识别(OCR)的关系是什么?

想问下,文档智能和文字识别(OCR)的关系是什么?

文档智能:https://help.aliyun.com/document_detail/2543820.html?spm=a2c4g.477663.0.0.3bcb2509TXmx5d

文字识别(OCR):https://help.aliyun.com/document_detail/270960.html?spm=a2c4g.272495.0.0.577d5188VAXjbC识别司法文书 提取里面的结构化数据 感觉是不是得用「OCR自学习能力」里面的「长文档信息抽取」

展开
收起
小小鹿鹿鹿 2023-09-18 13:46:35 174 0
6 条回答
写回答
取消 提交回答
  • 十分耕耘,一定会有一分收获!

    楼主你好,阿里云的文档智能和文字识别(OCR)有一定的关系,但两者的功能和应用场景有所不同。

    文档智能是一种针对扫描电子版、复印件、拍照等非结构化文档数据进行识别、提取、转换、处理等一系列操作的技术。它可以自动识别文档中的各种信息,例如表格、文字、图片等,并将其转化为结构化数据,以方便后续的数据挖掘、分析等操作。

    文字识别(OCR)则是一种将印刷或手写文字转换成可编辑文本的技术。它可以自动识别图片、扫描件等中的文字信息,并将其转化为可编辑的文本格式,以便于后续的处理、存储和分享。

    在实际应用中,文字识别(OCR)可以作为文档智能的一部分,用于提取文档中的文字信息。阿里云的OCR自学习能力中的长文档信息抽取功能,可以将OCR技术应用到长篇文档中,实现自动分页、文本排版、结构化数据提取等功能。这种技术的应用可以大大提高文档数字化和信息化的效率,为企业和用户带来更多的便利。

    2023-09-25 09:22:33
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    文档智能和文字识别(OCR)是两个相关但不完全相同的概念。下面简要介绍它们之间的关系:
    image.png

    • 文字识别(OCR):文字识别是一项技术,旨在将图像或扫描的文档中的印刷或手写文字转换为可编辑和可搜索的电子文本。OCR技术通过自动识别和解析图像中的文字,并将其转换为计算机可处理的文本格式,从而使得这些文字可以进行搜索、存储、编辑和分析等操作。
      image.png

    • 文档智能:文档智能是基于人工智能和机器学习技术的应用领域,旨在对文档进行自动处理和分析。文档智能涉及到对文档的理解、提取信息、分类、摘要生成、语义分析、自动翻译等任务。其中,文字识别(OCR)通常作为文档智能的一个重要组成部分,用于将文档中的文字提取出来以供后续的分析和处理。

    2023-09-19 15:45:25
    赞同 展开评论 打赏
  • 文档智能和文字识别(OCR)是相关但不完全相同的概念。
    image.png

    文档智能(Document Intelligence)是一种综合技术,涉及对文档的分析、理解和处理。它使用人工智能和自然语言处理等技术,可以对文本内容进行提取、分类、摘要、实体识别、关系抽取等操作,以帮助用户更好地管理和利用大量的文本数据。
    image.png

    文字识别(Optical Character Recognition,OCR)则是文档智能中的一个重要组成部分。OCR 技术旨在将图片或扫描件中的文字转换为可编辑的文本格式。它通过图像处理、模式识别和机器学习等方法,识别并提取出图片中的文字信息。OCR 可以应用于各种场景,如扫描文档的数字化、表格数据的提取、名片识别等。

    因此,OCR 是一种用于文字识别的具体技术,而文档智能则是一个更广泛的概念,涵盖了对文档的整体理解和处理。

    2023-09-18 19:29:23
    赞同 展开评论 打赏
  • 文档智能和文字识别(OCR)都是人工智能领域的技术,它们在处理文本数据方面有着密切的联系。

    文档智能主要关注从非结构化的文本数据中提取结构化信息的能力。这包括自然语言理解(NLU)、实体识别(NER)、关系抽取(RE)、事件抽取(EE)等任务。文档智能的目标是从原始文本中提取关键信息,以便进一步分析和处理。
    1ddd358bab242d5d1535474743aaddec_p496647.png

    文字识别(OCR)则侧重于将图像中的文本转换为计算机可读的形式。OCR技术可以识别多种字体、大小和颜色的文本,并将它们转换为电子文档。OCR技术的应用范围非常广泛,包括自动驾驶、医疗诊断、金融服务、法律行业等。
    16cc975d873d149d25c674d00fe68c4e_p292384.png

    虽然这两者在目标上有所区别,但在实践中,它们往往会被结合在一起使用。例如,当你想要从一份PDF文件中提取文本时,你可能需要同时使用文档智能和OCR技术。前者用于识别文档中的关键实体和关系,后者用于将图像中的文本转换为可编辑的文本。

    在这个场景下,“识别司法文书”实际上就是一种文档智能的应用。通过使用深度学习和其他机器学习技术,我们可以从中提取出关键信息,如案件名称、当事人姓名、判决日期等。然后,再使用OCR技术将这些文本从图像中提取出来。

    所以,可以说文档智能和OCR技术是相辅相成的,它们共同为我们提供了强大的工具来处理复杂的文本数据。

    2023-09-18 16:56:21
    赞同 展开评论 打赏
  • 从事java行业9年至今,热爱技术,热爱以博文记录日常工作,csdn博主,座右铭是:让技术不再枯燥,让每一位技术人爱上技术

    您好,文档智能是文字识别技术的进一步升级,除了文字识别,文档智能还综合运用自然语言处理、图像处理、电子文档解析、文档预训练模型等多种技术,实现对PDF/Word/Excel/图片等各类非结构化和半结构化文档的智能自动化处理。相较于文字识别只能处理固定版式的图片,文档智能技术能处理非固定版式且规则样式变化的多种格式文档。
    文档智能支持的文档格式有
    image.png
    文档智能的产品架构如下
    image.png

    2023-09-18 16:03:57
    赞同 展开评论 打赏
  • 阿里云OCR文档自学习平台用户答疑群:群号:26560014923。看需求。此回答整理自钉群【官方】阿里云OCR公共云客户交流群。

    2023-09-18 14:51:40
    赞同 展开评论 打赏
滑动查看更多

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载