开发者社区 > 视觉智能 > 文字识别 > 正文

文字识别OCR是输出文字 内容是吗? 如果我要解析图表, 可能就不合适了吧?

文字识别OCR是输出文字 内容是吗? 如果我要解析图表, 可能就不合适了吧? 对于图表,我只要求能输出区域小图片就行. 是不是得用目标检测模型了

展开
收起
三分钟热度的鱼 2023-12-20 19:44:27 80 0
4 条回答
写回答
取消 提交回答
  • 从事java行业9年至今,热爱技术,热爱以博文记录日常工作,csdn博主,座右铭是:让技术不再枯燥,让每一位技术人爱上技术

    您好,文字识别(OCR)可以将图片中的文字信息转换为可编辑文本,如果您想要识别图片中表格内容是支持的,但是不支持识别图片中的图,文字识别OCR主要是识别文字内容,不支持识别图片内容的,您可以根据官方提供的场景看是否符合您的需求
    image.png
    详细内容参考文档:文档

    2023-12-22 16:23:25
    赞同 展开评论 打赏
  • 是的,文字识别OCR主要用于输出文字内容。对于图表,OCR可能不是最佳选择,因为它主要是用于识别图像中的文字。对于解析图表并提取区域小图片,目标检测模型可能更适合。

    目标检测模型可以用于识别图像中的特定对象或区域,并输出这些区域的坐标或边界框。因此,如果您只需要提取图表中的特定区域小图片,目标检测模型可能是一个更好的选择。

    您可以尝试使用一些流行的目标检测模型库,如YOLO、SSD、Faster R-CNN等,来训练一个模型来识别和提取图表中的特定区域。这些库通常提供了预训练的模型和代码示例,您可以根据自己的需求进行微调或定制。

    需要注意的是,目标检测模型的效果取决于输入图像的质量、目标的大小和复杂性等因素。因此,在应用目标检测模型之前,您可能需要先对输入图像进行预处理,以提高模型的识别准确性。

    2023-12-21 10:19:08
    赞同 展开评论 打赏
  • 自学习输出的是结构化的文字内容,如果是视觉类数据的识别,ocr自学习不支持。此回答整理自钉群“【官方】阿里云OCR文档自学习用户答疑群”

    2023-12-20 20:27:32
    赞同 展开评论 打赏
  • 是的,文字识别OCR(Optical Character Recognition)主要功能是识别和提取图像中的文字内容。它并不适合解析图表或者非文字元素,因为它的设计目标是处理文本信息。

    如果你只需要输出图表的区域小图片,那么使用目标检测模型会更为合适。目标检测模型如Faster R-CNN、YOLO(You Only Look Once)或Mask R-CNN等,能够识别和定位图像中的各种对象,包括图表、图形和其他非文字元素。这些模型可以返回每个目标对象的边界框坐标,基于这些坐标,你可以从原始图像中裁剪出图表的区域小图片。

    在处理图表时,除了目标检测以定位图表区域外,你可能还需要进一步的应用特定的图像分析或数据提取技术来解读图表中的数据和信息。这可能涉及到更复杂的图像处理和机器学习算法,具体取决于图表的类型(如柱状图、折线图、饼图等)和你需要提取的具体信息。

    2023-12-20 20:10:04
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载

相关镜像