开发者社区 > 视觉智能 > 文字识别 > 正文

文字识别OCR现在pdf 能解析吗?有个图 高的像素 10000+ 是不是解析不出来。

文字识别OCR现在pdf 能解析吗?有个图 高的像素 10000+ 是不是解析不出来。

展开
收起
三分钟热度的鱼 2023-08-29 14:57:51 103 0
7 条回答
写回答
取消 提交回答
  • 从事java行业9年至今,热爱技术,热爱以博文记录日常工作,csdn博主,座右铭是:让技术不再枯燥,让每一位技术人爱上技术

    您好,文字识别OCR部分场景功能支持PDF解析,比如增值税发票识别、混贴发票识别、火车票识别、航空行程单识别、定额发票识别、通用机打发票识别、增值税发票卷票识别。l
    另外OCR识别接口均支持图片格式数据,包括:.jpg/.jpeg/.png/.bmp./gif./tiff./webp,请注意图片大小不超过10M,最短边大于15像素,最长边不超过8192像素;超过指定像素可能解析不出来或者解析出错

    2023-08-30 15:57:27
    赞同 展开评论 打赏
  • 十分耕耘,一定会有一分收获!

    楼主你好,是的,阿里云文字识别OCR目前支持PDF格式的解析,但对于像素数过高的图片,可能无法完全识别其中的文本。建议将图片进行压缩或切割,以提高识别效果。

    2023-08-30 10:37:51
    赞同 展开评论 打赏
  • 是的,文字识别OCR可以解析PDF文件。但是,如果PDF文件中的高像素图像导致OCR无法解析文本,则可能会出现问题。为了解决这个问题,您可以尝试以下方法:

    1. 将PDF文件转换为JPEG或PNG格式,然后再使用OCR技术进行识别。
    2. 使用OCR软件的高级选项来提高识别率。例如,您可以选择更高的分辨率或更高质量的设置 。
    3. 如果您的PDF文件中的高像素图像仍然无法被OCR识别,则可能需要重新扫描原始文档,并确保扫描时使用高分辨率和高质量的设置。
    2023-08-30 08:22:56
    赞同 展开评论 打赏
  • 天下风云出我辈,一入江湖岁月催,皇图霸业谈笑中,不胜人生一场醉。

    只有票证支持pdf,单张图片大小不超过10M, 且图片最长边不超过8192像素,最短边不小于15像素。当长边超过1024像素时,长宽比不超过1:50。
    建议单字大小保持在10-50像素内,以获得较好的识别效果。
    .pdf/.ofd 类型文件,仅识别第一页阿里云混贴发票识别,是阿里云官方自研OCR文字识别产品,适用于获取多种发票集合在一个页面的场景,需要获取多种发票上的关键信息。
    阿里云OCR产品基于阿里巴巴达摩院强大的AI技术及海量数据,历经多年沉淀打磨,具有服务稳定、操作简易、实时性高、能力全面等几大优势。
    image.png

    2023-08-30 00:23:28
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    阿里云的文字识别OCR服务目前是支持解析PDF文件的,可以提取其中的文字内容。无论PDF的像素多高,OCR服务都应该能够处理。

    然而,对于非常高分辨率的图像(例如像素数超过10,000的图像),会有一些注意事项:

    1. 处理时间:对于高分辨率的图像,OCR可能需要更长的处理时间来完成解析。这是因为高分辨率图像包含更多的细节和数据量,需要更多的计算资源来进行处理。

    2. 图像预处理:在将高分辨率图像传递给OCR服务之前,建议先进行必要的图像预处理。这可能包括降低图像的分辨率、压缩图像大小或者裁剪图像以减少处理的复杂性。这样做可以提高处理效率并降低潜在的问题。

    2023-08-29 18:00:30
    赞同 展开评论 打赏
  • 公众号:网络技术联盟站,InfoQ签约作者,阿里云社区签约作者,华为云 云享专家,BOSS直聘 创作王者,腾讯课堂创作领航员,博客+论坛:https://www.wljslmz.cn,工程师导航:https://www.wljslmz.com

    阿里云的文字识别OCR服务可以处理PDF文档,并且支持对PDF中的文字进行识别和提取。您可以将PDF文档作为输入,进行文字识别操作。

    关于图像的大小和分辨率,OCR服务通常有一定的限制。阿里云OCR服务对于图像的大小和分辨率有一定的限制,超过一定范围可能会导致识别结果不准确或无法识别。

    对于高像素的图像,例如像素超过10000的图像,其中的细节可能会对识别结果产生影响。较大的图像需要更长的处理时间,并且在分析图像时会对计算和内存资源有更高的要求。因此,处理较大图像时可能会导致性能下降或无法正常识别。

    2023-08-29 17:07:12
    赞同 展开评论 打赏
  • 2023-08-29 16:11:06
    赞同 展开评论 打赏
滑动查看更多

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载

相关镜像