文字识别OCR现在pdf 能解析吗？有个图高的像素 10000+ 是不是解析不出来。

展开

收起

三分钟热度的鱼 2023-08-29 14:57:51 347 版权

7 条回答

写回答

取消提交回答

六月的雨在钉钉

从事java行业9年至今，热爱技术，热爱以博文记录日常工作，csdn博主，座右铭是：让技术不再枯燥，让每一位技术人爱上技术

您好，文字识别OCR部分场景功能支持PDF解析，比如增值税发票识别、混贴发票识别、火车票识别、航空行程单识别、定额发票识别、通用机打发票识别、增值税发票卷票识别。l
另外OCR识别接口均支持图片格式数据，包括：.jpg/.jpeg/.png/.bmp./gif./tiff./webp，请注意图片大小不超过10M，最短边大于15像素，最长边不超过8192像素；超过指定像素可能解析不出来或者解析出错

2023-08-30 15:57:27

赞同展开评论
三掌柜666

十分耕耘，一定会有一分收获！

楼主你好，是的，阿里云文字识别OCR目前支持PDF格式的解析，但对于像素数过高的图片，可能无法完全识别其中的文本。建议将图片进行压缩或切割，以提高识别效果。

2023-08-30 10:37:51

赞同展开评论
玥轩
是的，文字识别OCR可以解析PDF文件。但是，如果PDF文件中的高像素图像导致OCR无法解析文本，则可能会出现问题。为了解决这个问题，您可以尝试以下方法：
1. 将PDF文件转换为JPEG或PNG格式，然后再使用OCR技术进行识别。
2. 使用OCR软件的高级选项来提高识别率。例如，您可以选择更高的分辨率或更高质量的设置。
3. 如果您的PDF文件中的高像素图像仍然无法被OCR识别，则可能需要重新扫描原始文档，并确保扫描时使用高分辨率和高质量的设置。
2023-08-30 08:22:56

赞同展开评论
魏红斌

天下风云出我辈，一入江湖岁月催，皇图霸业谈笑中，不胜人生一场醉。

只有票证支持pdf,单张图片大小不超过10M, 且图片最长边不超过8192像素，最短边不小于15像素。当长边超过1024像素时，长宽比不超过1:50。
建议单字大小保持在10-50像素内，以获得较好的识别效果。
.pdf/.ofd 类型文件，仅识别第一页阿里云混贴发票识别，是阿里云官方自研OCR文字识别产品，适用于获取多种发票集合在一个页面的场景，需要获取多种发票上的关键信息。
阿里云OCR产品基于阿里巴巴达摩院强大的AI技术及海量数据，历经多年沉淀打磨，具有服务稳定、操作简易、实时性高、能力全面等几大优势。

2023-08-30 00:23:28

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
阿里云的文字识别OCR服务目前是支持解析PDF文件的，可以提取其中的文字内容。无论PDF的像素多高，OCR服务都应该能够处理。

然而，对于非常高分辨率的图像（例如像素数超过10,000的图像），会有一些注意事项：
1. 处理时间：对于高分辨率的图像，OCR可能需要更长的处理时间来完成解析。这是因为高分辨率图像包含更多的细节和数据量，需要更多的计算资源来进行处理。
2. 图像预处理：在将高分辨率图像传递给OCR服务之前，建议先进行必要的图像预处理。这可能包括降低图像的分辨率、压缩图像大小或者裁剪图像以减少处理的复杂性。这样做可以提高处理效率并降低潜在的问题。
2023-08-29 18:00:30

赞同展开评论
wljslmz

公众号：网络技术联盟站，InfoQ签约作者，阿里云社区签约作者，华为云云享专家，BOSS直聘创作王者，腾讯课堂创作领航员，博客+论坛：https://www.wljslmz.cn，工程师导航：https://www.wljslmz.com

阿里云的文字识别OCR服务可以处理PDF文档，并且支持对PDF中的文字进行识别和提取。您可以将PDF文档作为输入，进行文字识别操作。

关于图像的大小和分辨率，OCR服务通常有一定的限制。阿里云OCR服务对于图像的大小和分辨率有一定的限制，超过一定范围可能会导致识别结果不准确或无法识别。

对于高像素的图像，例如像素超过10000的图像，其中的细节可能会对识别结果产生影响。较大的图像需要更长的处理时间，并且在分析图像时会对计算和内存资源有更高的要求。因此，处理较大图像时可能会导致性能下降或无法正常识别。

2023-08-29 17:07:12

赞同展开评论
圆不溜秋的小猫猫

参考https://market.aliyun.com/products/57124001/cmapi00043678.html?spm=5176.730005.result.2.78cd3524WMVOlS&innerSource=search_pdf%E8%AF%86%E5%88%AB#sku=yuncode37678000010 页数不超过20页，此回答整理自钉群“阿里云读光OCR客户交流反馈群 1”

2023-08-29 16:11:06

赞同展开评论

滑动查看更多

文字识别OCR现在pdf 能解析吗？有个图高的像素 10000+ 是不是解析不出来。

文字识别

相关文章

热门讨论

热门文章

文字识别OCR现在pdf 能解析吗？有个图 高的像素 10000+ 是不是解析不出来。

文字识别

相关文章

热门讨论

热门文章

文字识别OCR现在pdf 能解析吗？有个图高的像素 10000+ 是不是解析不出来。