备案控制台

开发者社区视觉智能文字识别正文

请教一下大神，ocr这种情况要怎么解决呀？情况说明：上传PDF至OCR文档自学习中进行数据集的新建、

请教一下大神，ocr这种情况要怎么解决呀？情况说明：上传PDF至OCR文档自学习中进行数据集的新建、亦或者是建模后进行在线使用时，只要上传PDF，转化出来的图片后，数字2后面出现小数点就会拥挤在一起。这种情况导致了要使用阿里云OCR必须自己先将PDF转为高清图片，不然无法适配数字2后面有小数点的情况。OCR识别时会忽略小数点，人工校验也会容易被误导。

展开

收起

真的很搞笑 2023-06-28 17:44:53 125 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

nanana~~

是个只会写bug的程序媛啊！！！

可以通过图片放大来增加正确小数的数量。但是这样可能还会有一小部分小数不能被正确识别。之后就可以更改pytesseract的语言设置：使用非英语设置，将配置更改为lang = 'eng'解决了所有剩余问题

2023-06-30 10:51:34

赞同展开评论
芯在这

后面这张图片你是在在线使用的时候截图的还是，上传到标注任务后截图的呢，此回答整理自钉群“【官方】阿里云OCR文档自学习用户答疑群”

2023-06-28 17:55:54

赞同展开评论

问答分类：

文字识别文字识别视觉智能开放平台

问答标签：

PDF ocr PDF文档印刷文字识别pdf PDF学习印刷文字识别文档

问答地址：

开发者社区 > 视觉智能 > 文字识别 > 问答

相关问答

印刷文字识别

阿里云有没有什么产品能把身份证照片识别出来，进行抠图处理，再拼接成pdf文档的。类似全能扫描王类那种

42

0

0

AddFile接口上传pdf文档找不到入参category

279

1

0

AddFile接口上传pdf文档会解析失败

664

3

0

文字识别OCR PDF里面有多张发票的话，可以全部识别嘛？

115

2

0

对于体检报告pdf要想提取里边的所有数据用文字识别OCR什么产品比较好？

134

1

0

文字识别OCR证件识别返回的这个字段，为啥不加到文档里面呀？

95

1

0

文字识别OCR看文档说明，篡改阈值推荐 60，这个值越大，篡改的可能性就越大？

115

1

0

访问CDN中图片显示跨域问题，而PDF文档正常的情况怎么解决？

130

0

0

在文字识别OCR中，带有水印的pdf解析应该使用哪个产品？

160

3

0

在文字识别OCR中，有这种发票类型的细分文档吗？

109

3

0

视觉智能

文字识别

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景，满足认证、鉴权、票据流转审核等业务需求。

我要提问

相关文章

报关单OCR识别-进出口海关报关单识别接口返回参数-文字识别

验证码识别

通过人工智能平台PAI部署DeepSeek-OCR模型官网控制台部署

技术赋能医药全链路：AI 大模型应用在药企的落地痛点与破局之道

Qwen3-Omni新升级:声形意合，令出智随！

热门讨论

热门文章

文字识别OCR目前有哪些情况会导致识别失败？

文字识别OCR识别失败是因为什么？报错 code 464

OCR营业执照识别失败什么原因？

文字识别OCR支持图片分类吗？

OCR发票识别不到？

文字识别OCR这个识别，咋都跑偏了，而且非常不准，请问，如何改善？

文字识别OCR怎么错误代码401？

文字识别ocr识别图片有大小限制吗？

文字识别OCR体验了一下，识别不出来，麻烦帮我看下怎么解决？

文字识别OCR 数字识别会偶尔出错怎么办？

展开全部

基于深度学习的自然场景文字检测及端到端的OCR中文文字识别

图像文字识别(OCR)用什么算法小结

吴恩达《机器学习》课程总结（18）应用实例：图片文字识别

OCR文字识别技术总结（一）

分析对比大模型OCR、传统OCR和深度学习OCR

【全自动改PDF名】批量OCR识别提取PDF自定义指定区域内容保存到 Excel 以及根据PDF文件内容的标题来批量重命名

【PDF提取全自动改名】如何批量提取PDF指定区域的文字内容，用内容批量给PDF命名或者导出表格，学会全自动解放双手

OCR文字识别方法综述

合合信息——用智能文字识别技术赋能古彝文原籍数字化

从图片提取文字的终极解决方法 ——【通用文字识别 API】

展开全部

还有其他疑问?