文档备案控制台

开发者社区视觉智能文字识别正文

图片倾斜了就识别不出来了,在文字识别OCR 有改进的方法吗？

我制作了一个自定义的KV模板, 对于标准的图片识别效果很好, 但是图片倾斜了就识别不出来了,在文字识别OCR 有改进的方法吗？

展开

收起

三分钟热度的鱼 2024-07-11 08:26:00 564 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

aliyun7689123603-22772
在进行文字识别时，图片的倾斜确实可能影响识别的准确性。不过，OCR技术（光学字符识别）已有相应的改进方法来处理此类问题：
1. 自动图像校正：现代OCR技术，包括阿里云的OCR服务，能够在预处理阶段自动检测并校正图片的倾斜角度。这通常通过分析图像边缘、使用霍夫变换检测直线或者基于图像的几何特征来实现^[1]^[2]。一旦检测到倾斜，系统会相应旋转图片，使其正向，从而提高后续文字识别的准确性。
2. 文字块角度信息：在返回的识别结果中，包含了文字块的角度信息（angle字段）^[1]^[2]。这一信息表明即使原始图片存在倾斜，在识别过程中系统已经进行了角度调整。用户可以根据这个角度值自行处理图片或解析识别结果时进行相应的旋转操作，以确保内容的正确显示。
3. 详细的文字块定位：除了角度校正，OCR服务还提供了文字块的精确位置信息，包括外矩形四个点的坐标^[1]^[2]。这有助于进一步处理和理解识别内容的布局，即便图片原始状态有所倾斜，也能在识别后通过这些坐标信息恢复文本的正确排列。
综上所述，面对倾斜图片的识别问题，当前的OCR技术通过自动图像校正及提供详细的文字块角度和位置信息，已经有了有效的解决方案，能够显著提升识别效果。

相关链接
RecognizeEduPaperOcr - 整页试卷识别返回参数 https://help.aliyun.com/zh/ocr/developer-reference/api-ocr-api-2021-07-07-recognizeedupaperocr
RecognizeBasic - 电商图片文字识别返回参数 https://help.aliyun.com/zh/ocr/developer-reference/api-ocr-api-2021-07-07-recognizebasic
2024-07-13 20:02:20

赞同 7 展开评论

问答分类：

文字识别文字识别视觉智能开放平台

问答标签：

文字识别ocr 印刷文字识别文字识别印刷文字识别ocr 印刷文字识别图片

问答地址：

开发者社区 > 视觉智能 > 文字识别 > 问答

相关问答

印刷文字识别

文字识别OCR中阿里云OCR能判断出图片里有手写的内容吗？

279

3

0

在文字识别OCR只可以访问这个应用，怎么编写自定义策略？

101

1

0

文字识别OCR type 传 Advanced 是能识别图片的，但是传这个参数就不行，咋整？

181

2

0

文字识别OCR比如我截图一张excel图片，目的是想把识别到同一行的内容当作一行来输出可以吗？

132

2

0

文字识别OCR如何传本地图片？

240

1

0

文字识别OCR 图片上的问题该怎么解决呢？

108

1

0

文字识别OCR 这种图片的文字能识别吗？

124

1

0

文字识别OCR的单据票证信息抽取的模型训练完成以后，上传的图片和提取的数据是否部署在租用的服务器？

533

2

0

文字识别OCR长文档信息抽取这个应用类型上传20张图片训练可以上传不同模版的pdf吗？

116

1

0

在文字识别OCR中图片OCR VIN 识别的时候，用户拍照时竖着拍着，识别少了一位，能不能优化？

147

1

0

视觉智能

文字识别

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景，满足认证、鉴权、票据流转审核等业务需求。

我要提问

相关文章

AI技术在英语学习中的应用

值得信赖的发票管理软件开发商

达摩院开源RynnBrain：首个支持移动操作的具身大脑基础模型

DeepSeek V4春节炸场，三大黑科技让Claude和GPT都坐不住了

ModelScope魔搭社区发布月报 -- 26年2月

热门讨论

热门文章

OCR之前还用的好好的，怎么突然错了？

你好，我想问下，python调用接口，Sample.main() 函数，会return 文字识别的结

文字识别ocr识别图片有大小限制吗？

身份证识别ocr，每次购买需要更换url地址吗？

文字识别OCR目前有哪些情况会导致识别失败？

目前OCR中如果部署在本地的话，识别速度怎么样？一张图片平均多久可以识别到

文字识别OCR报错403，是为什么？

文字识别OCR看recognizeInvoice的文档，识别成功code为啥是null？

OCR accessKeyId accessKeySecret在哪儿查看?

文字识别OCR这个识别，咋都跑偏了，而且非常不准，请问，如何改善？

展开全部

基于深度学习的自然场景文字检测及端到端的OCR中文文字识别

图像文字识别(OCR)用什么算法小结

阿里宜搭发布OCR文字识别插件助力合作伙伴升级

使用图像文字识别技术获取失信黑名单

阿里云视觉智能开放平台--文字识别使用教程

OCR文字识别技术总结（一）

【繁体图片文字识别】竖排的繁体图片文字识别翻译，竖排的繁体图片文字如何识别，竖排繁体图片识别后转横排，竖排的繁体识别比较友好的方法

分享：如何ocr识别身份证复印件并导出至excel表格 ? 图片批量识别导出excel表格应用，图片批量识别转excel表格的方法

分析对比大模型OCR、传统OCR和深度学习OCR

【PDF提取全自动改名】如何批量提取PDF指定区域的文字内容，用内容批量给PDF命名或者导出表格，学会全自动解放双手

展开全部

还有其他疑问?