文档备案控制台

开发者社区视觉智能文字识别正文

在文字识别OCR中，很多用户会拍不全四个角，我们对周围边距有要求，用什么判断？

在文字识别OCR中，很多用户会拍不全四个角，我们对周围边距有要求，用什么判断？

展开

收起

想去床上睡觉 2024-07-30 11:08:04 233 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

技术员阿伟

资深 C++与人工智能程序员。精通 C++，善用其特性构建稳健架构。在人工智能领域，深入研习机器学习算法，借 C++与 OpenCV 等实现计算机视觉应用，于自然语言处理构建文本处理引擎。以敏锐洞察探索技术融合边界，用代码塑造智能未来。
在文字识别OCR中，判断拍不全四个角的图片周围边距是否符合要求，通常可以采用以下方法：

图像预处理
- 灰度化：将彩色图像转换为灰度图像，减少数据量和计算复杂度，方便后续处理。
- 二值化：将灰度图像进一步转换为黑白图像，使文字与背景更加分明，有助于突出文字区域。
文字区域检测
- 边缘检测：通过检测图像中文字的边缘，确定文字的轮廓，从而得到文字区域的大致范围。
- 连通区域分析：分析图像中的连通区域，将相互连接的文字区域视为一个整体，进而确定文字区域的边界框。
边距判断
- 计算边界框与图像边缘的距离：得到文字区域的边界框后，计算边界框与图像四个边缘的距离，与预设的边距阈值进行比较，判断边距是否符合要求。
- 评估文字区域的完整性：根据边界框的大小、形状以及文字区域的分布情况，评估文字区域是否完整。若文字区域过于靠近图像边缘，可能会被认为不完整，边距不符合要求。
2025-03-16 23:02:21

赞同展开评论
我很饿很薄啊

可以根据质量检测判断-此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”

2024-07-30 21:29:38

赞同 5 展开评论

问答分类：

文字识别文字识别视觉智能开放平台

问答标签：

印刷文字识别文字识别文字识别ocr 印刷文字识别ocr 印刷文字识别不全

问答地址：

开发者社区 > 视觉智能 > 文字识别 > 问答

相关问答

印刷文字识别

在文字识别OCR只可以访问这个应用，怎么编写自定义策略？

193

1

0

文字识别OCR还是不行怎么办?

210

1

0

文字识别OCR这种发票可以验证吗？

181

1

0

在文字识别OCR中目前在做小票识别，OCR 识别小票的名字不全，有什么解决办法吗？

166

0

0

文字识别OCR相关的识别产品能否做私有化部署？

343

1

0

文字识别OCR有谁知道这个table识别为啥会识别成这样呢？

360

2

0

文字识别OCR的自定义模板入口在哪？

162

0

0

文字识别OCR中电子驾驶证支持吗？

216

2

0

文字识别OCR中的车辆VIN码文字识别OCR接口，传入车牌，也返回成功。这是为什么？

178

1

0

文字识别OCR怎样指定调用的服务？有示例吗?

222

1

0

视觉智能

文字识别

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景，满足认证、鉴权、票据流转审核等业务需求。

我要提问

相关文章

阿里云Qwen3.7-Plus全解析：核心能力、订阅方案与部署实操指南

Hawa Code Computer use 优化项

车位与车牌目标检测数据集：4类别 | 目标检测

taobao.item.search.img（拍立淘图片搜索 API)全业务场景手册

GEO优化实战深度指南：从文章到多模态，让AI搜索引擎优先引用你

热门讨论

热门文章

身份证识别ocr，每次购买需要更换url地址吗？

OCR有没有c#调用票据识别示例？网页上面的调用不成功。难道要买了才可以调试吗？

请问文字识别OCR的TaskId这个参数是什么意思？不是只要唯一就可以吗？

你好，我想问下，python调用接口，Sample.main() 函数，会return 文字识别的结

为什么我们这边的文字识别OCR现在出现了发票类型识别不稳定的情况？

文字识别OCR有没有文章自然段落识别的接口呀？

生僻字OCR无法识别的情况怎么办？

文字识别ocr支持android吗，android sdk文档链接有不？

文字识别OCR哪个接口可以区分返回手写体跟印刷体的识别结果？

OCR中有接口能够识别学历证书上的，学校名称，专业，编号等信息的吗？

展开全部

基于深度学习的自然场景文字检测及端到端的OCR中文文字识别

图像文字识别(OCR)用什么算法小结

【全自动改PDF名】批量OCR识别提取PDF自定义指定区域内容保存到 Excel 以及根据PDF文件内容的标题来批量重命名

文字识别OCR开源框架的对比--Tesseract vs EasyOCR

【繁体图片文字识别】竖排的繁体图片文字识别翻译，竖排的繁体图片文字如何识别，竖排繁体图片识别后转横排，竖排的繁体识别比较友好的方法

【PDF提取全自动改名】如何批量提取PDF指定区域的文字内容，用内容批量给PDF命名或者导出表格，学会全自动解放双手

OCR文字识别技术总结（一）

分析对比大模型OCR、传统OCR和深度学习OCR

合合信息——用智能文字识别技术赋能古彝文原籍数字化

阿里云文字识别（OCR）服务 Quick Start

展开全部

还有其他疑问?