在文字识别OCR中,印章识别被视为一项具有挑战性的任务。这是因为相比与普通文档场景下的文字识别,印章场景更为复杂。其中的两个主要步骤分别是印章位置检测与印章文字内容识别。
印章位置检测需要从文档图像中定位印章主体所在的位置,这是一种典型的目标检测场景,现在已有很多基于深度学习的目标检测方法,如RCNN系列,YOLO系列等。同时,还需要输出文字内容、印章位置信息以及相关置信度。
对于印章文字内容的识别,弯曲文字识别在OCR任务中有着广泛的应用,比如:自然场景下的招牌,艺术文字,以及常见的印章文字识别。由于市场上缺乏开源印章类数据集,且数据标注成本较高,所以这部分也是具有一定的难度。
通用文字识别https://help.aliyun.com/document_detail/295338.html?spm=a2c4g.295363.0.i7
全文识别高精版(推荐)
全文识别高精版支持多格式版面、复杂文档背景和光照环境的精准识别,文档识别率超过99.7%。同时针对有印章、手印的文档,可实现印章擦除后识别,支持低置信度过滤、图案检测等高阶功能。
OCR文本识别中识别印章的方法如下:
打开图像或照片,找到印章的位置
对印章进行定位和分割,利用图像处理工具定位印章的位置和大小
使用 OCR 技术识别印章上的文字,例如阿里云的智能 OCR 文字识别服务
对提取出来的文字进行拼接和清洗,去掉不必要的信息
参考https://market.aliyun.com/products/57002003/cmapi029878.html?#sku=yuncode2387800002 此回答整理自钉群“阿里云读光OCR客户交流反馈群 2”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。