在文字识别ocr中,ocr接口返回的数据中valuePos 对应的坐标不是在原图上的,方便说一下,这个坐标要如何变换,能反应到原图上呢?使用的是 机动车注册登记证识别 接口,现在返回的坐标疑似是进行过图片矫正后的坐标。api文档写的确实是原图中的坐标,但是实际上不是,用坐标在原图中找的位置都有偏移,使用子图的话,有些图大概能对上,但是有些图对不上,从框出的位置来看,怀疑是对子图又进行过矫正。
一般来说,OCR 服务可能会对输入图片进行校正或裁剪等预处理操作,因此返回坐标可能存在偏差。
如果您想将坐标恢复到原始图像的位置,请参考以下步骤:
在OCR识别中,ValuePos表示的是识别结果在原始图像中的位置。如果ValuePos的坐标不是在原图上的,那么可能是以下几种情况:
图像预处理:在进行OCR识别之前,可能对图像进行了预处理,例如旋转、缩放、裁剪等,这可能导致原图的坐标系发生变化。
图像分割:如果图像被分割成多个子图进行识别,那么每个子图的坐标系可能与原图不同。
图像矫正:如果图像存在倾斜、旋转等问题,可能需要先进行图像矫正,这也可能导致坐标系发生变化。
对于这种情况,你可以尝试以下方法:
获取原始图像:如果可以的话,尽量获取原始图像,然后根据原始图像的坐标系进行调整。
图像配准:如果有多个子图,可以尝试进行图像配准,使得所有子图的坐标系一致。
坐标变换:如果已知坐标变换关系,可以进行坐标变换,将坐标转换到原图坐标系。
使用机器学习:如果可能的话,可以使用机器学习的方法,通过学习大量的样本,自动纠正坐标偏移。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。