在文字识别ocr中，ocr接口返回的数据中valuePos 对应的坐标不是在原图上的是为什么?

在文字识别ocr中，ocr接口返回的数据中valuePos 对应的坐标不是在原图上的，方便说一下，这个坐标要如何变换，能反应到原图上呢？使用的是机动车注册登记证识别接口，现在返回的坐标疑似是进行过图片矫正后的坐标。api文档写的确实是原图中的坐标，但是实际上不是，用坐标在原图中找的位置都有偏移，使用子图的话，有些图大概能对上，但是有些图对不上，从框出的位置来看，怀疑是对子图又进行过矫正。

展开

收起

小小鹿鹿鹿 2023-10-30 19:08:28 264 版权

3 条回答

写回答

取消提交回答

小小杳杳杳

是在原图中的坐标。此回答来自钉群【官方】阿里云OCR公共云客户交流群。

2023-10-31 22:07:53

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
一般来说，OCR 服务可能会对输入图片进行校正或裁剪等预处理操作，因此返回坐标可能存在偏差。
如果您想将坐标恢复到原始图像的位置，请参考以下步骤：
1. 使用 OCR 服务的原图，还原预处理操作。这包括旋转、缩放、裁剪等；
2. 对于矫正后的坐标，将其变换到原始图像的空间中。可以使用透视变换、仿射变换或相似变换等方式来完成；
3. 在变换过程中，确保保持尺寸的比例和坐标系的统一；
4. 最后，确保数据的一致性和准确性。
2023-10-31 15:01:03

赞同展开评论
sunrr
在OCR识别中，ValuePos表示的是识别结果在原始图像中的位置。如果ValuePos的坐标不是在原图上的，那么可能是以下几种情况：
1. 图像预处理：在进行OCR识别之前，可能对图像进行了预处理，例如旋转、缩放、裁剪等，这可能导致原图的坐标系发生变化。
2. 图像分割：如果图像被分割成多个子图进行识别，那么每个子图的坐标系可能与原图不同。
3. 图像矫正：如果图像存在倾斜、旋转等问题，可能需要先进行图像矫正，这也可能导致坐标系发生变化。
对于这种情况，你可以尝试以下方法：
1. 获取原始图像：如果可以的话，尽量获取原始图像，然后根据原始图像的坐标系进行调整。
2. 图像配准：如果有多个子图，可以尝试进行图像配准，使得所有子图的坐标系一致。
3. 坐标变换：如果已知坐标变换关系，可以进行坐标变换，将坐标转换到原图坐标系。
4. 使用机器学习：如果可能的话，可以使用机器学习的方法，通过学习大量的样本，自动纠正坐标偏移。
2023-10-31 14:52:55

赞同展开评论

在文字识别ocr中，ocr接口返回的数据中valuePos 对应的坐标不是在原图上的是为什么?

文字识别

相关文章

相关解决方案

热门讨论

热门文章