开发者社区 > 视觉智能 > 文字识别 > 正文

文字识别OCR这个字返回的坐标是图片角度旋转以后的坐标?

lQLPJwEvnqpFTUbNAsbNBzywzE7B4GLbSmMEm9vMcsDVAA_1852_710.png
文字识别OCR这个字返回的坐标是图片角度旋转以后的坐标?

展开
收起
冰激凌甜筒 2023-07-11 15:03:42 299 0
5 条回答
写回答
取消 提交回答
  • 从事java行业9年至今,热爱技术,热爱以博文记录日常工作,csdn博主,座右铭是:让技术不再枯燥,让每一位技术人爱上技术

    您好,接口返回值中pos中的位置信息,表示为识别文字块的外矩形4个点的坐标,其单位为px,用于确定识别范围。

    2023-07-19 15:54:03
    赞同 展开评论 打赏
  • 天下风云出我辈,一入江湖岁月催,皇图霸业谈笑中,不胜人生一场醉。

    OCR返回的坐标通常是指识别出的文字在原始图片中的位置坐标,不会考虑图片角度旋转的影响。如果您需要将OCR返回的坐标转换为旋转后的坐标,可以使用OCR提供的API接口进行转换。
    具体来说,您可以按照以下步骤进行操作:

    使用OCR提供的API接口获取识别结果,并将结果保存到本地。
    使用图像处理工具对识别结果进行旋转处理,将图片旋转到正确的角度。
    使用OCR提供的API接口获取旋转后的识别结果,并将结果保存到本地。

    2023-07-12 09:15:28
    赞同 展开评论 打赏
  • OCR 返回的坐标通常是基于原始图片的坐标,并不考虑图片的旋转角度。这意味着当您使用 OCR 进行文本识别时,返回的文本区域坐标是相对于原始图片的位置。

    如果您的图片经过旋转处理,OCR 的返回结果仍然会基于原始图片的坐标系。因此,您需要根据图片的旋转角度对 OCR 返回的文本区域坐标进行适当的调整,以便与旋转后的图片相匹配。

    具体而言,您可以通过以下步骤来调整 OCR 返回的文本区域坐标:

    1. 获取图片的旋转角度:首先,确定图片的旋转角度。您可以使用图像处理库如OpenCV或PIL等,检测图片的旋转角度。

    2. 应用旋转矫正:将图片应用正确的旋转矫正,使得文本在图片中处于水平方向。

    3. 调整坐标:根据旋转角度和矫正后的图片,对 OCR 返回的文本区域坐标进行适当的调整。这可能涉及到旋转、缩放和平移等变换操作。

    2023-07-11 21:55:38
    赞同 展开评论 打赏
  • 北京阿里云ACE会长

    这意味着,返回的坐标并不会受到图像旋转的影响,而是基于原始图像的水平和垂直坐标轴进行计算的。

    如果图像存在旋转角度,那么OCR引擎通常会先将图像旋转回正常的方向,然后再进行文本识别和坐标计算。在这个过程中,OCR引擎会使用旋转矩阵或其他几何变换算法来实现图像的旋转和重定位。

    2023-07-11 21:12:08
    赞同 展开评论 打赏
  • 对的,此回答整理自钉群"阿里云读光OCR客户交流反馈群 1"

    2023-07-11 15:13:33
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载