开发者社区 > 视觉智能 > 文字识别 > 正文

在文字识别OCR中,这个height 和 width是基于哪个位置去定义的宽高?

在文字识别OCR中,这个height 和 width是基于哪个位置去定义的宽高? 6fe3c114ac66397769b3bea92aa1f15d.png

展开
收起
小小鹿鹿鹿 2023-09-25 12:56:40 63 0
4 条回答
写回答
取消 提交回答
  • 从事java行业9年至今,热爱技术,热爱以博文记录日常工作,csdn博主,座右铭是:让技术不再枯燥,让每一位技术人爱上技术

    您好,根据文字识别OCR文档说明来看这个height和width是基于原始图片的宽高经过算法矫正后的宽高,并不是基于具体的位置而是基于原始图片 的宽高。

    2023-09-26 14:38:10
    赞同 展开评论 打赏
  • 十分耕耘,一定会有一分收获!

    楼主你好,阿里云文字识别OCR中的height和width是基于图像中的像素值来定义的,它们表示识别区域的宽度和高度。具体来说,height表示识别区域的高度,是从识别区域顶部到底部的像素数;width表示识别区域的宽度,是从识别区域左侧到右侧的像素数。这些像素值是基于原始图像的像素坐标系来定义的。

    2023-09-26 08:42:43
    赞同 展开评论 打赏
  • 在文字识别OCR中,height和width是基于图像的像素单位进行定义的,而不是基于特定位置。它们用于指定要提取文本区域的宽度和高度。

    当您调用OCR接口时,可以指定一个区域(通常是一个矩形框),通过设置该区域的位置和大小来限定要识别的文本范围。这个区域可以由左上角坐标和相对于左上角坐标的宽度和高度来确定。

    2023-09-25 20:16:26
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在文字识别OCR中,height和width通常是基于图像中的某个参考位置(通常是左上角)去定义的宽度和高度。具体而言,这些参数描述了矩形区域的尺寸,该矩形区域包含了要进行文字识别的目标区域。

    一般来说,以左上角为原点,水平方向为x轴,垂直方向为y轴。height表示垂直方向上的高度,width表示水平方向上的宽度。通过指定这两个值,可以定义一个矩形范围来指示需要进行文字识别的区域。

    例如,假设你想要识别图像中一个矩形框内的文字,可以使用左上角的坐标(x, y),以及相对于该点的高度(height)和宽度(width)来定义识别区域。

    请注意,具体实现中可能会有不同的坐标系和单位。在使用文字识别OCR API时,你需要按照具体服务提供商的API文档或接口说明,了解其要求的坐标系和单位,并正确地指定识别区域的位置和尺寸

    2023-09-25 13:11:26
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载