在文字识别OCR中，这个height 和 width是基于哪个位置去定义的宽高？

展开

收起

小小鹿鹿鹿 2023-09-25 12:56:40 281 版权

4 条回答

写回答

取消提交回答

六月的雨在钉钉

从事java行业9年至今，热爱技术，热爱以博文记录日常工作，csdn博主，座右铭是：让技术不再枯燥，让每一位技术人爱上技术

您好，根据文字识别OCR文档说明来看这个height和width是基于原始图片的宽高经过算法矫正后的宽高，并不是基于具体的位置而是基于原始图片的宽高。

2023-09-26 14:38:10

赞同展开评论
三掌柜666

十分耕耘，一定会有一分收获！

楼主你好，阿里云文字识别OCR中的height和width是基于图像中的像素值来定义的，它们表示识别区域的宽度和高度。具体来说，height表示识别区域的高度，是从识别区域顶部到底部的像素数；width表示识别区域的宽度，是从识别区域左侧到右侧的像素数。这些像素值是基于原始图像的像素坐标系来定义的。

2023-09-26 08:42:43

赞同展开评论
Star时光

在文字识别OCR中，height和width是基于图像的像素单位进行定义的，而不是基于特定位置。它们用于指定要提取文本区域的宽度和高度。

当您调用OCR接口时，可以指定一个区域（通常是一个矩形框），通过设置该区域的位置和大小来限定要识别的文本范围。这个区域可以由左上角坐标和相对于左上角坐标的宽度和高度来确定。

2023-09-25 20:16:26

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

在文字识别OCR中，height和width通常是基于图像中的某个参考位置（通常是左上角）去定义的宽度和高度。具体而言，这些参数描述了矩形区域的尺寸，该矩形区域包含了要进行文字识别的目标区域。

一般来说，以左上角为原点，水平方向为x轴，垂直方向为y轴。height表示垂直方向上的高度，width表示水平方向上的宽度。通过指定这两个值，可以定义一个矩形范围来指示需要进行文字识别的区域。

例如，假设你想要识别图像中一个矩形框内的文字，可以使用左上角的坐标(x, y)，以及相对于该点的高度(height)和宽度(width)来定义识别区域。

请注意，具体实现中可能会有不同的坐标系和单位。在使用文字识别OCR API时，你需要按照具体服务提供商的API文档或接口说明，了解其要求的坐标系和单位，并正确地指定识别区域的位置和尺寸

2023-09-25 13:11:26

赞同展开评论

在文字识别OCR中，这个height 和 width是基于哪个位置去定义的宽高？

文字识别

相关文章

热门讨论

热门文章