视觉智能平台中，我看返回值里面没有物体坐标，我需要物体坐标计算大小，通用图像打标是否支持多物体呢？

展开

收起

-Feng、冯冯 2024-01-10 07:54:18 32 0

4 条回答

写回答

取消提交回答

sunrr
视觉智能平台的通用图像打标功能确实支持多物体识别。但是，返回值中通常不会直接提供物体的坐标信息。

如果您需要计算物体的大小，可以通过以下步骤进行：
1. 首先，使用视觉智能平台的通用图像打标功能对图像进行物体识别，获取到每个物体的标签信息。
2. 然后，根据标签信息确定每个物体在图像中的位置。这可以通过查找每个标签对应的矩形框来实现。
3. 接下来，根据矩形框的位置和尺寸信息，可以计算出每个物体的大小。矩形框的位置通常是以左上角的坐标表示，而尺寸则是矩形框的宽度和高度。
4. 最后，您可以根据需要对物体的大小进行进一步的处理或分析。
需要注意的是，物体的大小计算可能会受到图像分辨率、物体形状等因素的影响，因此在实际应用中可能需要进行一些额外的处理和校准。
2024-01-13 11:29:01

赞同展开评论打赏
六月的雨在钉钉

从事java行业8年至今，热爱技术，热爱以博文记录日常工作，csdn博主，座右铭是：让技术不再枯燥，让每一位技术人爱上技术

您好，视觉智能开放平台的通用图像打标能力主要用于识别图像中的主体内容并打上类型标签，侧重点不在返回物体的坐标信息，最多一次返回5个物体类型，返回参数如下

另外视觉智能开放平台的物体检测能力可以检测输入图像中的物体，返回数据中有具体物体的坐标信息，但是只能支持API接口文档中列出的类型物体

返回数据的格式如下

更多详细内容可以参考文档：文档

2024-01-12 22:22:45

赞同展开评论打赏
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

确实，视觉智能平台的通用图像打标服务可以识别图像中的主体内容并为其打上类型标签，它支持数千个内容标签，基本覆盖了常见的物体品类。在返回结果中，如果一张图片中有多个感兴趣物体，标签的格式会包含左上角x坐标，左上角y坐标，宽度，高度和类别标签。例如："10 10 20 20 cat" 和 "15 15 30 30 dog"这样用空格隔开的形式来表示不同的物体及其位置信息。因此，您可以通过解析这些坐标信息来计算物体的大小。如果您需要进一步的帮助，欢迎通过在线咨询获取阿里云视觉智能的在线人工帮助。

2024-01-10 13:47:15

赞同展开评论打赏
@番茄酱脑袋、

是的，支持多物体。通用图像打标是没有返回物体的位置信息的。平台有物体检测会返回物体位置坐标，但是支持的物体标签有限。可以看下，如果这个不满足，那平台就没有其他能力满足需求了
https://help.aliyun.com/zh/viapi/developer-reference/api-b68b50
此回答整理自钉群“阿里云视觉智能开放平台咨询1群”

2024-01-10 10:34:18

赞同展开评论打赏