开发者社区 > 视觉智能 > 正文

视觉智能平台中,我看返回值里面没有物体坐标,我需要物体坐标计算大小,通用图像打标是否支持多物体呢?

视觉智能平台中,我看返回值里面没有物体坐标,我需要物体坐标计算大小,通用图像打标是否支持多物体呢?

展开
收起
嘟嘟嘟嘟嘟嘟 2024-01-10 07:54:18 53 0
4 条回答
写回答
取消 提交回答
  • 视觉智能平台的通用图像打标功能确实支持多物体识别。但是,返回值中通常不会直接提供物体的坐标信息。

    如果您需要计算物体的大小,可以通过以下步骤进行:

    1. 首先,使用视觉智能平台的通用图像打标功能对图像进行物体识别,获取到每个物体的标签信息。

    2. 然后,根据标签信息确定每个物体在图像中的位置。这可以通过查找每个标签对应的矩形框来实现。

    3. 接下来,根据矩形框的位置和尺寸信息,可以计算出每个物体的大小。矩形框的位置通常是以左上角的坐标表示,而尺寸则是矩形框的宽度和高度。

    4. 最后,您可以根据需要对物体的大小进行进一步的处理或分析。

    需要注意的是,物体的大小计算可能会受到图像分辨率、物体形状等因素的影响,因此在实际应用中可能需要进行一些额外的处理和校准。

    2024-01-13 11:29:01
    赞同 展开评论 打赏
  • 从事java行业9年至今,热爱技术,热爱以博文记录日常工作,csdn博主,座右铭是:让技术不再枯燥,让每一位技术人爱上技术

    您好,视觉智能开放平台的通用图像打标能力主要用于识别图像中的主体内容并打上类型标签,侧重点不在返回物体的坐标信息,最多一次返回5个物体类型,返回参数如下
    image.png
    另外视觉智能开放平台的物体检测能力可以检测输入图像中的物体,返回数据中有具体物体的坐标信息,但是只能支持API接口文档中列出的类型物体
    image.png
    返回数据的格式如下
    image.png
    更多详细内容可以参考文档:文档

    2024-01-12 22:22:45
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    确实,视觉智能平台的通用图像打标服务可以识别图像中的主体内容并为其打上类型标签,它支持数千个内容标签,基本覆盖了常见的物体品类。在返回结果中,如果一张图片中有多个感兴趣物体,标签的格式会包含左上角x坐标,左上角y坐标,宽度,高度和类别标签。例如:"10 10 20 20 cat" 和 "15 15 30 30 dog"这样用空格隔开的形式来表示不同的物体及其位置信息。因此,您可以通过解析这些坐标信息来计算物体的大小。如果您需要进一步的帮助,欢迎通过在线咨询获取阿里云视觉智能的在线人工帮助。

    2024-01-10 13:47:15
    赞同 展开评论 打赏
  • 是的,支持多物体。通用图像打标是没有返回物体的位置信息的。平台有物体检测会返回物体位置坐标,但是支持的物体标签有限。可以看下,如果这个不满足,那平台就没有其他能力满足需求了
    https://help.aliyun.com/zh/viapi/developer-reference/api-b68b50
    此回答整理自钉群“阿里云视觉智能开放平台咨询1群”

    2024-01-10 10:34:18
    赞同 展开评论 打赏

为开发者提供高易用、普惠的视觉API服务,帮助企业快速建立视觉智能技术应用能力的综合性视觉AI能力平台。适用于数字营销、互联网娱乐、安防、手机应用、泛金融身份认证等行业。

相关产品

  • 视觉智能开放平台
  • 热门讨论

    热门文章

    相关电子书

    更多
    对视觉智能未来发展的几点思考 立即下载
    利⽤CNN实现⽆需联⽹的图像识别 立即下载
    利用CNN实现无需联网的图像识别 立即下载