开发者社区 > 视觉智能 > 正文

视觉智能平台创新专区的全图分割接口这些字段代表什么?

4b58f622d66bfc565402f9365135dcf0.png
视觉智能平台创新专区的全图分割接口这些字段代表什么?比如point_coords里面值代表什么坐标。
https://help.aliyun.com/zh/viapi/developer-reference/api-interactivefullsegmentation?spm=a2c4g.11186623.0.0.64a8291bszTMvi

展开
收起
嘟嘟嘟嘟嘟嘟 2024-03-20 17:53:21 27 0
2 条回答
写回答
取消 提交回答
  • 从事java行业9年至今,热爱技术,热爱以博文记录日常工作,csdn博主,座右铭是:让技术不再枯燥,让每一位技术人爱上技术

    您好,视觉智能开放平台的交互式全图分割能力支持以单张图片作为输入,无需任何其他提示,即可返回图片中所有元素的分割结果。分割的结果会以JSON字符串的形式存储在输出的文本文件中,对应的图像会以Base64的结构存储在对应的Base64字段中,您可以截图参数查阅参数描述
    image.png
    更多详细内容可以参考文档:文档

    2024-03-24 14:34:50
    赞同 展开评论 打赏
  • bbox:包含mask的bounding box的坐标,按照XYWH的顺序
    crop_box:预测mask时用到的image切片的坐标,按照XYWH的顺序
    point_coords:生成mask对应的预测点坐标
    predicted_iou:预测的置信度
    stability_score:mask质量的评估
    area:mask所占的像素数,可以理解为面积
    这些参数的介绍,后续会补充到文档中。此回答整理自钉群“阿里云视觉智能开放平台咨询1群”

    2024-03-20 18:08:07
    赞同 展开评论 打赏

为开发者提供高易用、普惠的视觉API服务,帮助企业快速建立视觉智能技术应用能力的综合性视觉AI能力平台。适用于数字营销、互联网娱乐、安防、手机应用、泛金融身份认证等行业。

相关产品

  • 视觉智能开放平台
  • 热门讨论

    热门文章

    相关电子书

    更多
    阿里云视觉智能开放平台-产品介绍 立即下载
    阿里云视觉智能开放平台产品介绍 立即下载
    利用CNN实现无需联网的图像识别 立即下载