视觉智能平台的分割抠图用的是什么模型？

展开

收起

嘟嘟嘟嘟嘟嘟 2024-03-06 08:14:54 76 0

5 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

视觉智能平台的分割抠图功能采用的是基于深度学习的模型。

这个模型结合了检测识别技术，能够实现高精度的视觉分割能力，包括秒级全自动主体和场景像素级识别，以及制作4通道透明素材。它不仅能够处理发丝级精细抠图，还能应对高度镂空主体和复杂背景等挑战性场景。此外，该模型支持人、货、场三种类型的分割需求，可广泛应用于电子商务、零售、泛文娱和个人应用等多种场景。

此外，在图像分割领域还有其他先进的技术和模型被提出和开发，例如Meta AI发布的Segment Anything Model（SAM），这是一个能够从照片或视频中对任意对象实现一键分割的基础模型。SAM通过一种简单但可扩展的架构来处理多模态提示，如文本、关键点、边界框，并且能够零样本迁移到其他任务。SAM的数据飞轮允许模型自举到大量未标记的图像，学会了「物体」的一般概念，甚至能够泛化到新任务和新领域。

总的来说，视觉智能平台利用了深度学习的强大能力，为用户提供了一个高效且精确的分割抠图工具，这在多个领域都有着广泛的应用前景。

2024-03-06 14:18:19

赞同 1 展开评论打赏
小Lee

视觉智能平台进行分割抠图的具体模型没有明确说明。不过这类功能通常基于深度学习算法，比如U-Net、DeepLab系列或者其他专用于图像分割的神经网络模型。

2024-03-06 10:56:52

赞同展开评论打赏
番茄酱脑袋

深度学习。具体的可以看下这篇论文。
https://openaccess.thecvf.com/content_CVPR_2020/papers/Liu_Boosting_Semantic_Human_Matting_With_Coarse_Annotations_CVPR_2020_paper.pdf
此回答整理自钉群“阿里云视觉智能开放平台咨询1群”

2024-03-06 10:56:52

赞同展开评论打赏
三掌柜666

十分耕耘，一定会有一分收获！

楼主你好，据我所知阿里云视觉智能平台的分割抠图功能使用的是DeepLabV3模型。

DeepLabV3是一种基于深度学习的语义分割模型，可以将图像中的不同物体进行像素级别的分割和抠图。通过利用卷积神经网络和空洞卷积等技术，DeepLabV3可以准确地识别和分割出图像中的各个物体，实现精细的抠图效果。在阿里云视觉智能平台中，用户可以通过调用分割抠图API接口，将需要进行抠图的图像上传并调用DeepLabV3模型进行物体分割和抠图操作。

注意：本回答参考了阿里云视觉智能平台官方文档。

2024-03-06 08:57:26

赞同展开评论打赏
vohelon

分割抠图技术基于阿里云深度学习技术，结合检测识别技术，为您提供高精度视觉分割能力。

分割抠图技术可以实现秒级全自动主体、场景像素级识别，制作4通道透明素材。不仅实现了发丝级精抠，对高度镂空主体、复杂背景等场景都有很好的效果，同时支持人、货、场三种类型需求，可广泛应用于电子商务、零售、泛文娱、个人应用等多种场景。

参考 https://help.aliyun.com/zh/viapi/developer-reference/segmentation-cutout-is-introduced?spm=a2c4g.11186623.0.i3

2024-03-06 08:43:47

赞同展开评论打赏