视觉智能平台的分割抠图功能采用的是基于深度学习的模型。
这个模型结合了检测识别技术,能够实现高精度的视觉分割能力,包括秒级全自动主体和场景像素级识别,以及制作4通道透明素材。它不仅能够处理发丝级精细抠图,还能应对高度镂空主体和复杂背景等挑战性场景。此外,该模型支持人、货、场三种类型的分割需求,可广泛应用于电子商务、零售、泛文娱和个人应用等多种场景。
此外,在图像分割领域还有其他先进的技术和模型被提出和开发,例如Meta AI发布的Segment Anything Model(SAM),这是一个能够从照片或视频中对任意对象实现一键分割的基础模型。SAM通过一种简单但可扩展的架构来处理多模态提示,如文本、关键点、边界框,并且能够零样本迁移到其他任务。SAM的数据飞轮允许模型自举到大量未标记的图像,学会了「物体」的一般概念,甚至能够泛化到新任务和新领域。
总的来说,视觉智能平台利用了深度学习的强大能力,为用户提供了一个高效且精确的分割抠图工具,这在多个领域都有着广泛的应用前景。
视觉智能平台进行分割抠图的具体模型没有明确说明。不过这类功能通常基于深度学习算法,比如U-Net、DeepLab系列或者其他专用于图像分割的神经网络模型。
深度学习。具体的可以看下这篇论文。
https://openaccess.thecvf.com/content_CVPR_2020/papers/Liu_Boosting_Semantic_Human_Matting_With_Coarse_Annotations_CVPR_2020_paper.pdf
此回答整理自钉群“阿里云视觉智能开放平台咨询1群”
楼主你好,据我所知阿里云视觉智能平台的分割抠图功能使用的是DeepLabV3模型。
DeepLabV3是一种基于深度学习的语义分割模型,可以将图像中的不同物体进行像素级别的分割和抠图。通过利用卷积神经网络和空洞卷积等技术,DeepLabV3可以准确地识别和分割出图像中的各个物体,实现精细的抠图效果。在阿里云视觉智能平台中,用户可以通过调用分割抠图API接口,将需要进行抠图的图像上传并调用DeepLabV3模型进行物体分割和抠图操作。
注意:本回答参考了阿里云视觉智能平台官方文档。
分割抠图技术基于阿里云深度学习技术,结合检测识别技术,为您提供高精度视觉分割能力。
分割抠图技术可以实现秒级全自动主体、场景像素级识别,制作4通道透明素材。不仅实现了发丝级精抠,对高度镂空主体、复杂背景等场景都有很好的效果,同时支持人、货、场三种类型需求,可广泛应用于电子商务、零售、泛文娱、个人应用等多种场景。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。