带你读《2022技术人的百宝黑皮书》——商品3D建模的视觉定位和前景分割方法(5)

简介: 带你读《2022技术人的百宝黑皮书》——商品3D建模的视觉定位和前景分割方法(5)

带你读《2022技术人的百宝黑皮书》——商品3D建模的视觉定位和前景分割方法(4) https://developer.aliyun.com/article/1247974?groupCode=taobaotech



主体分割


问题定义


要想重建一个物体,首先要在图像上将物体分割出来,将前景保留、背景去除,重建出来的模型才能干净、完整。目前业界的重建方法(如NeRF、IDRNet)都对分割结果非常敏感,基本需要绝对准确的结果,一旦有1张出现了分割不准的情况,都会影响最终的重建结果。现有的图像/视频分割算法很难满足这个要求。


解决方法


对此,我们提出了图像分割和神经渲染端到端联合优化网络。将分割网络输出的结果作为初值,通过神经渲染的方式融合各个视角下的结果。


结果对比


如下图所示,最左边图片是输入RGB图,中间图片是用SOTA分割算法得到的抠图结果,右边图像是我们的算法结果。我们的分割结果非常精细(可达1个像素的细腻度,如右下角图所示),且不惧复杂背景。


image.png


总结


如果您想了解更多关于商品AI建模的信息,欢迎访问Object Drawer的官网:https://tech.taobao.org/object drawer。


团队介绍


大淘宝技术部3D算法团队,发布了业内首个基于神经渲染的商品三维重建产品描物坊Object Drawer,探索了NeRF神经渲染从建模到应用的全链路,在建模鲁棒性、纹理细节、模型大小、推理速度、重光照等方面保持业内领先。同时在应用方面,基于算法的智能出图、视频结果可以媲美设计师的作品,在视频分割、AI搭配、AI布局、户型表示、光影和谐等方面达到业内一流水平。团队在学术方面积极贡献,在ICCV、NeurIPS、KDD、CVPR等顶级学术会议上发表多篇论文,为研究者开放3D-FRONT数据集,获ChinaGraph首届数据奖。为了打造团队的全栈研发能力,我们不断吸引视觉/图形算法、3D/XR引擎等领域的优秀专业人才加入,一起奔向3D新时代。


如果您有兴趣可将简历发至rongfei.jrf@alibaba-inc.com,期待您的加入!

相关文章
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
四张图片道清AI大模型的发展史(1943-2023)
现在最火的莫过于GPT了,也就是大规模语言模型(LLM)。“LLM” 是 “Large Language Model”(大语言模型)的简称,通常用来指代具有巨大规模参数和复杂架构的自然语言处理模型,例如像 GPT-3(Generative Pre-trained Transformer 3)这样的模型。这些模型在处理文本和语言任务方面表现出色,但其庞大的参数量和计算需求使得它们被称为大模型。当然也有一些自动生成图片的模型,但是影响力就不如GPT这么大了。
2765 0
|
5月前
|
机器学习/深度学习 监控
【机器学习】基于扩散模型的文本到音频生成:突破数据局限,优化音频概念与实践顺序
【机器学习】基于扩散模型的文本到音频生成:突破数据局限,优化音频概念与实践顺序
173 0
|
机器学习/深度学习 编解码 自然语言处理
带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(1)
带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(1)
175 0
|
算法 图形学
带你读《2022技术人的百宝黑皮书》——商品3D建模的视觉定位和前景分割方法(4)
带你读《2022技术人的百宝黑皮书》——商品3D建模的视觉定位和前景分割方法(4)
|
图形学 计算机视觉
带你读《2022技术人的百宝黑皮书》——商品3D建模的视觉定位和前景分割方法(2)
带你读《2022技术人的百宝黑皮书》——商品3D建模的视觉定位和前景分割方法(2)
113 0
|
机器学习/深度学习 算法 图形学
带你读《2022技术人的百宝黑皮书》——商品3D建模的视觉定位和前景分割方法(1)
带你读《2022技术人的百宝黑皮书》——商品3D建模的视觉定位和前景分割方法(1)
116 0
|
算法 图形学 计算机视觉
带你读《2022技术人的百宝黑皮书》——商品3D建模的视觉定位和前景分割方法(3)
带你读《2022技术人的百宝黑皮书》——商品3D建模的视觉定位和前景分割方法(3)
130 0
|
机器学习/深度学习 编解码
带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(3)
带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(3)
132 0
|
算法
带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(5)
带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(5)
108 0
|
数据可视化
带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(4)
带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(4)
130 0