带你读《2022技术人的百宝黑皮书》——商品3D建模的视觉定位和前景分割方法(4)

简介: 带你读《2022技术人的百宝黑皮书》——商品3D建模的视觉定位和前景分割方法(4)

带你读《2022技术人的百宝黑皮书》——商品3D建模的视觉定位和前景分割方法(3) https://developer.aliyun.com/article/1247975?groupCode=taobaotech



多个视频位姿对齐


如果只拍2个视频,仍然会存在一定的拍摄盲区(会有一个比较小的区域没办法拍到),那么重建出来这个区域仍然比较脏、不干净(如下图的第二行,第三列的图,会有一小块白色随机颜色值)。对此,我们将拍摄视频扩展到3个,也将算法提高到了3视频对齐。3个视频可以实现商品的无死角覆盖拍摄。

以下分别是,拍1个视频、2个视频、3个视频的对齐位姿和底部重建效果。


image.png


更多全方位重建模型预览如下图所示:


image.png

image.pngimage.png

淘宝应用


我们借用手淘上的720展示链路,将建模的结果离线渲染成图像序列,上传到了手淘,并在主图第二帧展示。


image.png



带你读《2022技术人的百宝黑皮书》——商品3D建模的视觉定位和前景分割方法(5) https://developer.aliyun.com/article/1247973?groupCode=taobaotech

相关文章
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
四张图片道清AI大模型的发展史(1943-2023)
现在最火的莫过于GPT了,也就是大规模语言模型(LLM)。“LLM” 是 “Large Language Model”(大语言模型)的简称,通常用来指代具有巨大规模参数和复杂架构的自然语言处理模型,例如像 GPT-3(Generative Pre-trained Transformer 3)这样的模型。这些模型在处理文本和语言任务方面表现出色,但其庞大的参数量和计算需求使得它们被称为大模型。当然也有一些自动生成图片的模型,但是影响力就不如GPT这么大了。
2765 0
|
5月前
|
机器学习/深度学习 监控
【机器学习】基于扩散模型的文本到音频生成:突破数据局限,优化音频概念与实践顺序
【机器学习】基于扩散模型的文本到音频生成:突破数据局限,优化音频概念与实践顺序
173 0
|
机器学习/深度学习 编解码 自然语言处理
带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(1)
带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(1)
175 0
|
机器学习/深度学习 人工智能 算法
带你读《2022技术人的百宝黑皮书》——商品3D建模的视觉定位和前景分割方法(5)
带你读《2022技术人的百宝黑皮书》——商品3D建模的视觉定位和前景分割方法(5)
133 0
|
算法 图形学 计算机视觉
带你读《2022技术人的百宝黑皮书》——商品3D建模的视觉定位和前景分割方法(3)
带你读《2022技术人的百宝黑皮书》——商品3D建模的视觉定位和前景分割方法(3)
130 0
|
图形学 计算机视觉
带你读《2022技术人的百宝黑皮书》——商品3D建模的视觉定位和前景分割方法(2)
带你读《2022技术人的百宝黑皮书》——商品3D建模的视觉定位和前景分割方法(2)
113 0
|
机器学习/深度学习 算法 图形学
带你读《2022技术人的百宝黑皮书》——商品3D建模的视觉定位和前景分割方法(1)
带你读《2022技术人的百宝黑皮书》——商品3D建模的视觉定位和前景分割方法(1)
116 0
|
算法
带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(5)
带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(5)
108 0
|
数据可视化
带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(4)
带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(4)
130 0
|
机器学习/深度学习 编解码
带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(3)
带你读《2022技术人的百宝黑皮书》——CVPR2022 | 开源: 基于间距自适应查找表的实时图像增强方法(3)
132 0