浙大、蚂蚁集团推出MaPa:文本生成超真实3D模型

简介: 【6月更文挑战第19天】浙江大学与蚂蚁集团联手推出MaPa技术,革新3D模型生成。MaPa利用文本描述创建超真实3D模型,降低依赖标注数据,提升图像质量和编辑性,推动游戏、VR及影视行业的发展。虽在复杂场景和物理属性生成上仍有局限,但已展现巨大潜力。[论文链接](https://arxiv.org/abs/2404.17569)**

近日,浙江大学和蚂蚁集团联合推出了一项名为MaPa(Material Painting for 3D Shapes)的创新技术,该技术利用文本描述生成超真实3D模型,为计算机图形学和虚拟现实领域带来了新的突破。

MaPa技术的核心目标是通过自然语言处理和计算机图形学的结合,实现从文本描述到3D模型的自动生成。与以往的3D模型生成方法不同,MaPa技术采用了一种全新的思路,即通过生成分段式的程序化材质图作为外观表示,从而支持高质量的渲染效果并提供极大的编辑灵活性。

传统的3D模型生成方法通常需要大量的标注数据,即3D模型与对应的文本描述的配对数据,来训练一个能够生成材质图的模型。然而,这样的数据收集和标注工作不仅耗时费力,而且限制了模型的泛化能力。为了解决这个问题,MaPa技术提出了一种创新的方法,即利用预训练的2D扩散模型作为桥梁,连接文本描述和材质图的生成过程。

具体而言,MaPa技术将一个3D模型分解为一组分段,并设计了一个分段控制的扩散模型来合成与网格部分对齐的2D图像。然后,基于生成的图像,MaPa技术初始化材质图的参数,并通过可微分渲染模块进行微调,以生成符合文本描述的材质。通过这种方式,MaPa技术可以在没有大量标注数据的情况下,实现从文本描述到3D模型的自动生成。

MaPa技术的推出在学术界和工业界都引起了广泛的关注和讨论。一方面,MaPa技术在图像真实感、分辨率和可编辑性方面都表现出了出色的性能,超越了现有的3D模型生成方法。这为计算机图形学和虚拟现实领域的应用提供了新的可能,例如在游戏开发、电影制作和在线购物等领域,都可以利用MaPa技术生成更加真实、精细的3D模型。

另一方面,MaPa技术也面临一些挑战和限制。首先,虽然MaPa技术可以生成高质量的3D模型,但对于一些复杂的场景或对象,仍然可能存在生成效果不佳的问题。其次,MaPa技术目前主要关注于外观的生成,对于3D模型的物理属性(如材质的硬度、弹性等)的生成还不够成熟。此外,MaPa技术对于输入的文本描述也有一定的要求,需要准确、详细的描述才能生成符合预期的3D模型。

论文地址:https://arxiv.org/abs/2404.17569

目录
相关文章
|
1月前
|
编解码 人工智能
蚂蚁百灵大模型推出20亿参数遥感模型SkySense
【2月更文挑战第13天】蚂蚁百灵大模型推出20亿参数遥感模型SkySense
134 1
蚂蚁百灵大模型推出20亿参数遥感模型SkySense
|
1月前
招募!阿里云x魔搭社区发起Create@AI创客松邀你探索下一代多维智能体应用
招募!阿里云x魔搭社区发起Create@AI创客松邀你探索下一代多维智能体应用
557 0
|
22天前
|
存储 人工智能 C++
【PTA】L1-064 估值一亿的AI核心代码(详C++)
【PTA】L1-064 估值一亿的AI核心代码(详C++)
15 1
|
1月前
|
人工智能
Compass Arena: 司南x魔搭携手推出大模型竞技场
从Llama-3的问世,到参数规模空前的MoE模型,再到GPT-4o的震撼发布,大语言模型(LLM)的飞速进步让人目不暇接。然而,随着模型数量的增加,如何客观、公正地评估和比较这些模型的性能,亟待探索与解决的问题。
|
机器学习/深度学习 存储 人工智能
上海数字大脑研究院发布国内首个多模态决策大模型DB1,可实现超复杂问题快速决策
上海数字大脑研究院发布国内首个多模态决策大模型DB1,可实现超复杂问题快速决策
150 0
|
机器学习/深度学习 数据采集 人工智能
ICASSP 2022 | 89.46%检出率,网易云信音频实验室提出全球首个AI啸叫检测方案(2)
ICASSP 2022 | 89.46%检出率,网易云信音频实验室提出全球首个AI啸叫检测方案
143 0
|
人工智能 算法
ICASSP 2022 | 89.46%检出率,网易云信音频实验室提出全球首个AI啸叫检测方案(1)
ICASSP 2022 | 89.46%检出率,网易云信音频实验室提出全球首个AI啸叫检测方案
272 0
|
数据采集 机器学习/深度学习 设计模式
卷麻了! nnUNet 研究团队重磅新作 | MedNeXt: 新一代分割架构之王,刷新多项榜单记录!
卷麻了! nnUNet 研究团队重磅新作 | MedNeXt: 新一代分割架构之王,刷新多项榜单记录!
711 0
|
机器学习/深度学习 人工智能 自然语言处理
两位谷歌华人研究员发布首个纯视觉「移动UI理解」模型,四大任务刷新SOTA
两位谷歌华人研究员发布首个纯视觉「移动UI理解」模型,四大任务刷新SOTA
121 0
|
机器学习/深度学习 人工智能 智能设计
BBC NEWS | AI设计的新药分子首次进入临床试验
BBC NEWS | AI设计的新药分子首次进入临床试验
201 0
BBC NEWS | AI设计的新药分子首次进入临床试验