近日,浙江大学和蚂蚁集团联合推出了一项名为MaPa(Material Painting for 3D Shapes)的创新技术,该技术利用文本描述生成超真实3D模型,为计算机图形学和虚拟现实领域带来了新的突破。
MaPa技术的核心目标是通过自然语言处理和计算机图形学的结合,实现从文本描述到3D模型的自动生成。与以往的3D模型生成方法不同,MaPa技术采用了一种全新的思路,即通过生成分段式的程序化材质图作为外观表示,从而支持高质量的渲染效果并提供极大的编辑灵活性。
传统的3D模型生成方法通常需要大量的标注数据,即3D模型与对应的文本描述的配对数据,来训练一个能够生成材质图的模型。然而,这样的数据收集和标注工作不仅耗时费力,而且限制了模型的泛化能力。为了解决这个问题,MaPa技术提出了一种创新的方法,即利用预训练的2D扩散模型作为桥梁,连接文本描述和材质图的生成过程。
具体而言,MaPa技术将一个3D模型分解为一组分段,并设计了一个分段控制的扩散模型来合成与网格部分对齐的2D图像。然后,基于生成的图像,MaPa技术初始化材质图的参数,并通过可微分渲染模块进行微调,以生成符合文本描述的材质。通过这种方式,MaPa技术可以在没有大量标注数据的情况下,实现从文本描述到3D模型的自动生成。
MaPa技术的推出在学术界和工业界都引起了广泛的关注和讨论。一方面,MaPa技术在图像真实感、分辨率和可编辑性方面都表现出了出色的性能,超越了现有的3D模型生成方法。这为计算机图形学和虚拟现实领域的应用提供了新的可能,例如在游戏开发、电影制作和在线购物等领域,都可以利用MaPa技术生成更加真实、精细的3D模型。
另一方面,MaPa技术也面临一些挑战和限制。首先,虽然MaPa技术可以生成高质量的3D模型,但对于一些复杂的场景或对象,仍然可能存在生成效果不佳的问题。其次,MaPa技术目前主要关注于外观的生成,对于3D模型的物理属性(如材质的硬度、弹性等)的生成还不够成熟。此外,MaPa技术对于输入的文本描述也有一定的要求,需要准确、详细的描述才能生成符合预期的3D模型。