浙大、蚂蚁集团推出MaPa:文本生成超真实3D模型

简介: 【6月更文挑战第19天】浙江大学与蚂蚁集团联手推出MaPa技术,革新3D模型生成。MaPa利用文本描述创建超真实3D模型,降低依赖标注数据,提升图像质量和编辑性,推动游戏、VR及影视行业的发展。虽在复杂场景和物理属性生成上仍有局限,但已展现巨大潜力。[论文链接](https://arxiv.org/abs/2404.17569)**

近日,浙江大学和蚂蚁集团联合推出了一项名为MaPa(Material Painting for 3D Shapes)的创新技术,该技术利用文本描述生成超真实3D模型,为计算机图形学和虚拟现实领域带来了新的突破。

MaPa技术的核心目标是通过自然语言处理和计算机图形学的结合,实现从文本描述到3D模型的自动生成。与以往的3D模型生成方法不同,MaPa技术采用了一种全新的思路,即通过生成分段式的程序化材质图作为外观表示,从而支持高质量的渲染效果并提供极大的编辑灵活性。

传统的3D模型生成方法通常需要大量的标注数据,即3D模型与对应的文本描述的配对数据,来训练一个能够生成材质图的模型。然而,这样的数据收集和标注工作不仅耗时费力,而且限制了模型的泛化能力。为了解决这个问题,MaPa技术提出了一种创新的方法,即利用预训练的2D扩散模型作为桥梁,连接文本描述和材质图的生成过程。

具体而言,MaPa技术将一个3D模型分解为一组分段,并设计了一个分段控制的扩散模型来合成与网格部分对齐的2D图像。然后,基于生成的图像,MaPa技术初始化材质图的参数,并通过可微分渲染模块进行微调,以生成符合文本描述的材质。通过这种方式,MaPa技术可以在没有大量标注数据的情况下,实现从文本描述到3D模型的自动生成。

MaPa技术的推出在学术界和工业界都引起了广泛的关注和讨论。一方面,MaPa技术在图像真实感、分辨率和可编辑性方面都表现出了出色的性能,超越了现有的3D模型生成方法。这为计算机图形学和虚拟现实领域的应用提供了新的可能,例如在游戏开发、电影制作和在线购物等领域,都可以利用MaPa技术生成更加真实、精细的3D模型。

另一方面,MaPa技术也面临一些挑战和限制。首先,虽然MaPa技术可以生成高质量的3D模型,但对于一些复杂的场景或对象,仍然可能存在生成效果不佳的问题。其次,MaPa技术目前主要关注于外观的生成,对于3D模型的物理属性(如材质的硬度、弹性等)的生成还不够成熟。此外,MaPa技术对于输入的文本描述也有一定的要求,需要准确、详细的描述才能生成符合预期的3D模型。

论文地址:https://arxiv.org/abs/2404.17569

目录
相关文章
|
6月前
|
编解码 人工智能
蚂蚁百灵大模型推出20亿参数遥感模型SkySense
【2月更文挑战第13天】蚂蚁百灵大模型推出20亿参数遥感模型SkySense
310 1
蚂蚁百灵大模型推出20亿参数遥感模型SkySense
|
6月前
招募!阿里云x魔搭社区发起Create@AI创客松邀你探索下一代多维智能体应用
招募!阿里云x魔搭社区发起Create@AI创客松邀你探索下一代多维智能体应用
646 0
|
机器学习/深度学习 人工智能 数据挖掘
数据上新 | AI Earth上线长时序土地覆盖数据集(来自武汉大学黄昕教授团队)
数据上新 | AI Earth上线长时序土地覆盖数据集(来自武汉大学黄昕教授团队)
数据上新 | AI Earth上线长时序土地覆盖数据集(来自武汉大学黄昕教授团队)
|
10天前
|
人工智能 安全 算法
上交大、上海人工智能实验室开源首个多轮安全对齐数据集 SafeMTData
最近,以 OpenAI o1 为代表的 AI 大模型的推理能力得到了极大提升,在代码、数学的评估上取得了令人惊讶的效果。OpenAI 声称,推理可以让模型更好的遵守安全政策,是提升模型安全的新路径。
|
4月前
|
缓存 人工智能
字节跳动、浙大推出Coin3D:用几何代理,控制3D模型生成
【7月更文挑战第29天】字节跳动与浙江大学合作开发了Coin3D框架,利用几何代理实现3D模型生成的精确控制与交互。该框架通过3D适配器、代理限制编辑策略、渐进式体积缓存及体积-SDS等技术,支持用户实时调整3D模型的全局与局部特征。实验表明,Coin3D在保证高质量的同时,显著提升了生成过程的灵活性与可控性。[论文](https://arxiv.org/abs/2405.08054)
70 5
|
5月前
|
存储 人工智能 C++
【PTA】L1-064 估值一亿的AI核心代码(详C++)
【PTA】L1-064 估值一亿的AI核心代码(详C++)
38 1
|
6月前
|
自然语言处理 架构师 搜索推荐
一文详解瓴羊×阿里云上的Salesforce联合解决方案
一文详解瓴羊×阿里云上的Salesforce联合解决方案
453 1
|
6月前
|
机器学习/深度学习 人工智能 分布式计算
外滩大会蚂蚁开源大规模图学习系统AGL
AGL 将持续的系统优化和能力创新,并将优秀的系统和算法实践开放到社区,本次开源为 AGL v0.1 版本。
外滩大会蚂蚁开源大规模图学习系统AGL
|
6月前
|
人工智能 Cloud Native 搜索推荐
金融先锋联盟发布17份联合解决方案,首次聚焦AI应用场景探索
金融先锋联盟发布17份联合解决方案,首次聚焦AI应用场景探索
132 0
|
6月前
|
机器学习/深度学习 算法
开启“数据混合”新视界:第二届 Data-Juicer 大模型数据挑战赛
在数据的调味中探寻秘密,再次点燃 LLM 美食节的激情!欢迎踏入第二届 Data-Juicer 数智大赛:“BetterMixture - 大模型数据混合挑战赛”。