上海科技大学等研究机构最近开源了一种创新模型,该模型能够根据文本描述生成精美的3D服装。这项研究的成果被发表在论文《DressCode: Autoregressively Sewing and Generating Garments from Text Guidance》中,论文地址为:https://arxiv.org/abs/2401.16465。
该模型名为DressCode,旨在通过自然语言交互的方式,使服装设计变得更加民主化和便捷化。它不仅可以帮助初学者轻松地进行服装设计,还为时尚设计、虚拟试穿和数字人创建等领域提供了巨大的潜力。
DressCode的核心组成部分是SewingGPT,这是一种基于GPT(Generative Pre-trained Transformer)的架构,它结合了交叉注意力机制和文本条件嵌入,以生成与文本描述相匹配的缝纫模式。此外,该模型还利用了一种经过预训练的稳定扩散模型,用于生成基于物理渲染(PBR)的纹理,这些纹理可以应用于生成的服装上,使其更加逼真。
通过利用大型语言模型,DressCode能够通过自然语言交互生成适合计算机图形(CG)的服装。它还支持模式的自动完成和纹理的编辑,使得设计过程更加流畅和用户友好。这种创新的框架为创作者提供了更大的自由度,使他们能够更轻松地尝试各种设计,并将独特的元素融入到他们的作品中。
该研究团队对DressCode进行了全面的评估和比较,结果显示,与现有的最先进的方法相比,DressCode在生成的服装质量和与输入提示的一致性方面表现出色。此外,用户研究也验证了DressCode在实际应用中的高质量渲染结果,突显了其在生产环境中的实用性和潜力。
然而,尽管DressCode在服装设计领域具有巨大的潜力,但也存在一些挑战和限制。首先,虽然该模型能够生成高质量的服装,但对于一些复杂的设计或特定的服装类型,可能需要更多的改进和优化。其次,虽然DressCode支持自然语言交互,但对于一些非专业用户来说,可能需要更多的指导和培训才能充分利用其功能。