Fancy123：华中科技和华南理工推出的3D网格生成技术

2024-12-01 292

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Fancy123是由华中科技大学和华南理工大学联合推出的3D网格生成技术，能够从单张图片生成高质量的3D网格。该技术通过即插即用的变形技术，解决了多视图图像的局部不一致性，提高了网格对输入图像的保真度，并确保了高清晰度。Fancy123在定性和定量实验中表现出色，能够无缝集成到现有的单图像到3D的方法中。

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发非常感兴趣，我会每日跟你分享最新的 AI 资讯和开源应用，也会不定期分享自己的想法和开源实例，欢迎关注我哦！

🥦 微信公众号｜搜一搜：蚝油菜花 🥦

🚀 快速阅读

技术来源：华中科技大学和华南理工大学联合推出。
核心功能：从单张图片生成高质量3D网格。
技术优势：解决多视图图像不一致性，提高网格保真度和清晰度。

正文（附运行示例）

Fancy123 是什么

公众号: 蚝油菜花 - Fancy123

Fancy123是华中科技大学和华南理工大学联合推出的3D网格生成技术，基于即插即用的变形技术从单张图片生成高质量的3D网格。该方法包含两个增强模块和反投影操作，分别解决多视图图像的局部不一致性、提高网格对输入图像的保真度及确保高清晰度。

外观增强模块基于变形2D多视图图像对齐像素，保真度增强模块基于变形3D网格匹配输入图像。Fancy123在定性和定量实验中显示出显著的性能提升，能无缝集成到现有的单图像到3D的方法中。

Fancy123 的主要功能

从单张图片生成3D网格：根据单一的RGB图像生成具有高视觉吸引力、颜色清晰度和输入保真度的3D网格模型。
解决多视图图像的局部不一致性：基于外观增强模块，校正由2D多视图扩散模型生成的图像中的不一致性，提高多视图一致性。
提高网格对输入图像的保真度：基于保真度增强模块，调整3D网格更精确地匹配输入图像，增强网格与输入图像的相似度。
确保高清晰度：基于反投影操作，将输入图像和变形后的多视图图像投影到由LRM生成的网格上，提高网格颜色的清晰度，去除模糊效果。

Fancy123 的技术原理

多视图扩散模型：用2D多视图扩散模型基于输入图像生成一组多视图图像。
大型重建模型（LRM）：用LRM从多视图图像中快速重建一个初始的3D网格。
外观增强模块：优化基于网格的2D变形场对齐多视图图像中的错位像素。将变形后的多视图图像反投影到初始网格上，增强外观质量并减少幽灵效应。
保真度增强模块：基于参数化网格变形（用Jacobian场）优化网格，使其更贴近输入图像。估计输入图像的相机参数，以便在变形过程中保持与输入图像的对应关系。
反投影操作：在2D和3D变形之后，Fancy123执行反投影操作，将输入图像和变形后的多视图图像几乎无损地映射到网格上，提高网格颜色的清晰度。
即插即用模块：Fancy123的两个增强模块设计为即插即用，能在推理时工作，支持无缝集成到各种现有的单图像到3D的方法中。

资源

GitHub 仓库：https://github.com/YuQiao0303/Fancy123
arXiv 技术论文：https://arxiv.org/pdf/2411.16185

🥦 微信公众号｜搜一搜：蚝油菜花 🥦

Fancy123：华中科技和华南理工推出的3D网格生成技术

🚀 快速阅读

正文（附运行示例）

Fancy123 是什么

Fancy123 的主要功能

Fancy123 的技术原理

资源

计算机视觉

热门文章

最新文章

相关电子书