ViewExtrapolator:南洋理工联合UCAS团队推出的新型视图合成方法

简介: 南洋理工大学与UCAS团队联合推出了一种新型视图合成方法——ViewExtrapolator。该方法基于稳定视频扩散(SVD)技术,能够在不进行微调的情况下,高效生成超出训练视图范围的新视角图像,显著减少伪影,提升视觉质量。ViewExtrapolator具有广泛的应用前景,尤其在虚拟现实、3D内容创建、电影制作等领域。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

技术基础:基于稳定视频扩散(SVD)模型,无需微调。
主要功能:生成超出训练视图范围的新视角,减少伪影。
应用场景:广泛应用于虚拟现实、3D内容创建、电影制作等领域。

正文(附运行示例)

ViewExtrapolator 是什么

公众号: 蚝油菜花 - ViewExtrapolator

ViewExtrapolator是由南洋理工大学和UCAS研究团队共同开发的一种新型视图合成方法。它基于稳定视频扩散(Stable Video Diffusion, SVD)技术,能够在不进行微调的情况下,高效生成超出训练视图范围的新视角图像。这种方法通过重新设计SVD的去噪过程,有效优化辐射场或点云渲染中易产生伪影的视图,生成更清晰、更逼真的新视角图像。

ViewExtrapolator不仅在数据和计算上具有高效性,还能广泛应用于不同的3D渲染技术,包括从单视图或单目视频派生的点云渲染。

ViewExtrapolator 的主要功能

  • 新视角外推:生成超出训练视图范围的新视角图像,对于提供沉浸式3D体验和自由探索重建的辐射场至关重要。
  • 伪影减少:基于稳定视频扩散(SVD)的生成先验,优化由辐射场或点云渲染产生的伪影,提高合成新视角的视觉质量。
  • 数据和计算效率:作为一个无需微调SVD的推断阶段方法,在数据和计算上都很高效,让新视角外推更加实用和可访问。
  • 广泛的适用性:与不同的3D渲染方法配合使用,包括从单视图或单目视频派生的点云渲染,具有很好的通用性和适应性。

ViewExtrapolator 的技术原理

  • SVD去噪过程:基于稳定视频扩散(SVD)模型,模型基于逐步去噪高斯噪声生成视频。
  • 引导退火和重采样退火:引入引导退火和重采样退火技术,基于在去噪过程中的不同阶段应用不同程度的引导,有效地修复未见区域并提高视觉质量。
  • 多视图一致性:用SVD的多视图一致性,对辐射场或点云渲染中未观测到的部分进行自然视频细节的生成,且保留原始内容,包括相机运动和场景动态。
  • 无需训练:用SVD的生成先验进行新视角外推,在数据和计算上都很高效。
  • 3D渲染的灵活性:无论是从多视图图像生成的辐射场,还是从单视图生成的点云,ViewExtrapolator都能处理,并有效提升渲染质量。

如何运行 ViewExtrapolator

环境配置

ViewExtrapolator的代码已经在python=3.11, pytorch=2.2.0, CUDA=12.1环境下测试通过。

运行步骤

  1. 克隆仓库

    git clone https://github.com/Kunhao-Liu/ViewExtrapolator.git
    cd ViewExtrapolator
    
  2. 多视图图像的新视角外推
    请参考multiview文件夹中的教程,使用3D Gaussian Splatting进行新视角外推。

  3. 单视图或单目视频的新视角外推
    请参考monocular文件夹中的教程,使用点云进行新视角外推。

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
SQL 缓存 监控
druid数据源配置参数说明
druid数据源配置参数说明
2721 0
|
12月前
|
编解码 自然语言处理 安全
📣通义大模型新成员Qwen-VLo,重磅上线,它实现了从“看懂”世界到“描绘”世界
通义千问团队推出全新多模态统一理解与生成模型Qwen VLo,具备强大的图像理解与生成能力。它不仅能“看懂”图像内容,还能基于理解进行高质量再创造,实现从感知到生成的跨越。支持开放指令编辑、多语言交互及复杂任务处理,适用于图像生成、风格迁移、检测标注等多种场景。
1826 1
|
机器学习/深度学习 人工智能 自然语言处理
人工智能应用领域有哪些
本文全面探讨了人工智能(AI)的应用领域和技术核心,涵盖医疗、交通、金融、教育、制造、零售等多个行业,并分析了AI技术的局限性及规避策略。同时,介绍了生成式人工智能认证项目的意义与展望。尽管AI发展面临数据依赖和算法可解释性等问题,但通过优化策略和经验验证,可推动其健康发展。未来,AI将在更多领域发挥重要作用,助力社会进步。
一文彻底搞定电容元件
电容元件是电路中储存电荷的基本组件,通常用“C”表示,单位为法拉(F),常见单位有微法(μF)、纳法(nF)和皮法(pF)。电容具有“通交流,隔直流”的特性,主要用于储能、滤波、耦合与隔直等。根据安装方式可分为固定电容、可变电容和微调电容。其主要参数包括电容值、额定电压和损耗因数。电容广泛应用于电源滤波、信号处理及脉冲电路等领域。
1620 0
|
6月前
|
人工智能 供应链 自动驾驶
向AI构建能力,用模型产出价值,让金融优质发展
近年来,新一代人工智能技术迅速发展,给各行业的变革带来新的机遇。大模型、智能体、AI基础设施快速升级,面向未来,AI具有新的方向和时代定义,无疑成为新的生产力。
583 0
|
SQL 人工智能 自然语言处理
【2023云栖】田奇铣:大模型驱动DataWorks数据开发治理平台智能化升级
随着大模型掀起AI技术革新浪潮,大数据也进入了与AI深度结合的创新时期。2023年云栖大会上,阿里云DataWorks产品负责人田奇铣发布了DataWorks Copilot、DataWorks AI增强分析、DataWorks湖仓融合数据管理等众多新产品能力,让DataWorks这款已经发展了14年的大数据开发治理平台产品,从一站式向智能化不断升级演进。
60353 8
|
存储 算法 机器人
卡尔曼滤波 KF | 扩展卡尔曼滤波 EKF (思路流程和计算公式)
本文分析卡尔曼滤波和扩展卡尔曼滤波,包括:思路流程、计算公式、简单案例等。滤波算法,在很多场景都有应用,感觉理解其思路和计算过程比较重要。
4926 0
|
人工智能 JavaScript 数据可视化
深入探索 Flux Tools 在 AI 图像创作中的强大功能
Flux Tools 是由 Black Forest Labs 开发的一套先进 AI 图像编辑工具,集成了修补、扩展、深度映射和边缘检测等功能,为用户提供高精度的图像控制能力,广泛应用于照片编辑、数字艺术创作和设计工作等领域,极大提升了创作效率与自由度。
|
数据采集 人工智能 监控
揭秘数据治理:七步工作法&十大准则全解析
数据治理的“七步工作法”与“十大准则”为企业构建科学、系统、高效的数据治理体系提供了重要的指导和借鉴。企业应结合自身实际情况,灵活运用这些方法和准则,充分挖掘数据潜能,赋能业务创新,实现数字化转型的稳健推进。
1619 0

热门文章

最新文章