ViewExtrapolator:南洋理工联合UCAS团队推出的新型视图合成方法

简介: 南洋理工大学与UCAS团队联合推出了一种新型视图合成方法——ViewExtrapolator。该方法基于稳定视频扩散(SVD)技术,能够在不进行微调的情况下,高效生成超出训练视图范围的新视角图像,显著减少伪影,提升视觉质量。ViewExtrapolator具有广泛的应用前景,尤其在虚拟现实、3D内容创建、电影制作等领域。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

技术基础:基于稳定视频扩散(SVD)模型,无需微调。
主要功能:生成超出训练视图范围的新视角,减少伪影。
应用场景:广泛应用于虚拟现实、3D内容创建、电影制作等领域。

正文(附运行示例)

ViewExtrapolator 是什么

公众号: 蚝油菜花 - ViewExtrapolator

ViewExtrapolator是由南洋理工大学和UCAS研究团队共同开发的一种新型视图合成方法。它基于稳定视频扩散(Stable Video Diffusion, SVD)技术,能够在不进行微调的情况下,高效生成超出训练视图范围的新视角图像。这种方法通过重新设计SVD的去噪过程,有效优化辐射场或点云渲染中易产生伪影的视图,生成更清晰、更逼真的新视角图像。

ViewExtrapolator不仅在数据和计算上具有高效性,还能广泛应用于不同的3D渲染技术,包括从单视图或单目视频派生的点云渲染。

ViewExtrapolator 的主要功能

  • 新视角外推:生成超出训练视图范围的新视角图像,对于提供沉浸式3D体验和自由探索重建的辐射场至关重要。
  • 伪影减少:基于稳定视频扩散(SVD)的生成先验,优化由辐射场或点云渲染产生的伪影,提高合成新视角的视觉质量。
  • 数据和计算效率:作为一个无需微调SVD的推断阶段方法,在数据和计算上都很高效,让新视角外推更加实用和可访问。
  • 广泛的适用性:与不同的3D渲染方法配合使用,包括从单视图或单目视频派生的点云渲染,具有很好的通用性和适应性。

ViewExtrapolator 的技术原理

  • SVD去噪过程:基于稳定视频扩散(SVD)模型,模型基于逐步去噪高斯噪声生成视频。
  • 引导退火和重采样退火:引入引导退火和重采样退火技术,基于在去噪过程中的不同阶段应用不同程度的引导,有效地修复未见区域并提高视觉质量。
  • 多视图一致性:用SVD的多视图一致性,对辐射场或点云渲染中未观测到的部分进行自然视频细节的生成,且保留原始内容,包括相机运动和场景动态。
  • 无需训练:用SVD的生成先验进行新视角外推,在数据和计算上都很高效。
  • 3D渲染的灵活性:无论是从多视图图像生成的辐射场,还是从单视图生成的点云,ViewExtrapolator都能处理,并有效提升渲染质量。

如何运行 ViewExtrapolator

环境配置

ViewExtrapolator的代码已经在python=3.11, pytorch=2.2.0, CUDA=12.1环境下测试通过。

运行步骤

  1. 克隆仓库

    git clone https://github.com/Kunhao-Liu/ViewExtrapolator.git
    cd ViewExtrapolator
    
  2. 多视图图像的新视角外推
    请参考multiview文件夹中的教程,使用3D Gaussian Splatting进行新视角外推。

  3. 单视图或单目视频的新视角外推
    请参考monocular文件夹中的教程,使用点云进行新视角外推。

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
11月前
|
机器学习/深度学习 人工智能 算法
《AI重塑无线网络:化解信号干扰与波动难题》
无线网络在数字化时代至关重要,但信号干扰与波动(如同频干扰、邻频干扰及物理环境变化等)严重影响性能。传统方法虽能缓解部分问题,但在复杂动态环境中效果有限。人工智能的引入,通过机器学习和强化学习,实现了智能信道选择、功率控制及干扰消除,显著提升网络稳定性与效率。实际应用中,智能工厂和大型商场的案例证明了AI技术的有效性。未来,随着AI不断发展并与其他技术融合,无线网络将更稳定高效,为用户带来更优体验。
541 5
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能应用领域有哪些
本文全面探讨了人工智能(AI)的应用领域和技术核心,涵盖医疗、交通、金融、教育、制造、零售等多个行业,并分析了AI技术的局限性及规避策略。同时,介绍了生成式人工智能认证项目的意义与展望。尽管AI发展面临数据依赖和算法可解释性等问题,但通过优化策略和经验验证,可推动其健康发展。未来,AI将在更多领域发挥重要作用,助力社会进步。
|
12月前
一文彻底搞定电容元件
电容元件是电路中储存电荷的基本组件,通常用“C”表示,单位为法拉(F),常见单位有微法(μF)、纳法(nF)和皮法(pF)。电容具有“通交流,隔直流”的特性,主要用于储能、滤波、耦合与隔直等。根据安装方式可分为固定电容、可变电容和微调电容。其主要参数包括电容值、额定电压和损耗因数。电容广泛应用于电源滤波、信号处理及脉冲电路等领域。
1035 0
|
8月前
|
编解码 自然语言处理 安全
📣通义大模型新成员Qwen-VLo,重磅上线,它实现了从“看懂”世界到“描绘”世界
通义千问团队推出全新多模态统一理解与生成模型Qwen VLo,具备强大的图像理解与生成能力。它不仅能“看懂”图像内容,还能基于理解进行高质量再创造,实现从感知到生成的跨越。支持开放指令编辑、多语言交互及复杂任务处理,适用于图像生成、风格迁移、检测标注等多种场景。
1317 1
|
人工智能 搜索推荐 API
Perplexica:开源 AI 搜索引擎,Perplexity AI 的开源替代品,支持多种搜索模式、实时信息更新
Perplexica 是一款开源的 AI 驱动搜索引擎,支持多种搜索模式和实时信息更新,适用于个人、学术和企业等不同场景。
1305 6
Perplexica:开源 AI 搜索引擎,Perplexity AI 的开源替代品,支持多种搜索模式、实时信息更新
|
自动驾驶 vr&ar 开发者
把Waymo玩成GTA游戏!全生成式的车辆行驶轨迹视频合成器来了
FreeVS(Free View Synthesis)是一种创新技术,能够在真实驾驶场景中合成车辆的摄像头视角视频,不仅限于已知轨迹,还能生成全新轨迹上的视频。它采用伪图像表示和视角变换模拟技术,突破了传统方法对已知轨迹的依赖,提升了自动驾驶技术的测试和验证能力。实验结果显示,FreeVS在Waymo Open Dataset上表现出色,具有广泛的应用前景。论文链接:https://arxiv.org/abs/2410.18079
388 16
|
搜索推荐 UED
【Prompt Engineering:自我一致性、生成知识提示、链式提示】
自我一致性是提示工程技术之一,旨在改进链式思维提示中的解码方法。通过少样本CoT采样多个推理路径并选择最一致的答案,有助于提升涉及算术和常识推理任务的性能。例如,在解决年龄相关问题时,通过多次采样并挑选多数答案来提高准确性。此外,生成知识提示技术可预先生成相关信息辅助模型做出更准确预测,进一步优化模型表现。链式提示则通过将复杂任务分解为多个子任务来逐步处理,从而提高模型的透明度和可靠性,便于定位和改进问题。
666 0
【Prompt Engineering:自我一致性、生成知识提示、链式提示】
|
传感器 机器学习/深度学习 编解码
智能驾驶--语义分割 公开数据集 汇总
本文整理了10个质量较好,数据集较大,比较新的,图像语义分割的公开数据集;主要服务于智能驾驶方向(辅助驾驶、自动驾驶等)。
2897 0
|
NoSQL Redis Docker
Docker获取镜像和运行镜像
这篇文章介绍了如何使用Docker获取镜像以及运行镜像的具体步骤和命令。
2146 0

热门文章

最新文章