神经渲染与AI生成框架结合,5倍提升游戏速度,英伟达是这样做的

简介: 神经渲染与AI生成框架结合,5倍提升游戏速度,英伟达是这样做的


假如摩尔定失去动力,神经渲染不失为一种较好的替补方法,它提供了一种在不增加晶体管数量的情况下还能继续提供巨大收益的方案。

此前,在一场直播活动中,英伟达 CEO 黄仁勋宣布推出 DLSS 3。DLSS 全名为 Deep Learning Super Sampling,它是英伟达发布的深度学习超级采样技术,其拥有开创性的光学多帧生成功能,其为游戏提供了不可或缺的三要素:提高帧率、最大限度地提升响应速度和改善图像质量。



在一系列游戏和引擎中,与传统渲染相比,DLSS 3 有助于将 GeForce RTX 40 系列的性能翻倍提高:



与此同时,英伟达副总裁 Bryan Catanzaro 也曾在 Twitter 上宣称:「神经渲染在 Ada 架构的 DLSS 3.0 加持下迈出了非常重要的一步!除了 DL 驱动的超分辨率,它还使用光流、运动矢量和 DL 来生成整个帧。DLSS 3 渲染的 8 个像素中有 7 个是来自神经渲染的。」这足以将渲染速度提高 5 倍。



尽管这项了不起的技术目前仅限用于几十款 3D 游戏,但神经渲染很快就会带来收益。这项技术将释放日常消费电子产品的新潜力。

在多数情况下,DLSS  3 在 4K 分辨率下比传统渲染技术性能提高两到三倍。虽然英伟达目前处于领先地位,但它也有竞争对手,比如英特尔 AI 驱动的高端软件 XeSS (Xe Super Sampling),以及 AMD 的 RDNA 3 图形架构。


游戏引领了神经渲染的浪潮,因为它们非常适合使用机器学习技术。谷歌高级研究员 Jon Barron 表示:「只看图像的小 patch,试图猜出图像缺失了什么,这非常适合机器来学习。机器善于识别帧之间的相似性,包括那些帧率高到足以掩盖运动中的微小错误。」


不过 DLSS  3 也存在不完美的地方,其在场景转换方面存在缺陷。但是 Barron 和 Catanzaro 认为在神经渲染模型中通过添加训练数据可以弥补这一缺陷。


英特尔图形研究副总裁 Anton Kaplanyan 认为,未来神经渲染技术会让 3D 内容创作变得更加触手可及。不难看出,现在的社交网络已经逐渐商品化了,人们只需点击一个按钮,拍一张照片,就可与亲朋好友分享。如果我们想把这种体验提升到 3D,我们就需要吸引那些不懂专业工具的人成为内容创造者。


2023 年,3D 神经渲染的改进速度关乎其未来的发展。但与传统渲染相比,研究者缺少更多的经验。Barron 指出:「计算机图形学很神奇,它的工作效果非常好,我们有很多方法来解决问题,而这些方法可能永远适用。」


接下来的问题是,图形行业会在何时接受 3D 神经渲染作为一种替代方案。这种过渡可能是令人担忧的,因为押注错误技术或错误架构的代价可不小。


尽管如此,Catanzaro 相信 3D 神经渲染已经势不可挡。他说:「我们将会看到许多更加不同凡响的神经渲染技术。这些技术有的能够做阴影、折射和反射,将来我们会考虑那些比 DLSS 更强的神经渲染方法,我认为未来的图形领域将会是多种方法并行的。」


神经渲染最大的好处是效率


神经渲染的魅力不仅在于它潜在的性能,还在于它潜在的效率。DLSS 3 通过 RTX 在 Portal 游戏中提供的 530% 增益可以提高帧速率——或者通过将帧速率限制在一个目标内来降低功耗。如此一来,DLSS 3 可以减少呈现每一帧的成本。


英伟达 DLSS 3


这可不容小觑,因为消费电子领域面临着一个重要问题,即摩尔定律大势已去,就算没有,也只是苟延残喘罢了。Catanzaro 说道:「正如你所知道的,摩尔定律已经失去了势头,我个人认为后摩尔图像就是神经图像。对于英伟达来说,神经渲染已然成为一种具有代表性的方法,它不需要成倍增加晶体管数量就可以为公司带来巨大收益。」


然而,英特尔的 Kaplanyan 并不认为摩尔定律会消亡,但他也赞同神经渲染可以提高效率。他说:「芯片的大小可以解决,我同意我们有着大好的机会,可以通过机器学习算法,更有效地利用这种能量和这一领域,产生新的视觉效果。」


AMD、英伟达和英特尔这三家公司都与设备制造商合作,来设计新的消费笔记本电脑和平板电脑,于是效率便成为了三家公司的必争之地。对于设备制造商来说,效率提高带来了更薄、更轻、电池续航时间更长的设备,同时也提升了用户使用设备的功能。

显然,2023 年将是消费设备中神经渲染的奠基年。支持 DLSS 3 的英伟达 RTX 40 系列将推出多种台式电脑和笔记本电脑;英特尔预计将扩展其 Arc 图形线与即将到来的 Battlemage 架构;AMD 将推出更多使用 RDNA 3 架构的变体产品。


这些产品的发布为图形革命奠定了基础。当然,这不是一蹴而就的,需要花些功夫——但随着消费者对视觉效果和内容创造的要求越来越高,通过更小、更薄的创新,神经渲染可能是最好的交付方式。


原文链接:https://spectrum.ieee.org/ai-graphics-neural-rendering


相关文章
|
6天前
|
存储 人工智能 开发框架
Eliza:TypeScript 版开源 AI Agent 开发框架,快速搭建智能、个性的 Agents 系统
Eliza 是一个开源的多代理模拟框架,支持多平台连接、多模型集成,能够快速构建智能、高效的AI系统。
71 8
Eliza:TypeScript 版开源 AI Agent 开发框架,快速搭建智能、个性的 Agents 系统
|
9天前
|
人工智能 开发框架 算法
Qwen-Agent:阿里通义开源 AI Agent 应用开发框架,支持构建多智能体,具备自动记忆上下文等能力
Qwen-Agent 是阿里通义开源的一个基于 Qwen 模型的 Agent 应用开发框架,支持指令遵循、工具使用、规划和记忆能力,适用于构建复杂的智能代理应用。
153 10
Qwen-Agent:阿里通义开源 AI Agent 应用开发框架,支持构建多智能体,具备自动记忆上下文等能力
|
6天前
|
数据采集 人工智能 分布式计算
MaxFrame:链接大数据与AI的高效分布式计算框架深度评测与实践!
阿里云推出的MaxFrame是链接大数据与AI的分布式Python计算框架,提供类似Pandas的操作接口和分布式处理能力。本文从部署、功能验证到实际场景全面评测MaxFrame,涵盖分布式Pandas操作、大语言模型数据预处理及企业级应用。结果显示,MaxFrame在处理大规模数据时性能显著提升,代码兼容性强,适合从数据清洗到训练数据生成的全链路场景...
19 5
MaxFrame:链接大数据与AI的高效分布式计算框架深度评测与实践!
|
17天前
|
人工智能 Linux API
PromptWizard:微软开源 AI 提示词自动化优化框架,能够迭代优化提示指令和上下文示例,提升 LLMs 特定任务的表现
PromptWizard 是微软开源的 AI 提示词自动化优化框架,通过自我演变和自我适应机制,迭代优化提示指令和上下文示例,提升大型语言模型(LLMs)在特定任务中的表现。本文详细介绍了 PromptWizard 的主要功能、技术原理以及如何运行该框架。
105 8
PromptWizard:微软开源 AI 提示词自动化优化框架,能够迭代优化提示指令和上下文示例,提升 LLMs 特定任务的表现
|
26天前
|
机器学习/深度学习 人工智能 自然语言处理
DiffSensei:AI 漫画生成框架,能生成内容可控的黑白漫画面板,支持多角色和布局控制
DiffSensei 是一个由北京大学、上海AI实验室及南洋理工大学共同推出的AI漫画生成框架,能够生成可控的黑白漫画面板。该框架整合了基于扩散的图像生成器和多模态大型语言模型(MLLM),支持多角色控制和精确布局控制,适用于漫画创作、个性化内容生成等多个领域。
108 18
DiffSensei:AI 漫画生成框架,能生成内容可控的黑白漫画面板,支持多角色和布局控制
|
13天前
|
数据采集 人工智能 自然语言处理
Midscene.js:AI 驱动的 UI 自动化测试框架,支持自然语言交互,生成可视化报告
Midscene.js 是一款基于 AI 技术的 UI 自动化测试框架,通过自然语言交互简化测试流程,支持动作执行、数据查询和页面断言,提供可视化报告,适用于多种应用场景。
130 1
Midscene.js:AI 驱动的 UI 自动化测试框架,支持自然语言交互,生成可视化报告
|
22天前
|
机器学习/深度学习 人工智能
Leffa:Meta AI 开源精确控制人物外观和姿势的图像生成框架,在生成穿着的同时保持人物特征
Leffa 是 Meta 开源的图像生成框架,通过引入流场学习在注意力机制中精确控制人物的外观和姿势。该框架不增加额外参数和推理成本,适用于多种扩散模型,展现了良好的模型无关性和泛化能力。
67 11
Leffa:Meta AI 开源精确控制人物外观和姿势的图像生成框架,在生成穿着的同时保持人物特征
|
2天前
|
人工智能 测试技术 决策智能
玩转智能体魔方!清华推出AgentSquare模块化搜索框架,开启AI智能体高速进化时代
清华大学研究团队提出模块化LLM智能体搜索(MoLAS)框架AgentSquare,将LLM智能体设计抽象为规划、推理、工具使用和记忆四大模块,实现模块间的轻松组合与替换。通过模块进化和重组机制,AgentSquare显著提升了智能体的适应性和灵活性,并在多个基准测试中表现出色,平均性能提高17.2%。此外,该框架还具备可解释性,有助于深入理解智能体架构对任务性能的影响。论文地址:https://arxiv.org/abs/2410.06153
26 10
|
27天前
|
人工智能 API 语音技术
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
TEN Agent 是一个开源的实时多模态 AI 代理框架,集成了 OpenAI Realtime API 和 RTC 技术,支持语音、文本和图像的多模态交互,具备实时通信、模块化设计和多语言支持等功能,适用于智能客服、实时语音助手等多种场景。
145 15
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
|
28天前
|
人工智能 安全 PyTorch
SPDL:Meta AI 推出的开源高性能AI模型数据加载解决方案,兼容主流 AI 框架 PyTorch
SPDL是Meta AI推出的开源高性能AI模型数据加载解决方案,基于多线程技术和异步事件循环,提供高吞吐量、低资源占用的数据加载功能,支持分布式系统和主流AI框架PyTorch。
55 10
SPDL:Meta AI 推出的开源高性能AI模型数据加载解决方案,兼容主流 AI 框架 PyTorch