12年来最大飞跃!黄仁勋发布史上最强GPU,世界首个实时光线追踪新一代图灵架构

简介: 刚刚,英伟达CEO黄仁勋在SIGGRAPH 2018上大秀肌肉,推出世界首个实时光线追踪GPU,基于图灵架构,这是自2006年以来GPU实现的最最重大的飞跃,每秒处理高达10GB Rays,这将彻底改变整个计算机图形处理界的工作流程。

“我们努力了十年。”黄仁勋说:“这是GPU自2006年以来最重大的飞跃。”

在刚刚的SIGGRAPH 2018主旨演讲中,黄仁勋将英伟达的GPU实力展现得淋漓尽致。

虽然摩尔定律已见终点,但对于英伟达GPU来说,似乎完全不存在。黄仁勋认为,历史正处于一个转折点,存在一个全新的定律——“GPU加速定律”(注:不是黄教主本人说的)。

307890cdb86b0ea6ae79e2fb9f2ea100da96b823

在演讲中,黄仁勋发布了世界首款实时光线追踪GPU——NVDIA QUADRO RTX,每秒处理高达10GB Rays,做AI能够达到每秒500 Trillion Tensor Ops,16TFLOPS + 16TIPS,使用NVLink 扩展后,每秒处理速度最高能达到100GB。


在长达5分钟的时间里,黄仁勋骄傲地举起实物,“以前有谁曾用GB做过单位?有谁曾经想过能够用GB做单位?”

黄仁勋自豪地重复了很多遍:“每秒10 GB Rays!”

735f3e774467edcf1a74dd974b677f46c6450d0b

实时渲染光线在环境中的反射和散射,是计算机图形处理界的“圣杯”,这个过程非常复杂,涉及光线在各种不同介质上的多次反射和散射。在上世纪70年代,相关算法年首次提出时,一小时只能模拟一帧,相当于每小时处理60像素。

而现在,英伟达让它提升到了“每秒10 GB Rays”。

这样得益于两大核心技术:英伟达全新研发的基于图灵架构的升级版光线实时追踪RT Core,以及深度学习Tensor Core。

4c1441dff2a0082076beec04a5909adb1e97e76f

黄仁勋感叹,为了设计RT Core架构,英伟达用了整整十年时间研发,终于实现了在一块GPU上进行光线实时追踪,这个以前业界曾经认为不可能的事情。

全新的Turing架构,“这是GPU自2006年以来最重大的飞跃。”黄仁勋说。

从Step-function到Realism,全新的混合渲染模型,光线追踪、计算以及AI,现在好用,也考虑到了未来。

英伟达再一次,实力展现了深度学习时代GPU超乎想象的计算力。

c042baf9b251932371ff326311cfc62c8643b325

实时渲染光线变化效果

全新图灵架构,全球首个实时光线追踪GPU!

黄仁勋表示,英伟达RTX是首款基于 Turing™架构的 GPU,革新了 5000 万设计师和艺术家的工作,使他们能够实时渲染逼真的场景,为其工作流程添加基于 AI 的新功能,享受复杂模型和场景的交互性。

dd301fa8478b035a3eaba41e201b479a9c8f0e23

PASCAL和TURING架构对比

cdf954ec59cc034836a2e80276f4b8734bac45bb

关键在于结合深度学习(Tensor Core)和全新实时光线追踪架构(RT Core)

4c92298d9d420a4bf5a5070a56155e81743aa7a8

图灵架构相比PASCAL实现6倍速度提升


黄仁勋还发布了NVIDIA Quadro RTX 8000Quadro RTX 6000Quadro RTX 5000,实现不同性能的硬件加速光线追踪、AI、先进的阴影和模拟等。

27a012d4271ef74261ebe1db5faca697fa7a4024

同时推出的还有完整的软件堆栈:

105e9e734614d3e45492041252de56470df3b217

以及 Quadro RTX Server,这是一种参考架构,用于从数据中心提供高度可配置、按需呈现和虚拟工作站解决方案。

504a8ef547e7e7c0e8e620ebb3de391099cb77aa

在展示Quadro RTX Server时,黄仁勋在现场展示了他最喜欢的前后对比:

71b1ccb8ef6ffdf521115927ed81975f28efa1ac

现在的渲染集群

3e7586a82bc9b7eaa5a6ddd14fda9061348d1610

使用英伟达RTX服务器

只要1万美元,简直是抢钱啊,”黄仁勋感叹,然后是那句经典的:

“你买得越多,省得越多。”

提前5年实现,彻底革新计算机图形处理

英伟达专业可视化副总裁 Bob Pette 表示:“Quadro RTX 标志着全球计算机图形行业新纪元的开始。”

“用户现在可以享受的强大功能,原来被认为至少是 5 年后才可能实现的。设计师和艺术家现在可以通过光线追踪照片写实的细节,实现复杂的设计和视觉效果。电影工作室和制片公司现在可以通过渲染工作负载实现更高的吞吐量,从而大大节省时间和成本。”

e4f01e54bcd7ab466881c7ddd6e87ca0fd913fe9

Quadro RTX 专业 GPU

Quadro RTX GPU 专为要求最苛刻的视觉计算工作负载而设计,例如用于电影和视频内容创建; 汽车和建筑设计; 以及科学可视化。

它们突破性的技术远远超过上一代,包括:

新的 RT Cores ,可以通过物理上精确的阴影、反射、折射和全局光照,实时跟踪物体和环境的光线。
Turing Tensor Cores 可加速深度神经网络训练和推理,这对于 AI 增强的渲染、产品和服务至关重要。
新的 Turing Streaming Multiprocessor 架构 ,具有多达 4608 个 CUDA 内核,可并行提供高达每秒 16 万亿次浮点运算和每秒 16 万亿次整数运算,可加速真实世界的复杂模拟。
先进的 可编程着色技术 ,可提高复杂视觉效果和图形密集型体验的性能。
首次实现超高速三星 16Gb GDDR6 内存 ,支持更复杂的设计,庞大的建筑数据集,8K 电影内容等。
NVIDIANVLink 将两个 GPU 与一个高速链路结合,可将内存容量扩展至 96GB,并通过高达 100GB/s 的数据传输提高驱动性能。
提供 USB Type-C和 VirtualLink的硬件支持 ,这是一种新的开放行业标准,旨在通过单个 USB-C™连接器满足下一代 VR 耳机的功率,显示和带宽要求。
提高 VR 应用性能的新技术 ,包括可变速率着色、多视图渲染和 VRWorks 音频。

Quadro RTX 服务器

Quadro RTX 服务器为数据中心的按需渲染定义了一个新标准,可以轻松配置按需渲染节点以进行批处理和交互式渲染。

Quadro RTX 服务器将 Quadro RTX GPU 与新的 Quadro Infinity 软件(将在 2019 年第一季度推出)相结合,提供强大而灵活的架构,以满足创意专业人士的需求。Quadro Infinity 将允许多个用户通过虚拟工作站访问单个 GPU,从而显着提高数据中心的密度。最终用户还可以根据他们的特定需求轻松配置渲染节点和工作站。

Quadro RTX 服务器预装了业界领先的内容创建和渲染软件,提供功能强大且易于部署的渲染解决方案,可从小型安装扩展到最大的数据中心,成本仅为只有 CPU 渲染的四分之一。

e4e454178f4a727b446ee2d462650d8698cf3d27


原文发布时间为:2018-08-14本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。原文链接: 12年来最大飞跃!黄仁勋发布史上最强GPU,世界首个实时光线追踪新一代图灵架构
相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
2月前
|
图形学 异构计算
Siemens NX何时支持GPU光线追踪与图形加速?
NX的Ray Tracing Studio在NX 1847及更早版本中不支持NVIDIA RTX板的GPU加速,仅依赖CPU,性能较慢。从NX 1872起支持GPU加速。自2023年6月版起,若无GPU,NX将显示图形配置错误并记录到syslog文件,建议使用支持的GPU以避免未定义行为。更多支持的硬件和图形信息,请参阅鼎森电脑整理的文件“NX-Graphics-Certification-Table_20241207.xlsx”。链接:https://pan.baidu.com/s/1_FpOoJU_IrExnhVXyzB4cw?pwd=676s 提取码: 676s
69 1
|
3月前
|
机器学习/深度学习 弹性计算 人工智能
阿里云服务器架构有啥区别?X86计算、Arm、GPU异构、裸金属和高性能计算对比
阿里云ECS涵盖x86、ARM、GPU/FPGA/ASIC、弹性裸金属及高性能计算等多种架构。x86架构采用Intel/AMD处理器,适用于广泛企业级应用;ARM架构低功耗,适合容器与微服务;GPU/FPGA/ASIC专为AI、图形处理设计;弹性裸金属提供物理机性能;高性能计算则针对大规模并行计算优化。
138 7
|
3月前
|
人工智能 并行计算 流计算
【AI系统】GPU 架构与 CUDA 关系
本文介绍了英伟达GPU硬件基础概念,重点解析了A100 GPU架构中的GPC、TPC、SM等组件及其功能。接着深入讲解了CUDA并行计算平台和编程模型,特别是CUDA线程层次结构。最后,文章探讨了如何根据CUDA核心数量、核心频率等因素计算GPU的算力峰值,这对于评估大模型训练的算力需求至关重要。
124 3
|
3月前
|
机器学习/深度学习 人工智能 并行计算
【AI系统】GPU 架构回顾(从2010年-2017年)
自1999年英伟达发明GPU以来,其技术不断革新。本文概述了从2010年至2024年间,英伟达GPU的九代架构演变,包括费米、开普勒、麦克斯韦、帕斯卡、伏特、图灵、安培、赫柏和布莱克韦尔。这些架构不仅在游戏性能上取得显著提升,还在AI、HPC、自动驾驶等领域发挥了重要作用。CUDA平台的持续发展,以及Tensor Core、NVLink等技术的迭代,巩固了英伟达在计算领域的领导地位。
69 1
|
3月前
|
机器学习/深度学习 人工智能 缓存
【AI系统】GPU 架构回顾(从2018年-2024年)
2018年发布的Turing图灵架构,采用12nm工艺,包含18.6亿个晶体管,大幅提升了PC游戏、专业图形应用及深度学习推理的效率与性能。Turing引入了RT Core和Tensor Core,分别用于实时光线追踪和加速深度学习计算,支持GDDR6内存,显著提升了数据传输速率和效率。此外,Turing架构还支持NVLink 2.0,增强了多GPU协同工作的能力,适用于复杂的图形渲染和深度学习任务。
82 0
【AI系统】GPU 架构回顾(从2018年-2024年)
|
4月前
|
机器学习/深度学习 弹性计算 编解码
阿里云服务器计算架构X86/ARM/GPU/FPGA/ASIC/裸金属/超级计算集群有啥区别?
阿里云服务器ECS提供了多种计算架构,包括X86、ARM、GPU/FPGA/ASIC、弹性裸金属服务器及超级计算集群。X86架构常见且通用,适合大多数应用场景;ARM架构具备低功耗优势,适用于长期运行环境;GPU/FPGA/ASIC则针对深度学习、科学计算、视频处理等高性能需求;弹性裸金属服务器与超级计算集群则分别提供物理机级别的性能和高速RDMA互联,满足高性能计算和大规模训练需求。
154 6
|
2月前
|
弹性计算 API 持续交付
后端服务架构的微服务化转型
本文旨在探讨后端服务从单体架构向微服务架构转型的过程,分析微服务架构的优势和面临的挑战。文章首先介绍单体架构的局限性,然后详细阐述微服务架构的核心概念及其在现代软件开发中的应用。通过对比两种架构,指出微服务化转型的必要性和实施策略。最后,讨论了微服务架构实施过程中可能遇到的问题及解决方案。
|
3月前
|
Cloud Native Devops 云计算
云计算的未来:云原生架构与微服务的革命####
【10月更文挑战第21天】 随着企业数字化转型的加速,云原生技术正迅速成为IT行业的新宠。本文深入探讨了云原生架构的核心理念、关键技术如容器化和微服务的优势,以及如何通过这些技术实现高效、灵活且可扩展的现代应用开发。我们将揭示云原生如何重塑软件开发流程,提升业务敏捷性,并探索其对企业IT架构的深远影响。 ####
76 3
|
3月前
|
Cloud Native 安全 数据安全/隐私保护
云原生架构下的微服务治理与挑战####
随着云计算技术的飞速发展,云原生架构以其高效、灵活、可扩展的特性成为现代企业IT架构的首选。本文聚焦于云原生环境下的微服务治理问题,探讨其在促进业务敏捷性的同时所面临的挑战及应对策略。通过分析微服务拆分、服务间通信、故障隔离与恢复等关键环节,本文旨在为读者提供一个关于如何在云原生环境中有效实施微服务治理的全面视角,助力企业在数字化转型的道路上稳健前行。 ####
|
2月前
|
Java 开发者 微服务
从单体到微服务:如何借助 Spring Cloud 实现架构转型
**Spring Cloud** 是一套基于 Spring 框架的**微服务架构解决方案**,它提供了一系列的工具和组件,帮助开发者快速构建分布式系统,尤其是微服务架构。
266 69
从单体到微服务:如何借助 Spring Cloud 实现架构转型

热门文章

最新文章