黄仁勋教主再发威:刚刚推出GPU服务器标准平台

简介: 3月份的2018 GTC结束后,英伟达今天在台湾开了个“专场”,发布了不少新产品,其中包括英伟达GPU服务器标准平台HGX-2和全新的RTX技术,并且黄教主还坚称英伟达GPU“买得越多,省的越多”。

黄仁勋说,今天这场演讲聚焦三大主题:

1、如何持续强化GPU运算能力。

2、庞大的系统、基础架构以及软件生态系统正在围绕英伟达的平台而建立。

3、庞大的终端市场商机以及英伟达建立的软件平台将合作运作。

在新品方面,英伟达宣布推出英伟达HGX-2以及全新的NVIDIA RTX技术。黄教主还不忘“推销”英伟达世界最大的GPU,售价39.9万美元,“好便宜啊!”

计算力还在增长,英伟达GPU“买得越多,省的越多”

黄仁勋还讲了计算力:五年成长30倍。

这是OpenAI最近公布一张图表,表示训练AI模型的运算五年内将成长30万倍,这比摩尔定律快3万倍。

09c44b21a2ecb1b01805a648289eb50d0a214e08

通过增加数据和GPU效能,机器可以编写非常复杂的软件,不需要人工编写,并解决近期无法解决的问题。

未来的运算将融合模拟和机器学习方法,这对英伟达提出了挑战。黄仁勋提出“GPU再造”的口号,创造了Tensor Core GPU,它融合了HPC和AI运算的新架构。

42d69a0cf973f9fa87fadb43ac05463c2351635d

Tensor Core GPU具有多种精度,支持高运算 FP64、FP32、FP16、Int8和单周期4X4矩形乘法累加起来进行深度学习。

Volta是第一款Tensor Core GPU,并采用125张Tensor TFLOPS来增强AI,比以前的GPU快10倍。

NVSwith是一种新型高频宽交换器,其协议可扩展跨16个Volta Tensor 核心GPU的单晶片内建记忆体。程序员可看到具有2 PFLOPS性能的单一512GB GPU。

3月GTC发布的英伟达DGX-2是有史以来最大的GPU,世上第一个2 PFLOPS系统,512GB HBM2,重350磅(相当于两个黄仁勋)。

231e30d493ca02db200d1ce114d269f5a198794b

6个月前, DGX-2的加速套件比DGX-1的性能提高了10倍!

售价39.9万美元让黄仁勋直呼“便宜”,更关键的是,一台DGX-2的效能媲美300台双CPU服务器,且只要1/8的价格与1/18的功率。

“买的越多,省得越多。”

重磅发布HGX-2平台,全新NVIDIA RTX技术亮相

现在,打造HPC与AI的服务器相当复杂,几乎已达到系统设计的极限。

英伟达今天宣布推出NVIDIA GPU服务器标准平台HGX-2。

dec3289e87b95ccbb60c304b9820b7d617b649bf

HGX-2为DGX-2的组件,包含16个Volta Tensor核心GPU,完全连接。

目前,HGX-2加入英伟达服务器系列平台,提供全新模式的超效能运算。下面是平台家族一览:

d47e62d2b349aca45e42305ed6714efbe5ed61d9 HGX-T对于超大规模训练及HPC
d47e62d2b349aca45e42305ed6714efbe5ed61d9 HGX-I针对超大规模推理及IVA

d47e62d2b349aca45e42305ed6714efbe5ed61d9SCX-E针对资料中心、HPC、IVA、VDI及渲染

7ffa712f6259f2b6a2819cad402a7ac59d4b8e4f

售价方面,英伟达没有官方公布,不过黄仁勋在演讲时随口说了句“20万美元”(还是以官方为准)。

另外,在GPU的效能和应用方面,黄仁勋举了几个例子:

42daf0d738e49156aea9030be5039508cca87511

5年前Alex Krizhevsky用两个GTX 580 GPU花6天时间成功训练AlexNet,而一台DGX-2仅需18分钟就能够相同目标,提升了500倍。

除了用于AI等领域,GPU在媒体与娱乐方面每年对超过十亿张影像进行渲染。

电脑绘图是GPU发展的驱动力,用不满足于运算效能,同时这也是一个巨大的产业。

93451734f5fb16557a0a4e8d8d4c0877227357fa

英伟达还宣布推出全新集10年研究大成于一身的NVIDIA RTX技术。NVIDIA RTX结合即时绘图、加速光线追踪与深度学习的各项突破性技术,首度针对高逼真度图像渲染进行加速。

RTX 是15年前自NVIDIA发明可编程即时渲染技术以来最重要的突破。


原文发布时间为:2018-05-30

本文作者:克雷格、肖琴、子涵

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。

原文链接:黄仁勋教主再发威:刚刚推出GPU服务器标准平台

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
3月前
|
存储 监控 固态存储
【vSAN分布式存储服务器数据恢复】VMware vSphere vSAN 分布式存储虚拟化平台VMDK文件1KB问题数据恢复案例
在一例vSAN分布式存储故障中,因替换故障闪存盘后磁盘组失效,一台采用RAID0策略且未使用置备的虚拟机VMDK文件受损,仅余1KB大小。经分析发现,该VMDK文件与内部虚拟对象关联失效导致。恢复方案包括定位虚拟对象及组件的具体物理位置,解析分配空间,并手动重组RAID0结构以恢复数据。此案例强调了深入理解vSAN分布式存储机制的重要性,以及定制化数据恢复方案的有效性。
95 5
|
9天前
|
机器学习/深度学习 人工智能 弹性计算
什么是阿里云GPU云服务器?GPU服务器优势、使用和租赁费用整理
阿里云GPU云服务器提供强大的GPU算力,适用于深度学习、科学计算、图形可视化和视频处理等多种场景。作为亚太领先的云服务提供商,阿里云的GPU云服务器具备灵活的资源配置、高安全性和易用性,支持多种计费模式,帮助企业高效应对计算密集型任务。
|
9天前
|
机器学习/深度学习 人工智能 弹性计算
阿里云GPU服务器全解析_GPU价格收费标准_GPU优势和使用说明
阿里云GPU云服务器提供强大的GPU算力,适用于深度学习、科学计算、图形可视化和视频处理等场景。作为亚太领先的云服务商,阿里云GPU云服务器具备高灵活性、易用性、容灾备份、安全性和成本效益,支持多种实例规格,满足不同业务需求。
|
17天前
|
机器学习/深度学习 人工智能 弹性计算
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多种配置选项,包括CPU+GPU、CPU+FPGA等组合,支持高性能计算需求。本文汇总了阿里云GPU服务器的价格信息,涵盖NVIDIA A10、V100、T4、P4、P100等多款GPU卡,适用于人工智能、机器学习和深度学习等场景。详细价格表和实例规格见文内图表。
|
1月前
|
机器学习/深度学习 弹性计算 编解码
阿里云服务器计算架构X86/ARM/GPU/FPGA/ASIC/裸金属/超级计算集群有啥区别?
阿里云服务器ECS提供了多种计算架构,包括X86、ARM、GPU/FPGA/ASIC、弹性裸金属服务器及超级计算集群。X86架构常见且通用,适合大多数应用场景;ARM架构具备低功耗优势,适用于长期运行环境;GPU/FPGA/ASIC则针对深度学习、科学计算、视频处理等高性能需求;弹性裸金属服务器与超级计算集群则分别提供物理机级别的性能和高速RDMA互联,满足高性能计算和大规模训练需求。
|
2月前
|
Cloud Native Java 编译器
将基于x86架构平台的应用迁移到阿里云倚天实例云服务器参考
随着云计算技术的不断发展,云服务商们不断推出高性能、高可用的云服务器实例,以满足企业日益增长的计算需求。阿里云推出的倚天实例,凭借其基于ARM架构的倚天710处理器,提供了卓越的计算能力和能效比,特别适用于云原生、高性能计算等场景。然而,有的用户需要将传统基于x86平台的应用迁移到倚天实例上,本文将介绍如何将基于x86架构平台的应用迁移到阿里云倚天实例的服务器上,帮助开发者和企业用户顺利完成迁移工作,享受更高效、更经济的云服务。
将基于x86架构平台的应用迁移到阿里云倚天实例云服务器参考
|
1月前
|
固态存储 开发者
阿里云服务器选购之国际版和国内版的平台对比及建议
阿里云服务器选购之国际版和国内版的平台对比及建议
|
3月前
|
编解码 分布式计算 Linux
最新阿里云服务器、轻量应用服务器、GPU云服务器活动价格参考
阿里云服务器产品包含云服务器、轻量应用服务器、GPU云服务器等,本文汇总了这些云服务器当下最新的实时活动价格情况,包含经济型e实例云服务器价格、通用算力型u1实例云服务器价格、第七代云服务器价格、轻量应用服务器最新价格、GPU云服务器价格,以供大家参考。
最新阿里云服务器、轻量应用服务器、GPU云服务器活动价格参考
|
3月前
|
机器学习/深度学习 人工智能 弹性计算
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多样化的选择,包括CPU+GPU、CPU+FPGA等多种配置,适用于人工智能、机器学习和深度学习等计算密集型任务。其中,GPU服务器整合高性能CPU平台,单实例可实现最高5PFLOPS的混合精度计算能力。根据不同GPU类型(如NVIDIA A10、V100、T4等)和应用场景(如AI训练、推理、科学计算等),价格从数百到数千元不等。详情及更多实例规格可见阿里云官方页面。
254 1
|
19天前
|
弹性计算 人工智能 Serverless
阿里云ACK One:注册集群云上节点池(CPU/GPU)自动弹性伸缩,助力企业业务高效扩展
在当今数字化时代,企业业务的快速增长对IT基础设施提出了更高要求。然而,传统IDC数据中心却在业务存在扩容慢、缩容难等问题。为此,阿里云推出ACK One注册集群架构,通过云上节点池(CPU/GPU)自动弹性伸缩等特性,为企业带来全新突破。