黄仁勋教主再发威:刚刚推出GPU服务器标准平台

简介: 3月份的2018 GTC结束后,英伟达今天在台湾开了个“专场”,发布了不少新产品,其中包括英伟达GPU服务器标准平台HGX-2和全新的RTX技术,并且黄教主还坚称英伟达GPU“买得越多,省的越多”。

黄仁勋说,今天这场演讲聚焦三大主题:

1、如何持续强化GPU运算能力。

2、庞大的系统、基础架构以及软件生态系统正在围绕英伟达的平台而建立。

3、庞大的终端市场商机以及英伟达建立的软件平台将合作运作。

在新品方面,英伟达宣布推出英伟达HGX-2以及全新的NVIDIA RTX技术。黄教主还不忘“推销”英伟达世界最大的GPU,售价39.9万美元,“好便宜啊!”

计算力还在增长,英伟达GPU“买得越多,省的越多”

黄仁勋还讲了计算力:五年成长30倍。

这是OpenAI最近公布一张图表,表示训练AI模型的运算五年内将成长30万倍,这比摩尔定律快3万倍。

09c44b21a2ecb1b01805a648289eb50d0a214e08

通过增加数据和GPU效能,机器可以编写非常复杂的软件,不需要人工编写,并解决近期无法解决的问题。

未来的运算将融合模拟和机器学习方法,这对英伟达提出了挑战。黄仁勋提出“GPU再造”的口号,创造了Tensor Core GPU,它融合了HPC和AI运算的新架构。

42d69a0cf973f9fa87fadb43ac05463c2351635d

Tensor Core GPU具有多种精度,支持高运算 FP64、FP32、FP16、Int8和单周期4X4矩形乘法累加起来进行深度学习。

Volta是第一款Tensor Core GPU,并采用125张Tensor TFLOPS来增强AI,比以前的GPU快10倍。

NVSwith是一种新型高频宽交换器,其协议可扩展跨16个Volta Tensor 核心GPU的单晶片内建记忆体。程序员可看到具有2 PFLOPS性能的单一512GB GPU。

3月GTC发布的英伟达DGX-2是有史以来最大的GPU,世上第一个2 PFLOPS系统,512GB HBM2,重350磅(相当于两个黄仁勋)。

231e30d493ca02db200d1ce114d269f5a198794b

6个月前, DGX-2的加速套件比DGX-1的性能提高了10倍!

售价39.9万美元让黄仁勋直呼“便宜”,更关键的是,一台DGX-2的效能媲美300台双CPU服务器,且只要1/8的价格与1/18的功率。

“买的越多,省得越多。”

重磅发布HGX-2平台,全新NVIDIA RTX技术亮相

现在,打造HPC与AI的服务器相当复杂,几乎已达到系统设计的极限。

英伟达今天宣布推出NVIDIA GPU服务器标准平台HGX-2。

dec3289e87b95ccbb60c304b9820b7d617b649bf

HGX-2为DGX-2的组件,包含16个Volta Tensor核心GPU,完全连接。

目前,HGX-2加入英伟达服务器系列平台,提供全新模式的超效能运算。下面是平台家族一览:

d47e62d2b349aca45e42305ed6714efbe5ed61d9 HGX-T对于超大规模训练及HPC
d47e62d2b349aca45e42305ed6714efbe5ed61d9 HGX-I针对超大规模推理及IVA

d47e62d2b349aca45e42305ed6714efbe5ed61d9SCX-E针对资料中心、HPC、IVA、VDI及渲染

7ffa712f6259f2b6a2819cad402a7ac59d4b8e4f

售价方面,英伟达没有官方公布,不过黄仁勋在演讲时随口说了句“20万美元”(还是以官方为准)。

另外,在GPU的效能和应用方面,黄仁勋举了几个例子:

42daf0d738e49156aea9030be5039508cca87511

5年前Alex Krizhevsky用两个GTX 580 GPU花6天时间成功训练AlexNet,而一台DGX-2仅需18分钟就能够相同目标,提升了500倍。

除了用于AI等领域,GPU在媒体与娱乐方面每年对超过十亿张影像进行渲染。

电脑绘图是GPU发展的驱动力,用不满足于运算效能,同时这也是一个巨大的产业。

93451734f5fb16557a0a4e8d8d4c0877227357fa

英伟达还宣布推出全新集10年研究大成于一身的NVIDIA RTX技术。NVIDIA RTX结合即时绘图、加速光线追踪与深度学习的各项突破性技术,首度针对高逼真度图像渲染进行加速。

RTX 是15年前自NVIDIA发明可编程即时渲染技术以来最重要的突破。


原文发布时间为:2018-05-30

本文作者:克雷格、肖琴、子涵

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。

原文链接:黄仁勋教主再发威:刚刚推出GPU服务器标准平台

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
目录
打赏
0
0
0
0
73529
分享
相关文章
阿里云服务器租用费用价格表:2025最新轻量+ECS+GPU优惠1年、1个月和1小时报价单
阿里云服务器租用费用价格表涵盖2025年最新轻量应用服务器、ECS云服务器及GPU服务器优惠报价。轻量应用服务器2核2G配置,一年仅68元(秒杀38元),适合个人开发者;ECS云服务器提供多种规格,如2核2G经济型99元/年、2核4G企业专享199元/年。高性能实例如4核16G游戏服务器70元/月,8核32G为160元/月。GPU服务器方面,T4计算卡4核15G配置低至1878.4元/月。此外,阿里云支持按小时计费,灵活满足不同需求。续费优惠政策明确,长周期享更高折扣,具体以官方页面为准。
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多种配置,包括CPU+GPU、FPGA等,适用于人工智能、机器学习和深度学习等计算密集型任务。本文整理了阿里云GPU服务器的优惠价格,涵盖NVIDIA A10、V100、T4等型号,提供1个月、1年和1小时的收费明细。具体规格如A10卡GN7i、V100-16G卡GN6v等,适用于不同业务场景,详情见官方页面。
218 11
利用阿里云GPU加速服务器实现pdf转换为markdown格式
随着AI模型的发展,GPU需求日益增长,尤其是个人学习和研究。直接购置硬件成本高且更新快,建议选择阿里云等提供的GPU加速型服务器。
利用阿里云GPU加速服务器实现pdf转换为markdown格式
阿里云服务器架构有啥区别?X86计算、Arm、GPU异构、裸金属和高性能计算对比
阿里云ECS涵盖x86、ARM、GPU/FPGA/ASIC、弹性裸金属及高性能计算等多种架构。x86架构采用Intel/AMD处理器,适用于广泛企业级应用;ARM架构低功耗,适合容器与微服务;GPU/FPGA/ASIC专为AI、图形处理设计;弹性裸金属提供物理机性能;高性能计算则针对大规模并行计算优化。
208 7
阿里云弹性计算(ECS)提供强大的AI工作负载平台,支持灵活的资源配置与高性能计算,适用于AI训练与推理
阿里云弹性计算(ECS)提供强大的AI工作负载平台,支持灵活的资源配置与高性能计算,适用于AI训练与推理。通过合理优化资源分配、利用自动伸缩及高效数据管理,ECS能显著提升AI系统的性能与效率,降低运营成本,助力科研与企业用户在AI领域取得突破。
139 6
阿里云服务器、轻量应用服务器、gpu云服务器收费标准与实时活动价格参考
云服务器ECS、轻量应用服务器和gpu云服务器是阿里云的主要云服务器产品,目前轻量应用服务器2核2G收费标准为60元/月,活动价格只要36元/1年或68元1年,云服务器1核1G包月收费标准最低为24.0元/月,GPU云服务器中gn6i实例4核15G配置月付1681.00/1个月起,gn6v实例8核32G配置月付3817.00/1个月起。本文为大家整理汇总了阿里云服务器、轻量应用服务器、gpu云服务器的最新收费标准与活动价格情况,以表格形式展示给大家,以供参考。
阿里云GPU云服务器优惠收费标准,GPU服务器优缺点与适用场景详解
随着人工智能、大数据分析和高性能计算的发展,对计算资源的需求不断增加。GPU凭借强大的并行计算能力和高效的浮点运算性能,逐渐成为处理复杂计算任务的首选工具。阿里云提供了从入门级到旗舰级的多种GPU服务器,涵盖GN5、GN6、GN7、GN8和GN9系列,分别适用于图形渲染、视频编码、深度学习推理、训练和高性能计算等场景。本文详细介绍各系列的规格、价格和适用场景,帮助用户根据实际需求选择最合适的GPU实例。
Swift 是苹果公司开发的现代编程语言,具备高效、安全、简洁的特点,支持类型推断、闭包、泛型等特性,广泛应用于苹果各平台及服务器端开发
Swift 是苹果公司开发的现代编程语言,具备高效、安全、简洁的特点,支持类型推断、闭包、泛型等特性,广泛应用于苹果各平台及服务器端开发。基础语法涵盖变量、常量、数据类型、运算符、控制流等,高级特性包括函数、闭包、类、结构体、协议和泛型。
92 2
2025年阿里云GPU服务器租用价格、选型策略与应用场景详解
随着AI与高性能计算需求的增长,阿里云提供了多种GPU实例,如NVIDIA V100、A10、T4等,适配不同场景。2025年重点实例中,V100实例GN6v单月3830元起,适合大规模训练;A10实例GN7i单月3213.99元起,适用于混合负载。计费模式有按量付费和包年包月,后者成本更低。针对AI训练、图形渲染及轻量级推理等场景,推荐不同配置以优化成本和性能。阿里云还提供抢占式实例、ESSD云盘等资源优化策略,支持eRDMA网络加速和倚天ARM架构,助力企业在2025年实现智能计算的效率与成本最优平衡。 (该简介为原文内容的高度概括,符合要求的字符限制。)
部署DeepSeek但IDC GPU不足,阿里云ACK Edge虚拟节点来帮忙
介绍如何使用ACK Edge与虚拟节点满足DeepSeek部署的弹性需求。

新智元

+ 订阅

热门文章

最新文章