NVIDIA大招揭晓:AI与HPC统一平台HGX-2

简介:

昨天的NVIDIA(英伟达)GTC(中国台北)2018大会上,CEO黄仁勋正式发布了首款同时适用于人工智能与高性能计算的统一计算平台——NVIDIA HGX-2。

  说起来,大家应该对NVIDIA在GTC 2018(美国圣何塞)大会上发布的“全球最大GPU”DGX-2多少还有些印象,据称,这个系统就是采用HGX-2构建的。而在昨天的大会上,NVIDIA方面也表示,DGX-2系统将在第三季度销售,售价约为399000美元。

  黄仁勋在大会上表示:“计算领域已不同从前。计算需求猛增,而 CPU 扩展的速度却呈放缓之势。配备Tensor Core GPU的NVIDIA HGX-2为业界提供了融合HPC和AI的多功能计算平台,这一强大的计算平台将助力解决全球面临的重大挑战。”

NVIDIA大招揭晓:AI与HPC统一平台HGX-2

  HGX-2采用了最新的NVSwitch互联技术,将16个Tesla V100 Tensor Core GPU连接为单一巨型GPU,据介绍,它可提供每秒2千万亿次浮点计算的AI性能。作为参考,它的上代产品——去年于Computex 2017上发布的HGX-1,只装载了8个GPU。NVSwitch是NVIDIA在圣何塞GTC 2018大会上发布的最新GPU互联结构,在NVLink的基础上进一步进行了扩展创新,它的带宽比最好的 PCIe 交换机高出5倍,它可使多达16个Tesla V100 GPU同时以2.4 TB /秒的速度进行通信。

  接力登场的HGX-2平台具备多精度计算能力,可提供独特的灵活性。该平台能够针对科学计算和模拟进行高精度的FP64和FP32运算,并针对 AI训练和推理进行 FP16 和 Int8 运算,以“多功能性”满足先进越来越多融合HPC和AI的应用对计算的需求。

  NVIDIA称,HGX-2在ResNet-50训练基准下,创下了每秒15500幅图像的AI训练速度记录,可取代高达300台仅配备CPU服务器。从这个角度来看,该产品可以说确实贯彻了黄仁勋始终坚持的“省钱”理念。在大会上,黄仁勋也笑称:“买得越多,省得越多。”

NVIDIA大招揭晓:AI与HPC统一平台HGX-2

  HGX-2的卖点在于,它既可以用于AI训练,也可以用于推理,同时还能够为HPC应用提供计算支持。在NVIDIA的命名体系中,HGX-T用于AI训练,HGX-I用于推理,而SCX系统则用于HPC。

  NVIDIA将HGX-2描述为“构建模块”,制造商可使用它来构建适用于AI和HPC的系统。事实上,现在已经有多家计算系统制造商宣布计算推出基于HGX-2计算平台的系统。包括联想、云达科技、超微和纬颖科技四家服务器制造商,他们宣布计划于今年下半年将各自的基于HGX-2系统推向市场。此外,全球四大原始设备制造商(ODM)富士康、英业达、广达和纬创也正在设计基于 HGX-2 的系统,有望于下半年在全球几家最大型的云数据中心投入使用。

  NVIDIA在面向人工智能工作负载的GPU市场上是毫无争议的领导者,但仍不可避免地要面临日益激烈的竞争。2016年英特尔收购了Nervana 公司,目前在英特尔Nervana 神经网络处理器(NPU)方面也一直在进行大量投入与研发,在人工智能领域,它将是NVIDIA GPU的一个有力竞争对手。

  与此同时,市场上可提供的FPGA(现场可编程门阵列)也越来越强大,这些FPGA可用于AI推理。虽然FPGA在AI训练方面缺乏与GPU对抗的性能,但它可以被编程来处理一个神经网络的每一个层次,在推理方面拥有理想的灵活性。


原文发布时间为:2018-06-1

本文作者:谢涛

本文来自云栖社区合作伙伴“IT168”,了解相关信息可以关注“IT168”。

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
21天前
|
人工智能 监控 安全
数据、AI涌现的年代,迭代数字平台,更需关注安全合规问题
在当下,无论是企业想谋求数字化转型升级,还是想要出海走出去,首先基本上都会对自己的数字体验系统进行重塑,而这其中关于的安全合规问题,也成为了决定企业选择何种技术进行系统迭代更新的关键。
|
2月前
|
人工智能 JSON 数据格式
GEE、PIE和AI Earth平台进行案例评测:NDVI计算,结果差异蛮大
GEE、PIE和AI Earth平台进行案例评测:NDVI计算,结果差异蛮大
56 0
|
2月前
|
人工智能 自然语言处理 安全
国产算力平台的磨砺与革新:助力国内AI走向更高更远
近几年技术圈由人工智能的快速发展,引起来了变革和创新,虽然国外的算力一直是走在最前沿,但是国产算力平台在推动我国AI产业中发挥着重要作用,扮演着重要角色,但要助力国内AI走得更高更远,国产算力平台还需要经历磨砺和革新。那么本文就来分享和讨论一下国产算力平台所需的磨砺和革新,以及这样的平台在国产算力土壤之上能孕育出的AI创新之花。
103 1
国产算力平台的磨砺与革新:助力国内AI走向更高更远
|
3月前
|
机器学习/深度学习 人工智能 编解码
6pen Art - AI绘画平台
6pen Art - AI绘画平台
6pen Art - AI绘画平台
|
1月前
|
人工智能 搜索推荐 机器人
Rasa: 帮助企业更快搭建“AI对话助手”的低代码平台
【2月更文挑战第24天】Rasa: 帮助企业更快搭建“AI对话助手”的低代码平台
36 2
Rasa: 帮助企业更快搭建“AI对话助手”的低代码平台
|
2月前
|
人工智能 自然语言处理 搜索推荐
魔搭ModelScope社区作为一个AI模型开源平台,提供了丰富的模型资源和便捷的服务
【2月更文挑战第9天】魔搭ModelScope社区作为一个AI模型开源平台,提供了丰富的模型资源和便捷的服务
167 3
|
2天前
|
机器学习/深度学习 人工智能 分布式计算
人工智能平台PAI 操作报错合集之在PAI-DSW(平台上的AI数据科学工作站)上尝试修改实例名时,收到"实例不存在"的错误信息如何解决
阿里云人工智能平台PAI (Platform for Artificial Intelligence) 是阿里云推出的一套全面、易用的机器学习和深度学习平台,旨在帮助企业、开发者和数据科学家快速构建、训练、部署和管理人工智能模型。在使用阿里云人工智能平台PAI进行操作时,可能会遇到各种类型的错误。以下列举了一些常见的报错情况及其可能的原因和解决方法。
|
5天前
|
存储 人工智能 测试技术
【AI智能体】SuperAGI-开源AI Agent 管理平台
【4月更文挑战第9天】智能体管理平台SuperAGI简介及实践
|
7天前
|
人工智能 监控 数据处理
【AI大模型应用开发】【LangSmith: 生产级AI应用维护平台】1. 快速上手数据集与测试评估过程
【AI大模型应用开发】【LangSmith: 生产级AI应用维护平台】1. 快速上手数据集与测试评估过程
25 0
|
7天前
|
人工智能 监控 数据可视化
【AI大模型应用开发】【LangSmith: 生产级AI应用维护平台】0. 一文全览Tracing功能,让你的程序运行过程一目了然
【AI大模型应用开发】【LangSmith: 生产级AI应用维护平台】0. 一文全览Tracing功能,让你的程序运行过程一目了然
11 0