NVIDIA大招揭晓:AI与HPC统一平台HGX-2

简介:

昨天的NVIDIA(英伟达)GTC(中国台北)2018大会上,CEO黄仁勋正式发布了首款同时适用于人工智能与高性能计算的统一计算平台——NVIDIA HGX-2。

  说起来,大家应该对NVIDIA在GTC 2018(美国圣何塞)大会上发布的“全球最大GPU”DGX-2多少还有些印象,据称,这个系统就是采用HGX-2构建的。而在昨天的大会上,NVIDIA方面也表示,DGX-2系统将在第三季度销售,售价约为399000美元。

  黄仁勋在大会上表示:“计算领域已不同从前。计算需求猛增,而 CPU 扩展的速度却呈放缓之势。配备Tensor Core GPU的NVIDIA HGX-2为业界提供了融合HPC和AI的多功能计算平台,这一强大的计算平台将助力解决全球面临的重大挑战。”

NVIDIA大招揭晓:AI与HPC统一平台HGX-2

  HGX-2采用了最新的NVSwitch互联技术,将16个Tesla V100 Tensor Core GPU连接为单一巨型GPU,据介绍,它可提供每秒2千万亿次浮点计算的AI性能。作为参考,它的上代产品——去年于Computex 2017上发布的HGX-1,只装载了8个GPU。NVSwitch是NVIDIA在圣何塞GTC 2018大会上发布的最新GPU互联结构,在NVLink的基础上进一步进行了扩展创新,它的带宽比最好的 PCIe 交换机高出5倍,它可使多达16个Tesla V100 GPU同时以2.4 TB /秒的速度进行通信。

  接力登场的HGX-2平台具备多精度计算能力,可提供独特的灵活性。该平台能够针对科学计算和模拟进行高精度的FP64和FP32运算,并针对 AI训练和推理进行 FP16 和 Int8 运算,以“多功能性”满足先进越来越多融合HPC和AI的应用对计算的需求。

  NVIDIA称,HGX-2在ResNet-50训练基准下,创下了每秒15500幅图像的AI训练速度记录,可取代高达300台仅配备CPU服务器。从这个角度来看,该产品可以说确实贯彻了黄仁勋始终坚持的“省钱”理念。在大会上,黄仁勋也笑称:“买得越多,省得越多。”

NVIDIA大招揭晓:AI与HPC统一平台HGX-2

  HGX-2的卖点在于,它既可以用于AI训练,也可以用于推理,同时还能够为HPC应用提供计算支持。在NVIDIA的命名体系中,HGX-T用于AI训练,HGX-I用于推理,而SCX系统则用于HPC。

  NVIDIA将HGX-2描述为“构建模块”,制造商可使用它来构建适用于AI和HPC的系统。事实上,现在已经有多家计算系统制造商宣布计算推出基于HGX-2计算平台的系统。包括联想、云达科技、超微和纬颖科技四家服务器制造商,他们宣布计划于今年下半年将各自的基于HGX-2系统推向市场。此外,全球四大原始设备制造商(ODM)富士康、英业达、广达和纬创也正在设计基于 HGX-2 的系统,有望于下半年在全球几家最大型的云数据中心投入使用。

  NVIDIA在面向人工智能工作负载的GPU市场上是毫无争议的领导者,但仍不可避免地要面临日益激烈的竞争。2016年英特尔收购了Nervana 公司,目前在英特尔Nervana 神经网络处理器(NPU)方面也一直在进行大量投入与研发,在人工智能领域,它将是NVIDIA GPU的一个有力竞争对手。

  与此同时,市场上可提供的FPGA(现场可编程门阵列)也越来越强大,这些FPGA可用于AI推理。虽然FPGA在AI训练方面缺乏与GPU对抗的性能,但它可以被编程来处理一个神经网络的每一个层次,在推理方面拥有理想的灵活性。


原文发布时间为:2018-06-1

本文作者:谢涛

本文来自云栖社区合作伙伴“IT168”,了解相关信息可以关注“IT168”。

相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
相关文章
|
2月前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI
2681 166
|
2月前
|
人工智能 运维 Java
Spring AI Alibaba Admin 开源!以数据为中心的 Agent 开发平台
Spring AI Alibaba Admin 正式发布!一站式实现 Prompt 管理、动态热更新、评测集构建、自动化评估与全链路可观测,助力企业高效构建可信赖的 AI Agent 应用。开源共建,现已上线!
3481 49
|
2月前
|
人工智能 供应链 搜索推荐
拔俗AI 智能就业咨询服务平台:求职者的导航,企业的招聘滤网
AI智能就业平台破解求职招聘困局:精准匹配求职者、企业与高校,打破信息壁垒。简历诊断、岗位推荐、技能提升一站式服务,让就业更高效。
|
2月前
|
人工智能 搜索推荐 大数据
拔俗AI一体化数字销售服务平台:让企业销售更智能、更高效
AI一体化数字销售服务平台融合AI与大数据,集成客户管理、智能推荐、自动化跟进等功能,实现销售全流程智能化。打破传统模式困局,提升转化率与效率,助力企业降本增效,抢占数字化转型先机。(238字)
|
2月前
|
存储 人工智能 搜索推荐
拔俗AI大模型教学平台:开启智能教育新时代
在AI与教育深度融合背景下,本文基于阿里云技术构建大模型教学平台,破解个性化不足、反馈滞后等难题。通过“大模型+知识图谱+场景应用”三层架构,实现智能答疑、精准学情分析与个性化学习路径推荐,助力教学质量与效率双提升,推动教育智能化升级。
|
2月前
|
传感器 人工智能 监控
拔俗多模态跨尺度大数据AI分析平台:让复杂数据“开口说话”的智能引擎
在数字化时代,多模态跨尺度大数据AI分析平台应运而生,打破数据孤岛,融合图像、文本、视频等多源信息,贯通微观与宏观尺度,实现智能诊断、预测与决策,广泛应用于医疗、制造、金融等领域,推动AI从“看懂”到“会思考”的跃迁。
|
2月前
|
人工智能 运维 NoSQL
拔俗AI大模型知识管理平台:让技术团队的“隐性知识”不再沉睡
技术团队常困于知识“存得住却用不好”。AI大模型知识管理平台如同为团队知识装上“智能大脑”,打通文档、代码、日志等碎片信息,实现智能检索、自动归集、动态更新与安全共享。它让新人快速上手、老手高效排障,把散落的经验变成可复用的智慧。知识不再沉睡,经验永不流失。
|
2月前
|
人工智能 自然语言处理 搜索推荐
营销智能体 AI 平台:技术人告别营销需求返工的实战手册
技术人常陷营销琐事:改文案、调接口、算数据。营销智能体AI平台并非“营销玩具”,而是为技术减负的利器。它将内容生成、投放优化、数据复盘自动化,无缝对接现有系统,提升效率2倍以上。落地需避三坑:勿贪全、勿求完美、紧扣业务需求。让技术专注核心,告别重复搬运。
|
2月前
|
人工智能 供应链 算法
AI 产业服务平台:打造产业智能化的“加速器”与“连接器”
AI产业服务平台整合技术、数据、算力与人才,为中小企业提供低门槛、一站式AI赋能服务,覆盖研发、生产、营销、管理全链条,助力产业智能化转型。
|
2月前
|
机器学习/深度学习 人工智能 监控
Java与AI模型部署:构建企业级模型服务与生命周期管理平台
随着企业AI模型数量的快速增长,模型部署与生命周期管理成为确保AI应用稳定运行的关键。本文深入探讨如何使用Java生态构建一个企业级的模型服务平台,实现模型的版本控制、A/B测试、灰度发布、监控与回滚。通过集成Spring Boot、Kubernetes、MLflow和监控工具,我们将展示如何构建一个高可用、可扩展的模型服务架构,为大规模AI应用提供坚实的运维基础。
253 0