为什么GTC大会上,Power的全新服务器备受推崇?

简介:

不久前在北京举办的GTC China大会,是NVIDIA一年一度的GPU技术盛会。此次GTC再度回到北京,其火爆程度令人咋舌。而大会上发布的诸多新品,不仅令技术迷们高呼过瘾,而且再一次证明人工智能,深度学习,机器学习等正在加速改变未来的进程。其中最火的产品之一,就是IBMNVIDIA合作的Power新服务器。

大会期间,NVIDIA联合创始人、总裁兼首席执行官黄仁勋先生亲自介绍了采用Tesla P100GPUNVLink的新款IBM Power SystemS822LC for High Performance Computing服务器,一度掀起了大会的高潮,而这一新品的问世,更是标志着双方携手进军高性能计算企业级市场的又一个里程碑。

认知计算和人工智能带来的机遇与挑战

数据显示,到2025年,包括认知计算在内的人工智能市场将达到360亿美元的规模,人工智能将成为IT 领域中发展最快的部分,或将引领继蒸汽机,电力,计算机之后的第四次工业革命。而各行各业的发展需要多种技术的共同作用。包括人工智能、自动驾驶汽车、实时欺诈预防、药物开发在内的不同领域都需要更高水平的计算能力。以往采用的计算方式和数据处理能力成为时代转型的巨大瓶颈和终极挑战。

正如在此次GTC大会上黄仁勋先生所深度阐释的那样,GPU计算产品与解决方案平台将拓展人工智能发展的想象空间,加速人工智能改变未来的进程。而深度学习作为全新的计算模型,正在改变计算的方方面面,不仅改变了软件开发的方式、开发地点和运行方法,还在改变着服务器架构、数据中心和智能设备。

以往采用的单纯CPU算法,完成一个相对复杂的深度学习训练模型即可能需要若干天或者几个月的时间,因此GPU加速成为了非常有效的辅助手段,使用GPU之后的深度学习的训练时间,可能会缩短90%,甚至更多。

如何把GPU的加速技术引入数据中心里面甚至云端,也正是IBM作为服务器领导者一直在考虑的问题。

IBM Power SystemS822LC for High Performance Computing 世界首款实现CPUGPUGPU之间互联的服务器

作为认知商业的倡导和推动者,IBM致力于不断通过技术创新助推时代的转型。在服务器系统领域,IBM 一直持续地进行技术研发,并同NVIDIA合作,加快新数据中心工作负载的处理速度。

经过四年的研发,IBM推出了面向高性能计算的IBM Power SystemS822LC for High Performance Computing,该服务器由 NVIDIA Tesla P100GPU  NVLink 提供支持,有助于进行高性能分析并对不断增加的数据实现深度学习。它是专门为人工智能、机器学习和高级分析应用场景而推出的。

IBM PowerSystem S822LC for High Performance Computing使用了两个 IBM POWER8 CPU 和四个NVIDIA Tesla P100GPU,并通过 NVLink 高速接口使其互联互通。这是一款定制的 GPU 加速器服务器,其中 NVLink 接口集成在主板路由上,并且使用 NVIDIA  Tesla P100 SXM2 GPU

此款服务器的最大亮点在于,它是世界上第一款支持NV Link互联,使得CPUGPU,以及GPU之间都可以实现NVLink互联的一款服务器。GPU不再是作为CPU的一个协处理器,而是可以被看成一个统一的异构计算的总体,以实现性能的最大化。

NVLink是在Pascal最新一代GPU中的总线,其独有的高速互连技术,带宽可达80GB/S,相较于PCIe32GB/S的速度,相当于将带宽提高了2.5倍,足以满足多芯片并行计算的需求。IBM POWER8是最早也是目前唯一支持这一标准的CPU

而目前x86服务器是不支持NV Link互联的。当x86服务器搭载多个GPU时,只能使服务器的GPU之间使用NV LinkCPUGPU之间的通信仍然需要使用PCIE的总线。在很多深度学习模型部署的案例中,存储带宽的限制是GPU计算的主要瓶颈。因此,实现NV Link互联的IBM Power SystemS822LC for High Performance Computing ,突破性地解决了这一问题,使得系统的智能大幅度提升。

带宽的优势在程序的应用过程中,更加至关重要。在模型部署中,计算量虽然没有训练过程中那么巨大,但是对带宽的要求非常高,这时NV Link就很有用武之地,因此在Power上做测试之后发现,相较于不支持NV Link互联的服务器会有非常大的性能提升。另外,NVIDIAPascal架构新支持的硬件内存分页机制与NVLink相结合,其巨大的内存带宽特别适合高效的训练复杂的深度学习模型。

”“ 兼施,释放高性能爆发力

IBM致力于将认知商业分享到端,不断满足来自各行业的客户的最新需求。

在软件方面,IBM通过SuperVessel,将Power以及OpenPOWER服务器开放出来,为客户提供服务,这也是首款在公有云上免费开放的GPU服务。SuperVessel是一款基于Openstack的全开源软件架构搭建的免费云平台。所有用户,只需要通过网站就可以申请虚拟机,或者体验各种服务、如GPU等加速器服务,认知计算服务,大数据服务等等。SuperVessel的用户遍布全球各地,其提供的很多应用,是基于Power8+GPU进行加速的。



本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
目录
相关文章
|
10月前
|
人工智能 安全 物联网
MWC2024联发科AI手机芯片亮点多多
近日,联发科在MWC 2024(2024 世界移动通信大会)上展出了一系列令人瞩目的AI和移动通信技术突破,以“连接AI宇宙”(Connecting the AI-verse)的展厅吸引了无数业界精英和媒体的目光。特别是其现场的生成式AI技术展示,更是引发了广泛的关注和热议。
|
10月前
|
机器学习/深度学习 人工智能 芯片
|
机器学习/深度学习 人工智能 算法
WAIC开发者日Workshop预告:华为昇思MindSpore基础模型创新实践
WAIC开发者日Workshop预告:华为昇思MindSpore基础模型创新实践
215 0
|
机器学习/深度学习 人工智能 编译器
英特尔为决战英伟达这次真的拼了!20亿美元收购AI芯片公司Habana Labs
英特尔正式宣布以20亿美元收购AI芯片公司Habana Labs。这是继153亿美元收购Mobileye、3.5亿美元收购Nervana之后,英特尔第三次收购大型AI初创公司。这一举动引发业内人士热议。
351 0
英特尔为决战英伟达这次真的拼了!20亿美元收购AI芯片公司Habana Labs
|
缓存 运维 安全
高端服务器市场重燃战火,国产K1 Power迎来第二春
高端服务器市场重燃战火,国产K1 Power迎来第二春
443 0
高端服务器市场重燃战火,国产K1 Power迎来第二春
|
机器学习/深度学习 NoSQL Linux
LC3大会,开源人的狂欢,反哺的力量驱动技术革新
在世界杯踢得正酣时,IT人也迎来了开源盛会LinuxCon + ContainerCon + CloudOpen中国(简称LC3)大会。从去年开始,LC3大会开始进入中国,正值开源云计算的这把火,在中国技术圈烧得越来越旺,同时也引发了越来越多国际同行的密切关注。
2216 0
|
机器学习/深度学习 人工智能 数据中心
|
机器学习/深度学习 人工智能 自动驾驶
马斯克首度承认自研AI芯片,或与英伟达“分手“
昨天,特斯拉CEO Elon Musk在NIPS上公开承认,特斯拉正在开发专用的AI芯片。而同时,英伟达也在NIPS上发布了迄今为止最强大的“TITAN V” PC GPU。Musk此番之举,是否可视为与英伟达的“分手宣言”?
1764 0