为什么GTC大会上,Power的全新服务器备受推崇?

简介:

不久前在北京举办的GTC China大会,是NVIDIA一年一度的GPU技术盛会。此次GTC再度回到北京,其火爆程度令人咋舌。而大会上发布的诸多新品,不仅令技术迷们高呼过瘾,而且再一次证明人工智能,深度学习,机器学习等正在加速改变未来的进程。其中最火的产品之一,就是IBMNVIDIA合作的Power新服务器。

大会期间,NVIDIA联合创始人、总裁兼首席执行官黄仁勋先生亲自介绍了采用Tesla P100GPUNVLink的新款IBM Power SystemS822LC for High Performance Computing服务器,一度掀起了大会的高潮,而这一新品的问世,更是标志着双方携手进军高性能计算企业级市场的又一个里程碑。

认知计算和人工智能带来的机遇与挑战

数据显示,到2025年,包括认知计算在内的人工智能市场将达到360亿美元的规模,人工智能将成为IT 领域中发展最快的部分,或将引领继蒸汽机,电力,计算机之后的第四次工业革命。而各行各业的发展需要多种技术的共同作用。包括人工智能、自动驾驶汽车、实时欺诈预防、药物开发在内的不同领域都需要更高水平的计算能力。以往采用的计算方式和数据处理能力成为时代转型的巨大瓶颈和终极挑战。

正如在此次GTC大会上黄仁勋先生所深度阐释的那样,GPU计算产品与解决方案平台将拓展人工智能发展的想象空间,加速人工智能改变未来的进程。而深度学习作为全新的计算模型,正在改变计算的方方面面,不仅改变了软件开发的方式、开发地点和运行方法,还在改变着服务器架构、数据中心和智能设备。

以往采用的单纯CPU算法,完成一个相对复杂的深度学习训练模型即可能需要若干天或者几个月的时间,因此GPU加速成为了非常有效的辅助手段,使用GPU之后的深度学习的训练时间,可能会缩短90%,甚至更多。

如何把GPU的加速技术引入数据中心里面甚至云端,也正是IBM作为服务器领导者一直在考虑的问题。

IBM Power SystemS822LC for High Performance Computing 世界首款实现CPUGPUGPU之间互联的服务器

作为认知商业的倡导和推动者,IBM致力于不断通过技术创新助推时代的转型。在服务器系统领域,IBM 一直持续地进行技术研发,并同NVIDIA合作,加快新数据中心工作负载的处理速度。

经过四年的研发,IBM推出了面向高性能计算的IBM Power SystemS822LC for High Performance Computing,该服务器由 NVIDIA Tesla P100GPU  NVLink 提供支持,有助于进行高性能分析并对不断增加的数据实现深度学习。它是专门为人工智能、机器学习和高级分析应用场景而推出的。

IBM PowerSystem S822LC for High Performance Computing使用了两个 IBM POWER8 CPU 和四个NVIDIA Tesla P100GPU,并通过 NVLink 高速接口使其互联互通。这是一款定制的 GPU 加速器服务器,其中 NVLink 接口集成在主板路由上,并且使用 NVIDIA  Tesla P100 SXM2 GPU

此款服务器的最大亮点在于,它是世界上第一款支持NV Link互联,使得CPUGPU,以及GPU之间都可以实现NVLink互联的一款服务器。GPU不再是作为CPU的一个协处理器,而是可以被看成一个统一的异构计算的总体,以实现性能的最大化。

NVLink是在Pascal最新一代GPU中的总线,其独有的高速互连技术,带宽可达80GB/S,相较于PCIe32GB/S的速度,相当于将带宽提高了2.5倍,足以满足多芯片并行计算的需求。IBM POWER8是最早也是目前唯一支持这一标准的CPU

而目前x86服务器是不支持NV Link互联的。当x86服务器搭载多个GPU时,只能使服务器的GPU之间使用NV LinkCPUGPU之间的通信仍然需要使用PCIE的总线。在很多深度学习模型部署的案例中,存储带宽的限制是GPU计算的主要瓶颈。因此,实现NV Link互联的IBM Power SystemS822LC for High Performance Computing ,突破性地解决了这一问题,使得系统的智能大幅度提升。

带宽的优势在程序的应用过程中,更加至关重要。在模型部署中,计算量虽然没有训练过程中那么巨大,但是对带宽的要求非常高,这时NV Link就很有用武之地,因此在Power上做测试之后发现,相较于不支持NV Link互联的服务器会有非常大的性能提升。另外,NVIDIAPascal架构新支持的硬件内存分页机制与NVLink相结合,其巨大的内存带宽特别适合高效的训练复杂的深度学习模型。

”“ 兼施,释放高性能爆发力

IBM致力于将认知商业分享到端,不断满足来自各行业的客户的最新需求。

在软件方面,IBM通过SuperVessel,将Power以及OpenPOWER服务器开放出来,为客户提供服务,这也是首款在公有云上免费开放的GPU服务。SuperVessel是一款基于Openstack的全开源软件架构搭建的免费云平台。所有用户,只需要通过网站就可以申请虚拟机,或者体验各种服务、如GPU等加速器服务,认知计算服务,大数据服务等等。SuperVessel的用户遍布全球各地,其提供的很多应用,是基于Power8+GPU进行加速的。



本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
目录
相关文章
|
Java Shell 程序员
Power Shell 脚本——基于curl自动批量获取FTP服务器上的日志文件
Power Shell 脚本——基于curl自动批量获取FTP服务器上的日志文件
288 0
Power Shell 脚本——基于curl自动批量获取FTP服务器上的日志文件
|
缓存 运维 安全
高端服务器市场重燃战火,国产K1 Power迎来第二春
高端服务器市场重燃战火,国产K1 Power迎来第二春
402 0
高端服务器市场重燃战火,国产K1 Power迎来第二春
|
7天前
|
存储 弹性计算 安全
阿里云第七代云服务器ECS性能、适用场景与价格参考
阿里云第七代云服务器ECS(Elastic Compute Service)作为阿里云最新一代的高性能计算产品,凭借其基于最新硬件架构和虚拟化技术的全面升级,在计算能力、存储性能、网络传输速度以及灵活性等多个方面实现了显著提升。这一代云服务器旨在为用户提供更为强大、稳定且可定制的云端基础设施服务,广泛适用于从基础的Web托管到复杂的高性能计算等多种应用场景。
|
5天前
|
弹性计算 网络安全
阿里云国际OpenAPI多接口快速管理ECS服务器教程
阿里云国际OpenAPI多接口快速管理ECS服务器教程
|
4天前
|
弹性计算 开发框架 .NET
阿里云服务器购买教程及云服务器地域、实例、操作系统、带宽等参数选择指南
对于初次购买阿里云服务器的用户来说,想使用阿里云服务器搭建网站或者运行APP、小程序等项目,第一步就是要先购买阿里云服务器,下面小编以图文形式给大家介绍一下阿里云服务器的购买流程,以及购买过程中如何云服务器地域、实例、带宽等关键配置和选择这些参数的一些注意事项,以供参考。
|
6天前
|
域名解析 网络协议 数据安全/隐私保护
阿里云轻量应用服务器搭建WordPress个人博客教程
阿里云轻量应用服务器搭建WordPress个人博客教程
|
11天前
|
存储 机器学习/深度学习 应用服务中间件
阿里云倚天云服务器实例:计算型c8y、通用型g8y、内存型r8y实例介绍
阿里云倚天云服务器是基于阿里云自研的倚天710 ARM架构CPU打造的高性能计算产品系列,它依托先进的第四代神龙架构,旨在为用户提供稳定可预期的超高效能体验。倚天云服务器在存储、网络性能及计算稳定性方面实现了显著提升,主要得益于其芯片级的快速路径加速技术。本文将深度解析阿里云倚天云服务器的计算型c8y、通用型g8y、内存型r8y实例,探讨其优势及适用场景,以供选择参考。
|
11天前
|
网络协议 应用服务中间件 网络安全
阿里云轻量应用服务器的使用限制
阿里云轻量应用服务器的使用限制