新款IBM POWER8服务器通过NVLINK与Tesla P100互联

简介:

在日前举行的GTC CHINA 2016大会上, NVIDIA与IBM共同宣布最新合作项目,全新 POWER8 家族将通过NVLINK与NVIDIA Tesla P100实现强势组合。NVIDIA的科技在IBM的服务器中,能加速人工智能、深度学习和数据分析这类高度融合的工作,为企业更快获得人工智能。

数据中心的工作负载在不断发生变化,加速数据中心的需求也在不断增强。不久之前,这些系统主要用于处理存储和提供网页,而现在它们越来越多地需要负责人工智能领域的工作,比如理解语音、文字、图片和视频或者分析大数据以提供见解。数十亿的消费者希望即刻获得许多问题的答案,而企业公司需要分析激增的数据来更好地满足客户需求。这些问题都将由数据中心提供解决方案。

作为服务器系统领域的领导者,IBM 在几年前便注意到了这种趋势,并与NVIDIA合作,加快新数据中心工作负载的处理速度。经过四年的研发,备受关注的POWER8服务器联合了NVIDIA的Tesla P100 GPU 和 NVLink互联技术,实现了更高的数据性能分析和深度学习能力提升。

该系统使用了两个 IBM POWER8 CPU 和四个 NVIDIA Tesla P100 GPU,并通过 NVLink 高速接口使其互联互通。这是一款定制的 GPU 加速器服务器,其中 NVLink 接口集成在主板路由上,并且使用 NVIDIA的Tesla P100 GPU。

技术联合,合力树立行业标杆

IBM Power System S822LC 采用了两个 IBM POWER8 CPU 和四个 NVIDIA Tesla P100 GPU,并通过 NVLink 实现互联。

IBM 和 NVIDIA 技术如此紧密的结合使得数据流动速度比使用 PCIe 快了 5 倍,从而加快了目前诸如高级分析、深度学习和人工智能等极其重要的应用提供见解的速度。

IBM Power Systems 的总经理 Doug Balog 表示:“企业能通过高级分析、机器学习和人工智能提供的用户见解和商业价值越来越多地受到性能的制约。加速计算能够显著加快大数据工作负载的处理速度,并将成为这个认知时代的基础。凭借我们与 NVIDIA 等合作伙伴联手推动的 OpenPOWER 创新,搭载 POWERAccel 技术的全新 OpenPOWER Linux 服务器将为这些工作负载树立新标杆。”

通往 Summit  Sierra 之路

IBM 已经收到了多个客户的订单,其中包括一家大型跨国公司以及美国能源部橡树岭国家实验室 (ORNL) 和劳伦斯利福摩尔国家实验室 (LLNL) 等研究机构。

ORNL 和 LLNL 两个实验室将把新系统用作开发平台来优化应用,以充分利用 NVIDIA NVLink 技术。这些系统将用作为新一代超级计算机 Summit 和 Sierra 开发应用的试验台,IBM 公司预计将于 2017 年把 Summit 和 Sierra 分别交付给 ORNL 和 LLNL。

橡树岭国家实验室领导计算设施项目总监 Arthur S. (Buddy) Bland 提到:“在 Power 平台上采用 NVLink 技术能够确保 CPU 和 GPU 中多个内存层次结构的一致性。作为 GPU 的长期用户,我们认为它将提升我们的应用性能,使用户能够更容易地获得重大的科学发现。



原文发布时间为:2016年9月20日

本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
5月前
|
存储 运维 数据挖掘
服务器数据恢复—IBM V7000数据恢复案例
服务器存储数据恢复环境: 某品牌P740小型机+AIX+Sybase+V7000磁盘阵列柜,磁盘阵列柜中有12块SAS机械硬盘(其中包括一块热备盘)。 服务器存储故障: 磁盘阵列柜中有一块磁盘出现故障,运维人员用新硬盘替换掉故障盘并开始同步数据。当数据同步的进度不到一半的时候,磁盘阵列柜中另一个磁盘也出现了问题,导致逻辑盘无法挂接在小型机上,业务中断。通过存储的管理界面查看,发现两块硬盘显示故障脱机,其中10号槽位故障硬盘为热备盘。 磁盘阵列柜中一共创建了2组Mdisk,加到一个pool中,现在的故障表现是主要的数据pool无法加载,部分通用卷均无法挂载。
服务器数据恢复—IBM V7000数据恢复案例
|
6月前
|
机器学习/深度学习 人工智能 弹性计算
阿里云GPU服务器租用费用_GPU服务器详解_A10、V100、T4、P4、P100
阿里云GPU云服务器提供NVIDIA A10、V100、T4、P4、P100等多种GPU卡,适合深度学习、科学计算等场景。实例性能强劲,单实例可达5PFLOPS混合精度计算,VPC网络支持2400万PPS和160Gbps内网带宽。GPU实例包括A10卡GN7i(3213.99元/月起)、V100-16G卡GN6v(3830.00元/月起)等,价格因配置而异。阿里云还提供GPU加速软件如AIACC-Training和AIACC-Inference,以及弹性计算实例EAIS。客户案例包括深势科技、流利说和小牛翻译等。
|
6月前
|
机器学习/深度学习 人工智能 弹性计算
阿里云GPU服务器全解析_GPU服务器租用费用_NVIDIA A10、V100、T4、P4、P100 GPU卡
阿里云GPU云服务器提供NVIDIA A10、V100、T4、P4、P100等多种GPU卡,结合高性能CPU,单实例计算性能高达5PFLOPS。支持2400万PPS及160Gbps内网带宽。实例规格多样,如A10卡GN7i(3213.99元/月)、V100-16G卡GN6v(3830.00元/月)等。适用于深度学习、科学计算、图形处理等场景。GPU软件如AIACC-Training、AIACC-Inference助力性能优化。购买方式灵活,客户案例包括深势科技、流利说、小牛翻译。
837 0
|
存储 Linux 数据库
服务器数据恢复—IBM存储raid5多盘损坏导致阵列崩溃的数据恢复案例
服务器数据恢复环境: IBM某型号存储,6块sas硬盘组建一组raid5,划分一个lun分配给Linux服务器并格式化为OCFS2文件系统,共享给虚拟化使用,存放的数据包括24台liunx和windows虚拟机、压缩包文件和配置文件。 服务器故障: raid5阵列中成员盘坏了多块,阵列失效,数据丢失。
服务器数据恢复—IBM存储raid5多盘损坏导致阵列崩溃的数据恢复案例
|
存储 数据挖掘
服务器数据恢复-IBM Storwize V7000存储数据恢复案例
服务器数据恢复环境: P740+AIX+Sybase+V7000存储,存储阵列柜上共12块SAS机械硬盘(其中一块为热备盘)。 服务器故障: 存储阵列柜中有磁盘出现故障,工作人员发现后更换磁盘,新更换的磁盘数据同步到40%左右时,阵列柜中的另一块磁盘也出现问题,数据同步中断,逻辑盘无法挂接到小型机上,业务中断。存储的管理界面显示2块硬盘故障脱机。 阵列柜中的磁盘共组建了2组Mdisk,加到一个pool中。现在主要数据pool无法加载,有3个通用卷无法挂载。
联想以23亿美元收购IBM的X86服务器业务
23日下午,联想集团于港交所发布公告,宣布23亿美元收购IBM的X86服务器硬件及相关维护服务业务。
316 0
联想以23亿美元收购IBM的X86服务器业务
「镁客早报」美国欲限制AI、处理器技术出口;台积电与IBM签署协议,将为其生产大型服务器芯片
我国完成北斗三号基本系统收官双星发射;马斯克发推特称,特斯拉或有意与奔驰合作开发电动版Sprinter。
601 0
|
SQL Oracle 关系型数据库
一例IBM服务器Raid磁盘阵列故障
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/zergskj/article/details/6303433 通常我们在服务器上做了硬件层面的Raid之后,用户拔掉任意一块硬盘,系统仍然能够正常工作。
1011 0
|
2天前
|
人工智能 JSON Linux
利用阿里云GPU加速服务器实现pdf转换为markdown格式
随着AI模型的发展,GPU需求日益增长,尤其是个人学习和研究。直接购置硬件成本高且更新快,建议选择阿里云等提供的GPU加速型服务器。
利用阿里云GPU加速服务器实现pdf转换为markdown格式