浪潮发布业界最高GPU密度的SR-AI整机柜

简介:
+关注继续查看

 在不久前结束的2017浪潮云数据中心全国合作伙伴大会(IPF)上,浪潮秉承坚持围绕"计算+"战略,进一步明确业务重心,聚焦智慧计算,发展开放融合的计算生态,建立智慧计算市场的领导力。

智慧计算的未来在商业应用, 随着人工智能应用的快速发展,AI所需的计算力也急剧攀升。此前,浪潮就已在AI计算平台、架构领域布局,拥有业界完整的支持2、4、8 GPU卡的异构超算服务器阵列。而本次IPF上,浪潮发布了业界最高密度的、单机点支持16块GPU卡的SR-AI整机柜,进一步优化了AI计算硬件架构,改变原有CPU-GPU紧耦合状态,实现GPU资源的灵活池化扩容。

浪潮发布业界最高GPU密度的SR-AI整机柜

人工智能成为未来社会发展重要动因

更复杂的AI应用呼唤更强大的计算平台

深度学习概念和浅层学习算法已经被提出多年,而人工智能近年才开始逐渐升温,原因是人工智能技术的进步受限于计算平台的性能和数据量的积累。举个例子,从IBM深蓝战胜卡斯帕罗夫,浪潮天梭战胜五位象棋大师,再到谷歌AlphaGo战胜围棋冠军李世石,解决问题的博弈树空间扩大了237数量级,这其中需要更优化的算法,也需要更强大的计算平台来支撑实时运算。

除了AI游戏,在现实生活中人工智能的应用也越来越广泛和复杂,从人脸签到打卡,到行动轨迹追踪,再到无人驾驶汽车,更复杂的AI应用呼唤更强大的计算平台。传统的单机单卡、2卡甚至8卡已经不能满足多样化的业务需求,浪潮SR-AI整机柜服务器以单节点16卡的更高密度,满足当下快速膨胀的AI计算能力需求。

浪潮发布业界最高GPU密度的SR-AI整机柜

SR-AI整机柜服务器

更高密度+资源解耦,10倍于传统AI计算设备性能

此次,浪潮与百度联合发布的SR-AI整机柜服务器,符合最新的天蝎2.5标准,是全球首个采用PCIe Fabric互联架构设计的AI方案,通过PCI-E交换机和GPU BOX两个模块的配合,打破GPU和CPU的物理耦合,让两者可以灵活扩展,相对于传统的GPU服务器,这是种颠覆式的创新,带来了高密度、低延迟、易扩展等优势。

首先,传统的AI计算设备集群需要通过高速网络实现数据的交互,着会带来us级以上的延迟,而SR-AI整机柜中GPU BOX间的互联是通过PCI-E交换机来实现,并借助GPUDirect RDMA技术可以大幅下降跨节点GPU间的通信延迟,能够实现ns级网络延时。

第二,SR-AI整机柜的I/O BOX单节点即可实现支持16个GPU的超大扩展,并且可以通过PCI-E交换机实现4个BOX、64块GPU的级联,峰值处理能力达到为512TFlops。

第三,SR-AI整机柜的GPU资源扩展无需同步配置高成本的IT资源(比如IB交换机),成本可优化5%以上,并随着规模上升成本优势越明显。

SR-AI整机柜是面向更大规模数据集和深层神经网络的超大规模AI计算平台,能够高效支撑复杂的深度学习线下模型训练任务,适用于图像识别、语音识别、自然语言处理、搜索排序等AI应用。百度实际业务的测试数据显示,SR-AI整机柜相比传统的AI方案性能提高5-10倍!

高效开发框架+算法协同优化,AI计算效率最大化

与 CPU 少量的逻辑运算单元相比,GPUFPGAMIC这种协处理加速设备整个就是一个庞大的计算矩阵,可实现 10-100 倍应用吞吐量。但同时,这种庞大的并行能力需要付出代价:需要较强的软件开发能力和算法优化能力。

为此,浪潮将高效深度学习框架Caffe-MPI开源,与众多开发者共同优化,为深度学习的用户提供了更便捷、更高效的应用手段。浪潮Caffe-MPI能够在保证正确率相同的情况下,在4节点下16卡的性能较单卡提升13倍,并增加了对cuDNN库的支持,使程序开发人员能够轻松实现高性能深度学习代码的开发。

在算法方面,此前浪潮与客户在GPU加速加速流量特征分析技术开展合作,通过软硬件和算法的协同优化,使训练24万样本的时间单节点4GPU相对于单GPU加速3倍,单机4GPU卡程序性能较原始版本加速270倍。

数据显示,2016年浪潮在人工智能计算领域的市场份额超过60%,为百度、阿里巴巴、腾讯、奇虎、科大讯飞、Face++等中国人工智能企业,提供基于GPU、FPGA、KNL等协处理加速服务器和caffe-MPI等软件、算法优化。


原文发布时间为: 2017年5月11日

本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。

相关实践学习
通过GPU云服务器生成AI视频
本教程介绍如何使用GPU云服务器搭建Stable Diffusion模型,并基于ModelScope框架,实现使用文本生成视频。
相关文章
|
12天前
|
弹性计算 虚拟化 异构计算
阿里云GPU服务器详细介绍(Nvidia M40/P100/P4/V100)
阿里云GPU服务器详细介绍(Nvidia M40/P100/P4/V100),阿里云GPU服务器租用价格表包括包年包月价格、一个小时收费以及学生GPU服务器租用费用,阿里云GPU计算卡包括NVIDIA V100计算卡、T4计算卡、A10计算卡和A100计算卡
|
12天前
|
机器学习/深度学习 弹性计算 数据可视化
阿里云GPU服务器详细介绍_ NVIDIA A100_A10_V100_T4 GPU卡
阿里云GPU 云服务器(GPU Cloud Computing,GPU)是提供 GPU 算力的弹性计算服务,具有超强的计算能力,服务于深度学习、科学计算、图形可视化、视频处理多种应用场景。阿里云作为亚太第一的云服务提供商,随时为您提供触手可得的算力,有效缓解计算压力,提升您的业务效率,助您提高企业竞争力
|
12天前
|
弹性计算 虚拟化 异构计算
阿里云GPU服务器A100、A10、V100、T4 GPU卡详解
阿里云GPU服务器A100、A10、V100、T4 GPU卡详解,阿里云GPU服务器租用价格表包括包年包月价格、一个小时收费以及学生GPU服务器租用费用,阿里云GPU计算卡包括NVIDIA V100计算卡、T4计算卡、A10计算卡和A100计算卡,GPU云服务器gn6i可享受3折优惠
286 0
|
12天前
|
弹性计算 云计算 虚拟化
阿里云GPU服务器介绍_GPU服务器_GPU云计算_异构计算_弹性计算
阿里云GPU服务器租用价格表包括包年包月价格、一个小时收费以及学生GPU服务器租用费用,阿里云GPU计算卡包括NVIDIA V100计算卡、T4计算卡、A10计算卡和A100计算卡,GPU云服务器gn6i可享受3折优惠
|
13天前
|
机器学习/深度学习 数据可视化 虚拟化
阿里云GPU云服务器实例规格及活动价格整理
阿里云GPU云服务器是一种适用于深度学习、科学计算、图形可视化、视频处理多种应用场景的具有超强的GPU算力的云服务器产品,2023年阿里云官方对GPU云服务器提供了首购4折起等众多优惠政策,小编来说说详细的优惠政策及最新活动报价表。
阿里云GPU云服务器实例规格及活动价格整理
|
25天前
|
人工智能 运维 Serverless
阿里云函数计算 GPU 宣布降价,最高幅度达 93%,阶梯计费越用越便宜!
自2023年9月1日0时起,阿里云函数计算的 GPU 使用量和函数调用次数宣布降价。本次降价幅度达到10%~93%,并且通过阶梯计费模式帮助客户在使用函数计算时,越用越便宜。
|
25天前
|
人工智能 物联网 开发者
优质评测分享——快来参加阿里云的GPU云服务器评测活动
阿里云推出了面向个人开发者的GPU云服务器评测活动,通过开通GPU产品及简单的操作部署,即可完成八大场景的AIGC体验与评测。小书生从这些评测报告中筛选出了部分优质内容,快来一起看看大家的评测体验吧~
优质评测分享——快来参加阿里云的GPU云服务器评测活动
|
26天前
|
弹性计算 异构计算
阿里云gpu服务器能否租用一周?租用一周需要多少钱?
阿里云gpu服务器能否租用一周?当然是可以的,至于价格,需要看所选gpu云服务器的具体实例规格和配置,短期租用可以选择租用一周或者月付,月付最长可以选择9个月,如果想长期使用,可以选择年付,年付最长可以选择1年。下面小编就为大家分享一下阿里云gpu云服务器租用一周和月付及年付的价格。
130 0
阿里云gpu服务器能否租用一周?租用一周需要多少钱?
|
29天前
|
机器学习/深度学习 存储 人工智能
初次使用阿里云GPU云服务器的体验分享
随着人工智能和深度学习的迅速发展,对于计算资源的需求也越来越高,为了满足这一需求,阿里云推出了GPU云服务器,为用户提供强大的计算能力和高效的并行处理。本文将分享我初次使用阿里云GPU云服务器的体验,包括购买过程、配置设置、性能评估以及应用案例。
91 1
初次使用阿里云GPU云服务器的体验分享
热门文章
最新文章
相关产品
机器翻译
推荐文章
更多