创新不忘初心应用更创价值 中科曙光全球首发M-Pro架构服务器

简介:

6月19日至23日,每年一度的高性能计算领域的国际盛会——第31届国际超级计算大会(ISC2016)在德国法兰克福举行。当地时间6月21日上午,国内领先的高性能计算厂商曙光公司全球首次发布了基于Multi-Host技术的“M-Pro”架构服务器——Multi-Hosted Multi-Processor,成为ISC2016新产品板块的耀眼新星。

巧妙的M-Pro架构设计

众所周知,在摩尔定律的指引下,CPU的多核化、SIMD向量化不断提升着计算机的理论计算性能。然而,简单地增加核心数、增加向量位宽也导致着高性能计算应用的并行效率越来越低、向量指令利用率等优化越来越困难,这成为了制约应用性能提升的最大瓶颈。

 创新不忘初心应用更创价值  中科曙光全球首发M-Pro架构服务器

曙光此次提出的全新M-Pro架构就是要“反其道而行”,即采用单核性能更加高的Xeon E3-1200 v5系列处理器和Muti-host共享网络技术,配合曙光已有的高密度刀片技术,来设计实际应用性能更高,性价比更好,兼容性更强的服务器。

M-Pro架构的优势

1, E3 v5•强劲的单核性能

“提高CPU的单核计算性能是提升服务器应用性能最直接的手段,这一手段远比增加CPU核数更为有效。”曙光高性能计算产品事业部总工程师,戴荣博士解释说,“大部分高性能计算应用更喜欢主频高、单核性能好的服务器。一般而言,单核性能好,对实际应用就更有利,尤其是对计算、访问存储、通信密集要求高,而并行扩展性一般的应用而言更是如此。”

据了解,M-Pro节点采用Intel最新Skylake架构的Xeon E3-1200 v5系列处理器,该处理器3.0-3.7GHz的主频和更高的单核计算峰值(1.x倍)、更高的单核内存性能(1.x倍)、更高的单核网络带宽(2.x 倍)可提供比普通双路计算节点更为强劲的单核性能,能够更轻松地应对计算密集、访存密集、通信密集型应用。

2, Multi-Host•更先进的高速网络技术

针对普通双路节点上相邻两颗CPU上的进程跨节点通信性能不足且不均匀的问题,曙光选择利用先进的 Multi-Host高速网络技术作为解决方案。基于100Gb/s EDR InfiniBand的Multi-Host技术可以让多个节点共享一个网络设备,该技术已经被Facebook主导OCP组织认定为服务器网络标准。

“1片 CX20-G30 刀片包含2个E3 v5单路节点,2片CX20-G30(4颗CPU)共享一个100Gb/s EDR InfiniBand接口。这样一来,可实现0.6μs超低延迟、单核网络带宽达到6.25Gb/s,是普通双路节点的两倍多。”戴博士解释说,“Multi-Host高速网络技术可使所有CPU上的进程跨节点通信性能均衡,并且节点共享还可降低网络成本。尤其是低至0.6μs的网络延迟正是实际的应用程序所迫切需要的。”

“数据中心相关技术正在进入一个崭新的阶段,其中的网络互连部分正起着越来越重要的作用。Mellanox的Multi-host产品能够帮助曙光 等合作伙伴完成独一无二的可调节且性能优异的服务器解决方案。我们很高兴看到,我们的Multi-host 100G EDR InfiniBand产品能够被曙光M-Pro刀片系列服务器采用。我们坚信这个创新的解决方案将迅速获得市场关注。”迈络思(Mellanox)公司市场副总裁Gilad Shainer先生评价道。

3,一脉相承,上下兼容

近些年服务器市场格局变幻莫测,用户需求也不断提升。刀片服务器比机架服务器占用更少的空间,性能更高。刀片服务器的电路板上设置了关键服务器组件,每个服务器板消除了专用电缆和其他元素,能够为用户节约成本。

曙光的刀片服务器研发可以追溯到2004年,至今已经研制出6代刀片。此次推出的基于M-Pro架构的高密度刀片,不仅能够实现与曙光相关刀片的兼容,还可以实现与普通其他刀片的混插。极大的满足了不同客户多样性的需求。

曙光M-Pro架构发展路线

 创新不忘初心应用更创价值  中科曙光全球首发M-Pro架构服务器

由于M-Pro服务器具有相同理论峰值下实测应用性能更高、相同投资情况下实测应用性能更好的显著优 势,它已经得到了高性能计算应用和互联网应用用户的着重关注。为了尽快服务客户,针对于高性能计算应用的M-Pro HPC服务器预计将于2016年7月量产。而针对于互联网应用的M-Pro Web服务器预计将于2016年10月量产。据悉,M-Pro Web服务器与M-Pro HPC服务器的主要差别会在网络方面。

M-Pro HPC:看得见的实测应用性能提升和更优的性价比

 创新不忘初心应用更创价值  中科曙光全球首发M-Pro架构服务器

据测试,M-Pro架构服务器相比普通双路计算节点实测应用性能显著提高。如VASP, OpenMX, Espresso, CPMD, Lammps, WRF的测试数据都展现了近150%的性能提升。从成本角度来说,则相当于为客户节约了~30%的服务器购置投入。

曙光M-Pro架构服务器是一款从客户实际应用出发,采用最先进的处理器和网络技术,进行优化设计出的一款具有相当性价比竞争力的产品。这曙光一直以来秉承的“从客户应用中来,回到用户应用中去”的理念的又一次成功尝试。我们热诚的邀请用户一起来为下一代刀片技术献计献策,一起寻找和实现更加高效的计算解决方案。


原文发布时间为:2016-06-22

本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。



相关文章
|
3月前
|
机器学习/深度学习 数据库 数据安全/隐私保护
服务器核心组件:CPU 与 GPU 的核心区别、应用场景、协同工作
CPU与GPU在服务器中各司其职:CPU擅长处理复杂逻辑,如订单判断、网页请求;GPU专注批量并行计算,如图像处理、深度学习。二者协同工作,能大幅提升服务器效率,满足多样化计算需求。
1375 39
|
2月前
|
存储 机器学习/深度学习 人工智能
硅谷GPU单节点服务器:技术解析与应用全景
“硅谷GPU单节点服务器”代表了在单个物理机箱内集成强大计算能力,特别是GPU加速能力的高性能计算解决方案。它们并非指代某个特定品牌,而是一类为处理密集型工作负载而设计的服务器范式的统称。
|
2月前
|
机器学习/深度学习 人工智能 弹性计算
2025年阿里云GPU服务器租用价格与应用场景详解
阿里云GPU服务器基于ECS架构,集成NVIDIA A10/V100等顶级GPU与自研神龙架构,提供高达1000 TFLOPS混合精度算力。2025年推出万卡级异构算力平台及Aegaeon池化技术,支持AI训练、推理、科学计算与图形渲染,实现性能与成本最优平衡。
|
2月前
|
人工智能 JavaScript 前端开发
GenSX (不一样的AI应用框架)架构学习指南
GenSX 是一个基于 TypeScript 的函数式 AI 工作流框架,以“函数组合替代图编排”为核心理念。它通过纯函数组件、自动追踪与断点恢复等特性,让开发者用自然代码构建可追溯、易测试的 LLM 应用。支持多模型集成与插件化扩展,兼具灵活性与工程化优势。
205 6
|
3月前
|
人工智能 Cloud Native 中间件
划重点|云栖大会「AI 原生应用架构论坛」看点梳理
本场论坛将系统性阐述 AI 原生应用架构的新范式、演进趋势与技术突破,并分享来自真实生产环境下的一线实践经验与思考。

热门文章

最新文章