2U 4节点Xeon SP服务器 (上):PowerEdge C6420更受重视

简介: 如今策略变化的原因是什么呢?不知您的答案是否和我一样——超融合。

接前文:《Dell PowerEdge R940解析:四路顶配服务器维护平民化

              Dell PowerEdge R740xd解析:服务器只看参数那就错了

              Xeon SP服务器的M.2 SSD RAID:揭秘PowerEdge 14G BOSS

              Dell PowerEdge R640NVMe直连、NDC网卡、PERC10一览

 

尽管以前DellOEM大厂也提供2U 4节点服务器机型,但该领域受关注更多的似乎是SuperMicro、广达这样的ODM厂商。

 

在互联网公司这一轮兴起之前,计算密度高的2U 4节点最初用于HPC应用多一些,该部分市场有些不温不火——增长更多在于GPU/协处理器。如今策略变化的原因是什么呢?不知您的答案是否和我一样——超融合

 

最近写的新一代Xeon Scalable服务器主要是围绕Dell的机型,有读者朋友给我留言,能否分析下不同厂商的产品?

 

一旦涉及到横向对比,我都会比较谨慎。首先要对各家的产品有一定的了解,更重要的是客观中立,如果做不到则不如不写。既然这么说,我也做好准备谈一些Dell服务器设计上的限制,并尝试分析其背后的原因。

 

大功率电源模块:110V电压下输出下降一半?

 

0?wx_fmt=jpeg


2U 4节点的PowerEdge C6420,是本次Dell 14G服务器发布型号当中,我要写的最后一款。上面这台24盘位样机一共安装了8SSD,每节点连接2个。

 

0?wx_fmt=jpeg

Intel OEMDellSATA接口SSD DC S3610 800GB

 

0?wx_fmt=jpeg


C6420的后视图。我们看到1+1冗余电源的位置现在位于中间,上一代的PowerEdge C6320电源模块在机箱最左边。

 

0?wx_fmt=jpeg


抽出其中一个节点,除了固化的管理网口、USB 3.0DP显示输出等之外,右上方安装了一块PCIe网卡。除此之外还能扩展几个PCIe设备呢?请大家往后面看。

 

0?wx_fmt=jpeg


之前介绍另外几款Dell 14G服务器时没太注意电源部分。这款2000W 80plus Platinum(白金)电源模块的转换效率可达94%。需要注意的是,其最大交流输入电流为11.5A,也就是说只有在200-240V输入时才能达到最大2000W的输出功率,而在100-120V输入时只能达到1000W输出。

 

我们知道,Xeon SP的最高功耗可达205W,一个节点光是2CPU就有可能达到400W。所以PowerEdge C6420支持的电源模块有1600W2000W2400W三种。根据我的理解,在110V供电时也可以将负载分摊到2个模块上,支撑总体功率的同时牺牲一部分冗余能力。至于最佳实践,请以官方说明为准。

 

同时我也核对了C6420的另外两种电源模块规格,100-120V交流输入下,1600W电源的输出为800W2400W的输出为1400W。我想其他服务器厂商应该也会有类似的情况,这一点对于国内用户基本没啥影响

 

我又翻阅了上周拍的照片,R940用的1100W电源在100-120V交流输入下可输出1050W,而R640使用的750W输出功率则不受输入电压影响,供参考。

 

0?wx_fmt=jpeg


上图是C6400机箱内部的线缆连接示意,其中MB 1-4对应的是4个节点的主板,Linking Board负责连接驱动器,而MidplaneCMPIB板则是用于供电转接、机箱管理(风扇控制)等。

 

Xeon 61xxF81xxFOmni-Path 100Gb/s互连

 

0?wx_fmt=jpeg


这张照片就是其中一个节点,光线不够好请大家谅解:)除了位于下风方向的CPU散热器尺寸较大之外,左下方节点尾部可以看到有PCIe转接板的托架。

 

0?wx_fmt=jpeg


为什么两颗一样的CPU配不同散热器呢?我想不少朋友都知道,右边处理器更靠近系统风扇,散热气流会先经过它,带走热量并升温后再经过左边的CPU。或者说位于风道后面的CPU进风温度更高,而风压则较小一些,所以散热压力相对较大,就要靠散热器补回来。

 

0?wx_fmt=jpeg


LGA-3647这一代CPUSocket成本看来较高,而易用性也相当到位。首先CPU不用锁扣而直接靠散热器压在插座上,其次有防呆设计不用担心散热器方向装反。

 

0?wx_fmt=jpeg


介绍PowerEdge R940的文章中我曾提到拆散热器时CPU会被被硅脂粘下来,下面有一张分离操作的示意图。

 

0?wx_fmt=jpeg


 

大家可能也看到了,该示意图中用的CPU有点特别,也就是本次推出的Xeon Scalable家族中带有“F”结尾的型号。

 

0?wx_fmt=jpeg


上图截自《Intel Xeon Processor ScalableFamily - Specfication Update》,当在PowerEdge C6420中配置这些CPU时,就多出了100Gb/sOmni-Path Fabric(也称为OPA互连接口,目前主要用于HPC高性能计算,与InfiniBandEDR竞争。

 

0?wx_fmt=jpeg


关于OPA网络,我在一年前的《Xeon Phi x200要自我互连,CPU靠边站》中就介绍过。当时赶上Intel发布了代号为KnightsLandingXeon Phi Processor 7200,不依赖传统x86 CPU就可以独立工作,其中就有集成Omni-Path Fabric互连的版本(上图右边)。

 

与此同时,Dell还推出了一款专门支持Xeon Phi 72002U 4节点服务器PowedEdge C6320p,和上图中的节点长得比较像。有了这个专门针对HPC的机型,可以说在LGA-3647OPA方面提前积累了一些经验吧。

 

0?wx_fmt=jpeg


在上周712日的发布会现场,Intel EPSD展台上摆出了这样一块OPA接口子卡,相当于是2100Gb/sQSFP28接口物理层。

 

目前Xeon 61xxF81xxF的用途明显还是高性能计算,对于C6420以外的PowerEdge 14G机型,可以通过独立的OPA PCIe扩展卡来获得类似功能。据了解100Gb/s Omni-Path卡的价格可能比56Gb/s IB还要便宜,另外交换机端口数上还有优势。虽说MellanoxIB王国短时间内不会动摇,但他们或许需要更重视以太网市场了,比如未来空间巨大的25GbE

 

0?wx_fmt=jpeg


Dell的网卡支持列表来看,虽说技术上可以通过40G芯片降速到25GbE,但Intel新一代25G网卡的动作还是慢了点。为什么这样说呢?因为RDMA的重要性,未来大致是两种标准的PK——RoCEiWARP,后者主要靠ChelsioIntel,而当前使用Intel XL710芯片的25GbE网卡XXV710还不支持iWARP

 

0?wx_fmt=jpeg


最后再来看一下C6420PCIe扩展。这个插槽的作用大家可以猜一下,会不会转接支持M.2 SSD呢?

 

0?wx_fmt=jpeg


这张照片里下方的黑色插槽在样机上用于转接网卡,而上方的黑色插槽和一对白色连接器又是怎么使用的呢?此外PowerEdge C6420最多支持多少个NVMe SSD...


在下篇里我再给大家介绍吧,另外我还想深入讨论下2U 4节点服务器结构设计的两个分支方向,敬请继续关注!

目录
相关文章
|
8月前
|
存储 缓存 算法
【ROS】如何让ROS中节点获取数据 III --参数服务器通信及ros常用工具指令介绍
相较于之前的通信模型,参数服务器是最为简单的。在之前的模型中,ROSMASTER都是扮演一个帮二者连接在一起的桥梁。
180 0
|
7天前
|
存储 Java 网络安全
ZooKeeper【搭建 03】apache-zookeeper-3.6.0 伪集群版(一台服务器实现三个节点的ZooKeeper集群)
【4月更文挑战第10天】ZooKeeper【搭建 03】apache-zookeeper-3.6.0 伪集群版(一台服务器实现三个节点的ZooKeeper集群)
12 1
|
8天前
|
安全 数据安全/隐私保护 数据中心
服务器中毒怎么办?企业数据安全需重视
互联网企业包括基础层、服务层和终端层,后者涉及网络服务、内容提供、应用服务等。随着业务发展,企业积累了大量数据,数据安全成为关注焦点,尤其是防范服务器中毒导致的数据泄露。中毒迹象包括文件消失、程序异常、启动项可疑、运行缓慢、杀毒软件失效、系统语言改变、蓝屏或黑屏、主页篡改、广告弹窗、程序图标篡改等。中毒原因可能源自源程序漏洞、FTP漏洞、不安全的上网行为和弱后台口令。处理中毒需断网、备份重要文件、运行杀毒软件、在DOS下杀毒、恢复系统并更改网络密码。预防措施包括打补丁、安装杀毒软件、定期扫描、谨慎点击链接和下载、不随意执行附件程序等。
|
1月前
|
消息中间件 存储 Kafka
Kafka【环境搭建 02】kafka_2.11-2.4.1 基于 zookeeper 搭建高可用伪集群(一台服务器实现三个节点的 Kafka 集群)
【2月更文挑战第19天】Kafka【环境搭建 02】kafka_2.11-2.4.1 基于 zookeeper 搭建高可用伪集群(一台服务器实现三个节点的 Kafka 集群)
140 1
|
4月前
|
存储 Java 网络安全
ZooKeeper【部署 03】apache-zookeeper-3.6.0 伪集群版(一台服务器实现三个节点的ZooKeeper集群)
ZooKeeper【部署 03】apache-zookeeper-3.6.0 伪集群版(一台服务器实现三个节点的ZooKeeper集群)
50 0
|
4月前
多个 服务器 节点同步 时间 chronyc
多个 服务器 节点同步 时间 chronyc
76 0
|
9月前
|
Java
Java 最常见的面试题:集群中有 3 台服务器,其中一个节点宕机,这个时候 zookeeper 还可以使用吗?
Java 最常见的面试题:集群中有 3 台服务器,其中一个节点宕机,这个时候 zookeeper 还可以使用吗?
|
测试技术 对象存储
阿里云服务器测试IP地址不同地域节点Ping值测速延迟
阿里云服务器测速Ping值延迟及不同地域节点测试IP地址
4242 0
|
11月前
zookeeper入门到精通08——服务器节点动态上下线案例实战
zookeeper入门到精通08——服务器节点动态上下线案例实战
|
弹性计算 负载均衡 容灾
阿里云服务器地域和可用区怎么选择?地域节点测试IP地址
阿里云服务器地域是什么?阿里云可用区是什么?阿里云服务器地域和可用区如何选择?
736 0
阿里云服务器地域和可用区怎么选择?地域节点测试IP地址