Dell PowerEdge R740xd解析:服务器只看参数那就错了

本文涉及的产品
云解析 DNS,旗舰版 1个月
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介: - 支持3/6块共900W GPU:PCIe散热设计非易事; - NVDIMM:电池保护、Oracle数据库和SDS应用; - 机箱内部驱动器托架、PERC、NDC等

昨天写了《Dell PowerEdge R940解析:四路顶配服务器维护平民化》,今天继续。

 

对于R7x0这样的2U主力服务器机型,说实话我觉得不是特别好写。一方面不如四路有特点,另外又是互联网等行业消耗最多的,可以说乃服务器厂商必争之地。正如业内同行所言,比较有追求的厂商在某些功能参数上如果落后领先者一代,因为只要你愿意投入下一代产品就可能追上。

 


不过,指标归指标、品质归品质。服务器的R.A.S.(可靠性、可用性、可维护性)才是更重要的实力体现。关于13G PowerEdgeR730的品质,多听听用户端的口碑就好,不需要我在这里主观评论什么。

 

支持3/6块共900W GPUPCIe散热设计非易事

 


今天介绍这台R740xd样机,前面板是2U 123.5英寸盘位的布局。

 


在机箱后端选配了23.5英寸热插拔驱动器位,当然该机型还有更多灵活的选择。

 


还是看机箱上盖内侧的贴纸说明,最上面的配置是除了NDC(网卡模块)之外7个全高PCIe扩展槽;

 

往下是前端配123.5英寸盘(0-11),后背42.5英寸盘位;

 

如果前端换成242.5寸硬盘/SSD,后面再加上4个就是28块。当然机箱中部还可以有(+4),这个我在下文中会介绍;

 

如果都是3.5寸盘,R740xd前后端一共是12+2的配置,同样可以在机箱中部加盘(+4)。

 

这里我想特别提一下GPU支持,因为好几位朋友都问到我R740xd支持3300W双插槽GPU的事情。据我了解,Dell可能不是第一家做到这点的,但要做到解决好散热却不太容易。

 


上图引用自技术文档《Direct from Development –PowerEdge Multi-Vector Cooling》,应该代表了R740系列服务器7PCIe扩展槽可以支持最大的散热气流量LFM单位表示线性英尺每分钟。一般负载下风扇不需要全速运转,可以根据对应位置的传感器温度值来做精细调节。

 


PowerEdge 14G服务器同步更新的iDRAC9管理界面中,PCIe Airflow设置部分可以识别扩展卡是否为第三方、类型(FC HBARAID或者SSD)。对于第三方PCIe扩展卡Dell可能识别不准其功耗,如果自动的200LFM风量不够合适,也可以手动调节。最终都会反应到6个系统风扇的转速上。

 

注:根据690LFM支撑150W GPU来推算,200LFM大约能支持40多瓦功耗的PCIe扩展卡,如果20W以内改到100LFM应该问题不大。我这么算也可能不准:)

 


拆下来的风扇排。从这个角度还可以看到PowerEdge R740xdSAS背板,上面带热管散热片的就是Expander芯片。由于R740xd还可以支持最多242.5英寸U.2 NVMe SSD,所以可选不同的热插拔背板。

 

NVDIMM:电池保护、Oracle数据库和SDS应用

 


PowerEdge R740服务器支持12NVDIMM,虽然这台样机没有配,不过从这张图上可以看出对应电池模块固定的位置。如果想从平面变成三维理解,可以接着往下看。

 


712日的PowerEdge 14G发布会上,Dell列举了2家合作伙伴在应用中测试NVDIMM的价值,其中一家是大名鼎鼎的Oracle服务商云和恩墨。上图中列举的是NVDIMMRedo log性能提高20,对比平台配置信息没有详细讲。

 

NVDIMM就是DRAM内存的性能,受限于Backupto Flash掉电保护设计,目前容量应该在单条8-32GB之间。如果想兼顾性能(低延时)和容量,使用3D XPoint MemoryIntel Optane SSD P4800X 375GB表现也不错,参见《Optane P4800X评测(2)Oracle 170TPM意味着什么?》一文。

 

 

另一家合作伙伴是XSKY,也是Dell发起的“未来就绪企业云联盟”成员,我在《NVMeF的另一种用法:连接AFA控制器和JBOF》中曾经提到过两家公司的共同案例。本次介绍了将PMEM(持久化内存)用于CephJournal存储,延时可降低7

 

此外,这个方案中还用到了PowerEdge 14G服务器的25GbE网卡,iWARPRDMA支持可以减少CPU负担、降低存储网络延时。

 

打开上盖的Dell PowerEdge R740xd

 

机箱内部驱动器托架、PERCNDC

 

 

上面就是R740xd机箱中部的驱动器托架,看着和上一代R730xd差别不大,主要变化应该是支持2.5英寸转换套件。由于这里的视角是从机箱后端看,所以最左边那个盘位应该就是和NVDIMM电池共用的。

 

 

加上这4个盘位,R740xd支持的最大3.5英寸硬盘可达18块,2.5寸驱动器最多32个。

 

上图是拆下的机箱后端那23.5英寸热插拔托架,分量够重可见钢板厚度。

 

也许有朋友会问,机箱后端能否设计更多的盘位?内部托架如果使用2.5寸盘可否支持更多?我认为这里要考虑2个问题,不一定最大就好:

 

1、  硬盘控制器SAS RAID卡、HBA)、扩展器支持的端口数量。比如48SAS Expander,如果支持双RAID卡上行占据16 lane,剩下正好是32盘位;

2、  散热、散热、散热,重要的事情讲三遍。因为机箱内部和后端的硬盘/SSD进风温度没有前面板那么乐观,这个和GPU支持是同样的道理。

 

 

我拆下其中一颗CPU的散热器,下面露出LGA-3647插座。

 

 

Dell PERC SAS/SATA RAID卡模块的样子没有变,14G服务器除了PERC9还可选新一代PERC10H740pH840Cache容量可以更大。

 

为什么还用电池而不是电容,理由参见《炉石传说数据库损坏:这锅RAID卡电池背吗?》。

 

 

Dell服务器专用的NDC网络子卡模块,这里同样配置了Broadcom 10G/GbE 2+2P 57800-t rNDC。大家还记得上一篇中它在PowerEdge R940中是怎么转成竖插的吗?

 

 

细心的朋友可能看到了它——IDSDM Dual-SD模块插在NDC和电源之间的主板边缘位置。

 

今天先写到这里吧,下周有时间继续给大家分享别的Xeon Scalable服务器。

 

参考资料

Direct from Development – PowerEdge Multi-Vector Coolinghttp://en.community.dell.com/techcenter/extras/m/white_papers/20444244

目录
相关文章
|
7天前
|
存储 人工智能 并行计算
2025年阿里云弹性裸金属服务器架构解析与资源配置方案
🚀 核心特性与技术创新:提供100%物理机性能输出,支持NVIDIA A100/V100 GPU直通,无虚拟化层损耗。网络与存储优化,400万PPS吞吐量,ESSD云盘IOPS达100万,RDMA延迟<5μs。全球部署覆盖华北、华东、华南及海外节点,支持跨地域负载均衡。典型应用场景包括AI训练、科学计算等,支持分布式训练和并行计算框架。弹性裸金属服务器+OSS存储+高速网络综合部署,满足高性能计算需求。
|
8天前
|
弹性计算 运维 网络安全
阿里云轻量应用服务器产品解析与搭建个人博客网站教程参考
轻量应用服务器(Simple Application Server)作为阿里云面向单机应用场景推出的云服务器产品,以其一键部署、一站式管理、高性价比等特性,深受个人开发者、中小企业及入门级用户的喜爱。本文将全面解析阿里云轻量应用服务器的产品优势、应用场景、使用须知,以及使用轻量应用服务器搭建个人博客网站的详细教程,帮助用户更好地了解和使用这一产品。
|
23天前
|
存储 弹性计算 固态存储
阿里云服务器ESSD Entry系统盘测评IOPS、IO读写和时延性能参数
阿里云ESSD Entry云盘是新一代企业级云盘,具备高IOPS、低延迟特性,适合开发与测试场景。它提供10~32,768 GiB容量范围,最大IOPS达6,000,吞吐量150 MB/s,时延1~3 ms。支持按量付费和包年包月,性价比高,特别适合个人开发者和中小企业。详情及价格参考阿里云官网。
|
28天前
|
安全 网络协议 网络安全
解析HTTP代理服务器不稳定致使掉线的关键原因
随着数字化发展,网络安全和隐私保护成为核心需求。HTTP代理服务器掉线原因主要包括:1. 网络问题,如本地网络不稳定、路由复杂;2. 服务器质量差、IP资源不稳定;3. 用户配置错误、超时或请求频率异常;4. IP失效或协议不兼容。这些问题会影响连接稳定性。
66 8
|
28天前
|
存储 运维 资源调度
阿里云服务器经济型e实例解析:性能、稳定性与兼顾成本
阿里云经济型e云服务器以其高性价比、稳定可靠的性能以及灵活多样的配置选项,成为了众多企业在搭建官网时的首选。那么,阿里云经济型e云服务器究竟怎么样?它是否能够满足企业官网的搭建需求?本文将从性能表现、稳定性与可靠性、成本考虑等多个方面对阿里云经济型e云服务器进行深入剖析,以供大家参考选择。
110 37
|
2月前
|
安全 编译器 Linux
深入解析与防范:基于缓冲区溢出的FTP服务器攻击及调用计算器示例
本文深入解析了利用缓冲区溢出漏洞对FTP服务器进行远程攻击的技术,通过分析FreeFlow FTP 1.75版本的漏洞,展示了如何通过构造过长的用户名触发缓冲区溢出并调用计算器(`calc.exe`)。文章详细介绍了攻击原理、关键代码组件及其实现步骤,并提出了有效的防范措施,如输入验证、编译器保护和安全编程语言的选择,以保障系统的安全性。环境搭建基于Windows XP SP3和Kali Linux,使用Metasploit Framework进行攻击演示。请注意,此内容仅用于教育和研究目的。
92 4
|
2月前
|
JSON 自然语言处理 Java
OpenAI API深度解析:参数、Token、计费与多种调用方式
随着人工智能技术的飞速发展,OpenAI API已成为许多开发者和企业的得力助手。本文将深入探讨OpenAI API的参数、Token、计费方式,以及如何通过Rest API(以Postman为例)、Java API调用、工具调用等方式实现与OpenAI的交互,并特别关注调用具有视觉功能的GPT-4o使用本地图片的功能。此外,本文还将介绍JSON模式、可重现输出的seed机制、使用代码统计Token数量、开发控制台循环聊天,以及基于最大Token数量的消息列表限制和会话长度管理的控制台循环聊天。
837 7
|
2月前
|
域名解析 弹性计算 安全
阿里云服务器租用、注册域名、备案及域名解析完整流程参考(图文教程)
对于很多初次建站的用户来说,选购云服务器和注册应及备案和域名解析步骤必须了解的,目前轻量云服务器2核2G68元一年,2核4G4M服务器298元一年,域名注册方面,阿里云推出域名1元购买活动,新用户注册com和cn域名2年首年仅需0元,xyz和top等域名首年仅需1元。对于建站的用户来说,购买完云服务器并注册好域名之后,下一步还需要操作备案和域名绑定。本文为大家展示阿里云服务器的购买流程,域名注册、绑定以及备案的完整流程,全文以图文教程形式为大家展示具体细节及注意事项,以供新手用户参考。
|
1月前
|
自然语言处理 数据处理 索引
mindspeed-llm源码解析(一)preprocess_data
mindspeed-llm是昇腾模型套件代码仓,原来叫"modelLink"。这篇文章带大家阅读一下数据处理脚本preprocess_data.py(基于1.0.0分支),数据处理是模型训练的第一步,经常会用到。
53 0
|
2月前
|
存储 设计模式 算法
【23种设计模式·全精解析 | 行为型模式篇】11种行为型模式的结构概述、案例实现、优缺点、扩展对比、使用场景、源码解析
行为型模式用于描述程序在运行时复杂的流程控制,即描述多个类或对象之间怎样相互协作共同完成单个对象都无法单独完成的任务,它涉及算法与对象间职责的分配。行为型模式分为类行为模式和对象行为模式,前者采用继承机制来在类间分派行为,后者采用组合或聚合在对象间分配行为。由于组合关系或聚合关系比继承关系耦合度低,满足“合成复用原则”,所以对象行为模式比类行为模式具有更大的灵活性。 行为型模式分为: • 模板方法模式 • 策略模式 • 命令模式 • 职责链模式 • 状态模式 • 观察者模式 • 中介者模式 • 迭代器模式 • 访问者模式 • 备忘录模式 • 解释器模式
【23种设计模式·全精解析 | 行为型模式篇】11种行为型模式的结构概述、案例实现、优缺点、扩展对比、使用场景、源码解析

热门文章

最新文章

推荐镜像

更多