带你读《企业数字化基石-阿里巴巴云计算基础设施实践》第三章数据中心能效3.2数据中心服务器电能利用率(一)

简介: 《企业数字化基石-阿里巴巴云计算基础设施实践》第三章数据中心能效3.2(一)

3.2  数据中心服务器电能利用率

PUE很重要,但是低的 PUE 并不代表数据中心能效高,例如数据中心温度提升,IT设备的耗电量(风扇等部件消耗)增加,PUE会降低,但是整个数据中心能效会变得更差 ;所以引入了 SPUE的概念,其关联因素主要包括 IT设备的散热系统、IT设备的电源系统,以及IT 设备的单位能力的电力消耗量(TB 存储、每 GB 读写次数、每 GHz 计算量的电能消耗量

3.1.1 服务器电源的能效

随着服务器计算能力的提升,高功耗 CPU的使用、GPU应用场景的增加,都加大了服务器的整机功耗,直接导致电费支出在数据中心日常费用的占比越来越高。从服务器的供电设计看,提高 PSU和单板电源的转化效率、减少电源的传输损耗,将有利于减少服务器能耗,节省数据中心电费开支。

PSU

PSUPowerSupplyUnit的效率当前已经发展到钛金级别,钛金电源在50%负载以下的供电效率比铂金电源提高   2%,并且低载效率的提高也符合服务器集群的应用。

400W 的服务器、800WPSU来说,更换成钛金电源后,每台服务器可以节8.8W 的功耗,1年节省 77 度电,10万台设备 1 年可以节省 770 万度电。在 PSU功耗小于 50% 的情况下,钛金 PSU效率提高更多,能够减少更多的电费开支。

单板 DCDC电源

服务器的电源消耗主要在 CPU和内存上,CPU供电 VRM主要向动态节能和效率提升的方向发展。

•    动态节能技术VRD厂商都在应用新的动态节能技术,此技术能够随着CPU应用功耗的减小,关闭开关电源的相数达到减小损耗的目的。目前在CPU使用中,在开启动态节能后,CPU功耗在 150W 以内,电源效率可以明显提高。

•   VRD效率提升 VRD技术主要往小体积、高密度、高集成的方向发展。但是受限于硅 MOS的开关损耗,整体的效率无法明显提高。VRD的效率进一步提高依赖于半导体新技术的突破。就目前来说,600kHz的开关频率可以达到效率和性能的最优,方案上配合新的 Drmos和低 DCR电感,在整体VRD效率上可以达到94% 左右。目前阿里的雷神项目使用的就是这套方案。

•    VRD 电源的控制方式:逐步都使用数字电源的方案,增加电源配置的灵活性。

 

VRD的技术和 IntelVRD规范同步实施,当前 VRD规范发展到 VR13,在整体效率设计和节能设计上也达到了新的高度。基于Purley平台的雷神项目就是按照 VR13 规范完成设计的。

服务器单板 48V供电

提到单板供电方案,就不得不提 Google在单板 48V供电方面的研究和应用。Google48V方案主要配合机柜整体使用,在服务器单板上当前主要针对 CPU/存供电采用 48V方案。因为从服务器耗电分布上,超过 80%的电量消耗在 CPU和内存上,这方面的效率提升直接影响到服务器整机的效率表现。图 3-11和表 3-23-3均引用自谷歌开发计算机峰会简报,即 TheDatacenterasaComputer(作者 :路易斯 安德烈 巴罗佐、吉米 克里达拉斯、乌尔斯霍尔兹勒

 

服务器在峰值负载时CPUDRAM内存提升消耗的功率超过80%

image.png

首先,PSU改成 48V输出后,PSU的效率可以提升,对比的数据参考如表 3-2所示。

image.png

其次,综合了 PSU和单板电源的效率数据对比数据计算基于整机 600W 功耗,在使用 48V供电后,整机的电源转换效率可以提高 1.5%。换算后单机功耗可以减少 11.5W。按照 10 万台运行 1年,预估可以节省电量 1000 万度。

3-348V整体效率提升

image.png

虽然 48V的应用可以带来服务器电源整体效率的提高,但是服务器的周边设备大部分都是 12V供电,比如 PCIe设备、硬盘(存储设备。解决这类问题需要一定的时间,对当前来说,48V的系统应用在 CPU计算节点服务器上可以得到比较好的效率改善,但是在 GPU和存储型节点上,48V的系统应用需要综合 TCO整体考虑。

相关文章
|
运维 持续交付 云计算
深入解析云计算中的微服务架构:原理、优势与实践
深入解析云计算中的微服务架构:原理、优势与实践
842 86
|
8月前
|
人工智能 自然语言处理 安全
Python构建MCP服务器:从工具封装到AI集成的全流程实践
MCP协议为AI提供标准化工具调用接口,助力模型高效操作现实世界。
1376 1
|
9月前
|
存储 安全 虚拟化
全面解析服务器虚拟化:云计算时代的核心技术架构
服务器虚拟化是云计算的核心技术,通过资源池化提升IT效率。本文详解其原理、部署优势及在数字化转型中的关键作用,涵盖技术架构、应用场景与选型指南,助力企业构建高效灵活的云环境。
833 0
|
弹性计算 监控 大数据
云计算中的弹性伸缩:原理与实践
云计算中的弹性伸缩:原理与实践
931 99
|
弹性计算 Linux 云计算
阿里云操作系统控制台——ECS操作及云计算应用实践
本文详细介绍了云服务器ECS的使用流程,包括开通服务、系统配置、权限管理、组件安装及内存全景诊断等关键步骤。通过开通阿里云操作系统服务、授予RAM用户权限和安装必要组件,可实现对服务器的有效管理与维护。在内存诊断部分,展示了如何发起诊断并解析结果,帮助精准定位内存问题。此外,文章还讲解了利用ECS训练模型的操作方法,从上传文件到终端命令执行,直至完成模型训练。最后总结指出,掌握这些技能不仅提升了对云服务器架构的理解,还为实际业务提供了高效解决方案,展现了ECS在数据处理与分析中的重要价值。
阿里云操作系统控制台——ECS操作及云计算应用实践
|
监控 持续交付 API
深入理解云计算中的微服务架构:原理、优势与实践
深入理解云计算中的微服务架构:原理、优势与实践
702 83
|
存储 资源调度 调度
从数据中心机房来看云服务器的可用性与性能!
数据中心机房是云服务器的物理基础,其硬件设施、运行环境和管理水平直接影响云服务的可用性和性能。稳定的电力供应(如UPS和柴油发电机)、冗余设计(网络和电源冗余)、精确的温湿度控制、优良的网络架构与带宽分配、高效的存储系统及合理的计算资源调度,共同保障云服务器的持续稳定运行,减少故障和性能下降的风险,确保业务稳定和服务质量。
309 1
|
弹性计算 云计算
阿里云认证全新发布【Apsara Clouder云计算专项技能认证:云服务器ECS入门】
阿里云认证全新发布【Apsara Clouder云计算专项技能认证:云服务器ECS入门】
|
Kubernetes 监控 Serverless
基于阿里云Serverless Kubernetes(ASK)的无服务器架构设计与实践
无服务器架构(Serverless Architecture)在云原生技术中备受关注,开发者只需专注于业务逻辑,无需管理服务器。阿里云Serverless Kubernetes(ASK)是基于Kubernetes的托管服务,提供极致弹性和按需付费能力。本文深入探讨如何使用ASK设计和实现无服务器架构,涵盖事件驱动、自动扩展、无状态设计、监控与日志及成本优化等方面,并通过图片处理服务案例展示具体实践,帮助构建高效可靠的无服务器应用。
|
人工智能 Oracle 搜索推荐
大模型重塑数据中心,全球服务器产业迎新增长浪潮
大模型重塑数据中心,全球服务器产业迎新增长浪潮