带你读《企业数字化基石-阿里巴巴云计算基础设施实践》第三章数据中心能效3.2数据中心服务器电能利用率(一)

简介: 《企业数字化基石-阿里巴巴云计算基础设施实践》第三章数据中心能效3.2(一)

3.2  数据中心服务器电能利用率

PUE很重要,但是低的 PUE 并不代表数据中心能效高,例如数据中心温度提升,IT设备的耗电量(风扇等部件消耗)增加,PUE会降低,但是整个数据中心能效会变得更差 ;所以引入了 SPUE的概念,其关联因素主要包括 IT设备的散热系统、IT设备的电源系统,以及IT 设备的单位能力的电力消耗量(TB 存储、每 GB 读写次数、每 GHz 计算量的电能消耗量

3.1.1 服务器电源的能效

随着服务器计算能力的提升,高功耗 CPU的使用、GPU应用场景的增加,都加大了服务器的整机功耗,直接导致电费支出在数据中心日常费用的占比越来越高。从服务器的供电设计看,提高 PSU和单板电源的转化效率、减少电源的传输损耗,将有利于减少服务器能耗,节省数据中心电费开支。

PSU

PSUPowerSupplyUnit的效率当前已经发展到钛金级别,钛金电源在50%负载以下的供电效率比铂金电源提高   2%,并且低载效率的提高也符合服务器集群的应用。

400W 的服务器、800WPSU来说,更换成钛金电源后,每台服务器可以节8.8W 的功耗,1年节省 77 度电,10万台设备 1 年可以节省 770 万度电。在 PSU功耗小于 50% 的情况下,钛金 PSU效率提高更多,能够减少更多的电费开支。

单板 DCDC电源

服务器的电源消耗主要在 CPU和内存上,CPU供电 VRM主要向动态节能和效率提升的方向发展。

•    动态节能技术VRD厂商都在应用新的动态节能技术,此技术能够随着CPU应用功耗的减小,关闭开关电源的相数达到减小损耗的目的。目前在CPU使用中,在开启动态节能后,CPU功耗在 150W 以内,电源效率可以明显提高。

•   VRD效率提升 VRD技术主要往小体积、高密度、高集成的方向发展。但是受限于硅 MOS的开关损耗,整体的效率无法明显提高。VRD的效率进一步提高依赖于半导体新技术的突破。就目前来说,600kHz的开关频率可以达到效率和性能的最优,方案上配合新的 Drmos和低 DCR电感,在整体VRD效率上可以达到94% 左右。目前阿里的雷神项目使用的就是这套方案。

•    VRD 电源的控制方式:逐步都使用数字电源的方案,增加电源配置的灵活性。

 

VRD的技术和 IntelVRD规范同步实施,当前 VRD规范发展到 VR13,在整体效率设计和节能设计上也达到了新的高度。基于Purley平台的雷神项目就是按照 VR13 规范完成设计的。

服务器单板 48V供电

提到单板供电方案,就不得不提 Google在单板 48V供电方面的研究和应用。Google48V方案主要配合机柜整体使用,在服务器单板上当前主要针对 CPU/存供电采用 48V方案。因为从服务器耗电分布上,超过 80%的电量消耗在 CPU和内存上,这方面的效率提升直接影响到服务器整机的效率表现。图 3-11和表 3-23-3均引用自谷歌开发计算机峰会简报,即 TheDatacenterasaComputer(作者 :路易斯 安德烈 巴罗佐、吉米 克里达拉斯、乌尔斯霍尔兹勒

 

服务器在峰值负载时CPUDRAM内存提升消耗的功率超过80%

image.png

首先,PSU改成 48V输出后,PSU的效率可以提升,对比的数据参考如表 3-2所示。

image.png

其次,综合了 PSU和单板电源的效率数据对比数据计算基于整机 600W 功耗,在使用 48V供电后,整机的电源转换效率可以提高 1.5%。换算后单机功耗可以减少 11.5W。按照 10 万台运行 1年,预估可以节省电量 1000 万度。

3-348V整体效率提升

image.png

虽然 48V的应用可以带来服务器电源整体效率的提高,但是服务器的周边设备大部分都是 12V供电,比如 PCIe设备、硬盘(存储设备。解决这类问题需要一定的时间,对当前来说,48V的系统应用在 CPU计算节点服务器上可以得到比较好的效率改善,但是在 GPU和存储型节点上,48V的系统应用需要综合 TCO整体考虑。

相关文章
|
1月前
|
存储 弹性计算 人工智能
2025年阿里云企业云服务器ECS选购与配置全攻略
本文介绍了阿里云服务器的核心配置选择方法论,涵盖算力需求分析、网络与存储设计、地域部署策略三大维度。针对不同业务场景,如初创企业官网和AI模型训练平台,提供了具体配置方案。同时,详细讲解了购买操作指南及长期运维优化建议,帮助用户快速实现业务上云并确保高效运行。访问阿里云官方资源聚合平台可获取更多最新产品动态和技术支持。
|
4天前
|
人工智能 安全 大数据
【限时特惠】阿里云服务器7折抢购!高性能+高性价比,开发者与企业必备攻略
阿里云服务器限时7折特惠,高性能、高性价比,为开发者和企业量身打造!新老用户均可参与,灵活配置满足多种需求,全球节点低延迟覆盖。自研神龙架构保障稳定性,安全防护全面,操作便捷,生态丰富。适用于个人开发、企业部署、跨境业务及AI计算等场景。点击专属链接立即抢购,活动名额有限,速来享受云端算力带来的高效体验!
34 0
|
16天前
|
存储 弹性计算 安全
ECS与VPS技术角力:从算力成本到免备案雷区,企业服务器选型合规指南
在数字化浪潮中,服务器选择至关重要。ECS(云服务器)和VPS(虚拟专用服务器)是热门选项。ECS基于云计算,提供高可用性和弹性伸缩,适合大型项目;VPS通过分割物理服务器实现资源独立,成本较低,适合小型应用。两者在网络、存储及计算性能上各有优劣,需根据需求选择。国内并不存在合法的免备案服务器,建议严格遵守法规,确保网站合法运营。
39 3
|
16天前
|
存储 资源调度 调度
从数据中心机房来看云服务器的可用性与性能!
数据中心机房是云服务器的物理基础,其硬件设施、运行环境和管理水平直接影响云服务的可用性和性能。稳定的电力供应(如UPS和柴油发电机)、冗余设计(网络和电源冗余)、精确的温湿度控制、优良的网络架构与带宽分配、高效的存储系统及合理的计算资源调度,共同保障云服务器的持续稳定运行,减少故障和性能下降的风险,确保业务稳定和服务质量。
35 1
|
5月前
|
机器学习/深度学习 人工智能 运维
企业内训|LLM大模型在服务器和IT网络运维中的应用-某日企IT运维部门
本课程是为某在华日资企业集团的IT运维部门专门定制开发的企业培训课程,本课程旨在深入探讨大型语言模型(LLM)在服务器及IT网络运维中的应用,结合当前技术趋势与行业需求,帮助学员掌握LLM如何为运维工作赋能。通过系统的理论讲解与实践操作,学员将了解LLM的基本知识、模型架构及其在实际运维场景中的应用,如日志分析、故障诊断、网络安全与性能优化等。
164 2
|
1月前
|
Kubernetes 监控 Serverless
基于阿里云Serverless Kubernetes(ASK)的无服务器架构设计与实践
无服务器架构(Serverless Architecture)在云原生技术中备受关注,开发者只需专注于业务逻辑,无需管理服务器。阿里云Serverless Kubernetes(ASK)是基于Kubernetes的托管服务,提供极致弹性和按需付费能力。本文深入探讨如何使用ASK设计和实现无服务器架构,涵盖事件驱动、自动扩展、无状态设计、监控与日志及成本优化等方面,并通过图片处理服务案例展示具体实践,帮助构建高效可靠的无服务器应用。
|
1月前
|
人工智能 Oracle 搜索推荐
大模型重塑数据中心,全球服务器产业迎新增长浪潮
大模型重塑数据中心,全球服务器产业迎新增长浪潮
|
1月前
|
存储 人工智能 弹性计算
2025年阿里云企业高性能云服务器租用价格与选型详解
随着企业数字化转型,阿里云于2025年推出多款高性能云服务器实例,涵盖计算、通用和内存密集型场景。文章分析了企业选择云服务器的核心要点,包括明确业务需求(如计算密集型任务推荐计算型实例)、性能与架构升级(如第八代实例性能提升20%),以及第九代实例支持AI等高算力需求。同时提供了配置价格参考和成本优化策略,助力企业实现效率与成本的最优平衡。
|
5月前
|
弹性计算 前端开发 JavaScript
高校学生在家实践ECS弹性云服务器
简单谈谈我这几周使用ECS弹性云服务器的体验感
|
2月前
|
人工智能 监控 测试技术
阿里云磐久服务器稳定性实践之路
阿里云服务器质量智能管理体系聚焦自研服务器硬件层面的极致优化,应对高并发交付、短稳定性周期、早问题发现和快修复四大挑战。通过“三个重构”(质量标准、开发流程、交付模式)、“六个归一”(架构、硬件、软件、测试、部件、制造)策略,实现芯片、整机和云同步发布,确保快速稳定上量。此外,全场景测试体系与智能预警、分析、修复系统协同工作,保障服务器在萌芽阶段发现问题并及时解决,提升整体质量水平。未来,阿里云将继续深化大数据驱动的质量管理,推动服务器行业硬件质量的持续进步。

热门文章

最新文章