带你读《企业数字化基石-阿里巴巴云计算基础设施实践》第三章数据中心能效3.2数据中心服务器电能利用率(一)

简介: 《企业数字化基石-阿里巴巴云计算基础设施实践》第三章数据中心能效3.2(一)

3.2  数据中心服务器电能利用率

PUE很重要,但是低的 PUE 并不代表数据中心能效高,例如数据中心温度提升,IT设备的耗电量(风扇等部件消耗)增加,PUE会降低,但是整个数据中心能效会变得更差 ;所以引入了 SPUE的概念,其关联因素主要包括 IT设备的散热系统、IT设备的电源系统,以及IT 设备的单位能力的电力消耗量(TB 存储、每 GB 读写次数、每 GHz 计算量的电能消耗量

3.1.1 服务器电源的能效

随着服务器计算能力的提升,高功耗 CPU的使用、GPU应用场景的增加,都加大了服务器的整机功耗,直接导致电费支出在数据中心日常费用的占比越来越高。从服务器的供电设计看,提高 PSU和单板电源的转化效率、减少电源的传输损耗,将有利于减少服务器能耗,节省数据中心电费开支。

PSU

PSUPowerSupplyUnit的效率当前已经发展到钛金级别,钛金电源在50%负载以下的供电效率比铂金电源提高   2%,并且低载效率的提高也符合服务器集群的应用。

400W 的服务器、800WPSU来说,更换成钛金电源后,每台服务器可以节8.8W 的功耗,1年节省 77 度电,10万台设备 1 年可以节省 770 万度电。在 PSU功耗小于 50% 的情况下,钛金 PSU效率提高更多,能够减少更多的电费开支。

单板 DCDC电源

服务器的电源消耗主要在 CPU和内存上,CPU供电 VRM主要向动态节能和效率提升的方向发展。

•    动态节能技术VRD厂商都在应用新的动态节能技术,此技术能够随着CPU应用功耗的减小,关闭开关电源的相数达到减小损耗的目的。目前在CPU使用中,在开启动态节能后,CPU功耗在 150W 以内,电源效率可以明显提高。

•   VRD效率提升 VRD技术主要往小体积、高密度、高集成的方向发展。但是受限于硅 MOS的开关损耗,整体的效率无法明显提高。VRD的效率进一步提高依赖于半导体新技术的突破。就目前来说,600kHz的开关频率可以达到效率和性能的最优,方案上配合新的 Drmos和低 DCR电感,在整体VRD效率上可以达到94% 左右。目前阿里的雷神项目使用的就是这套方案。

•    VRD 电源的控制方式:逐步都使用数字电源的方案,增加电源配置的灵活性。

 

VRD的技术和 IntelVRD规范同步实施,当前 VRD规范发展到 VR13,在整体效率设计和节能设计上也达到了新的高度。基于Purley平台的雷神项目就是按照 VR13 规范完成设计的。

服务器单板 48V供电

提到单板供电方案,就不得不提 Google在单板 48V供电方面的研究和应用。Google48V方案主要配合机柜整体使用,在服务器单板上当前主要针对 CPU/存供电采用 48V方案。因为从服务器耗电分布上,超过 80%的电量消耗在 CPU和内存上,这方面的效率提升直接影响到服务器整机的效率表现。图 3-11和表 3-23-3均引用自谷歌开发计算机峰会简报,即 TheDatacenterasaComputer(作者 :路易斯 安德烈 巴罗佐、吉米 克里达拉斯、乌尔斯霍尔兹勒

 

服务器在峰值负载时CPUDRAM内存提升消耗的功率超过80%

image.png

首先,PSU改成 48V输出后,PSU的效率可以提升,对比的数据参考如表 3-2所示。

image.png

其次,综合了 PSU和单板电源的效率数据对比数据计算基于整机 600W 功耗,在使用 48V供电后,整机的电源转换效率可以提高 1.5%。换算后单机功耗可以减少 11.5W。按照 10 万台运行 1年,预估可以节省电量 1000 万度。

3-348V整体效率提升

image.png

虽然 48V的应用可以带来服务器电源整体效率的提高,但是服务器的周边设备大部分都是 12V供电,比如 PCIe设备、硬盘(存储设备。解决这类问题需要一定的时间,对当前来说,48V的系统应用在 CPU计算节点服务器上可以得到比较好的效率改善,但是在 GPU和存储型节点上,48V的系统应用需要综合 TCO整体考虑。

相关文章
|
运维 持续交付 云计算
深入解析云计算中的微服务架构:原理、优势与实践
深入解析云计算中的微服务架构:原理、优势与实践
869 86
|
Kubernetes Cloud Native 持续交付
云计算的转型之路:云原生技术的崛起与实践####
【10月更文挑战第16天】 本文深入探讨了云原生技术在现代IT架构变革中的核心作用,不同于传统概述,本摘要将聚焦于云原生如何促进企业实现敏捷开发、弹性伸缩及高效运维,通过具体案例分析展现其在实际业务场景中的创新应用,揭示这一技术趋势对企业数字化转型的深远影响。 ####
425 2
|
云安全 存储 监控
云计算安全:AWS与Azure的安全策略与实践比较
【10月更文挑战第26天】本文详细比较了AWS和Azure在安全性方面的策略和实践,涵盖身份与访问管理、数据加密与保护以及安全监控与响应。通过代码示例展示了两家云服务提供商在实际应用中的具体操作,帮助企业在选择云服务时做出明智决策。
405 0
|
弹性计算 监控 大数据
云计算中的弹性伸缩:原理与实践
云计算中的弹性伸缩:原理与实践
972 99
|
监控 持续交付 API
深入理解云计算中的微服务架构:原理、优势与实践
深入理解云计算中的微服务架构:原理、优势与实践
745 83
|
存储 资源调度 调度
从数据中心机房来看云服务器的可用性与性能!
数据中心机房是云服务器的物理基础,其硬件设施、运行环境和管理水平直接影响云服务的可用性和性能。稳定的电力供应(如UPS和柴油发电机)、冗余设计(网络和电源冗余)、精确的温湿度控制、优良的网络架构与带宽分配、高效的存储系统及合理的计算资源调度,共同保障云服务器的持续稳定运行,减少故障和性能下降的风险,确保业务稳定和服务质量。
336 1
|
人工智能 Oracle 搜索推荐
大模型重塑数据中心,全球服务器产业迎新增长浪潮
大模型重塑数据中心,全球服务器产业迎新增长浪潮
|
Cloud Native 持续交付 云计算
云计算的转型之路:探索云原生架构的崛起与实践####
随着企业数字化转型加速,云原生架构以其高效性、灵活性和可扩展性成为现代IT基础设施的核心。本文深入探讨了云原生技术的关键要素,包括容器化、微服务、持续集成/持续部署(CI/CD)及无服务器架构等,并通过案例分析展示了这些技术如何助力企业实现敏捷开发、快速迭代和资源优化。通过剖析典型企业的转型经历,揭示云原生架构在应对市场变化、提升业务竞争力方面的巨大潜力。 ####
364 27
|
人工智能 边缘计算 云计算
2024.11|云计算行业的商业模式创新方法及实践
截至2024年,全球云计算行业迈入全新阶段,从IaaS到大规模AI模型平台,技术与商业模式不断创新。本文分析全球最新技术进展,探讨云计算商业模式创新策略与实践,解析云服务厂商如何通过技术革新实现价值最大化,推动企业数字化与智能化转型。重点讨论AI与云计算的深度融合、边缘计算与去中心化发展、平台化与生态系统建设,以及数据安全与绿色云计算等关键议题。
1188 30
|
运维 监控 持续交付
云计算环境下的运维自动化实践
本文探讨了在云计算环境下实施运维自动化的必要性、挑战及解决方案,重点介绍了如何利用现代技术工具实现高效的云资源管理和监控。通过具体案例分析,展示了自动化运维在提升系统稳定性、降低人力成本方面的优势。