带你读《企业数字化基石-阿里巴巴云计算基础设施实践》第三章数据中心能效3.2数据中心服务器电能利用率(一)

简介: 《企业数字化基石-阿里巴巴云计算基础设施实践》第三章数据中心能效3.2(一)

3.2  数据中心服务器电能利用率

PUE很重要,但是低的 PUE 并不代表数据中心能效高,例如数据中心温度提升,IT设备的耗电量(风扇等部件消耗)增加,PUE会降低,但是整个数据中心能效会变得更差 ;所以引入了 SPUE的概念,其关联因素主要包括 IT设备的散热系统、IT设备的电源系统,以及IT 设备的单位能力的电力消耗量(TB 存储、每 GB 读写次数、每 GHz 计算量的电能消耗量

3.1.1 服务器电源的能效

随着服务器计算能力的提升,高功耗 CPU的使用、GPU应用场景的增加,都加大了服务器的整机功耗,直接导致电费支出在数据中心日常费用的占比越来越高。从服务器的供电设计看,提高 PSU和单板电源的转化效率、减少电源的传输损耗,将有利于减少服务器能耗,节省数据中心电费开支。

PSU

PSUPowerSupplyUnit的效率当前已经发展到钛金级别,钛金电源在50%负载以下的供电效率比铂金电源提高   2%,并且低载效率的提高也符合服务器集群的应用。

400W 的服务器、800WPSU来说,更换成钛金电源后,每台服务器可以节8.8W 的功耗,1年节省 77 度电,10万台设备 1 年可以节省 770 万度电。在 PSU功耗小于 50% 的情况下,钛金 PSU效率提高更多,能够减少更多的电费开支。

单板 DCDC电源

服务器的电源消耗主要在 CPU和内存上,CPU供电 VRM主要向动态节能和效率提升的方向发展。

•    动态节能技术VRD厂商都在应用新的动态节能技术,此技术能够随着CPU应用功耗的减小,关闭开关电源的相数达到减小损耗的目的。目前在CPU使用中,在开启动态节能后,CPU功耗在 150W 以内,电源效率可以明显提高。

•   VRD效率提升 VRD技术主要往小体积、高密度、高集成的方向发展。但是受限于硅 MOS的开关损耗,整体的效率无法明显提高。VRD的效率进一步提高依赖于半导体新技术的突破。就目前来说,600kHz的开关频率可以达到效率和性能的最优,方案上配合新的 Drmos和低 DCR电感,在整体VRD效率上可以达到94% 左右。目前阿里的雷神项目使用的就是这套方案。

•    VRD 电源的控制方式:逐步都使用数字电源的方案,增加电源配置的灵活性。

 

VRD的技术和 IntelVRD规范同步实施,当前 VRD规范发展到 VR13,在整体效率设计和节能设计上也达到了新的高度。基于Purley平台的雷神项目就是按照 VR13 规范完成设计的。

服务器单板 48V供电

提到单板供电方案,就不得不提 Google在单板 48V供电方面的研究和应用。Google48V方案主要配合机柜整体使用,在服务器单板上当前主要针对 CPU/存供电采用 48V方案。因为从服务器耗电分布上,超过 80%的电量消耗在 CPU和内存上,这方面的效率提升直接影响到服务器整机的效率表现。图 3-11和表 3-23-3均引用自谷歌开发计算机峰会简报,即 TheDatacenterasaComputer(作者 :路易斯 安德烈 巴罗佐、吉米 克里达拉斯、乌尔斯霍尔兹勒

 

服务器在峰值负载时CPUDRAM内存提升消耗的功率超过80%

image.png

首先,PSU改成 48V输出后,PSU的效率可以提升,对比的数据参考如表 3-2所示。

image.png

其次,综合了 PSU和单板电源的效率数据对比数据计算基于整机 600W 功耗,在使用 48V供电后,整机的电源转换效率可以提高 1.5%。换算后单机功耗可以减少 11.5W。按照 10 万台运行 1年,预估可以节省电量 1000 万度。

3-348V整体效率提升

image.png

虽然 48V的应用可以带来服务器电源整体效率的提高,但是服务器的周边设备大部分都是 12V供电,比如 PCIe设备、硬盘(存储设备。解决这类问题需要一定的时间,对当前来说,48V的系统应用在 CPU计算节点服务器上可以得到比较好的效率改善,但是在 GPU和存储型节点上,48V的系统应用需要综合 TCO整体考虑。

相关文章
|
2月前
|
运维 持续交付 云计算
深入解析云计算中的微服务架构:原理、优势与实践
深入解析云计算中的微服务架构:原理、优势与实践
70 1
|
3月前
|
Kubernetes Cloud Native 持续交付
云计算的转型之路:云原生技术的崛起与实践####
【10月更文挑战第16天】 本文深入探讨了云原生技术在现代IT架构变革中的核心作用,不同于传统概述,本摘要将聚焦于云原生如何促进企业实现敏捷开发、弹性伸缩及高效运维,通过具体案例分析展现其在实际业务场景中的创新应用,揭示这一技术趋势对企业数字化转型的深远影响。 ####
62 2
|
2月前
|
云安全 存储 监控
云计算安全:AWS与Azure的安全策略与实践比较
【10月更文挑战第26天】本文详细比较了AWS和Azure在安全性方面的策略和实践,涵盖身份与访问管理、数据加密与保护以及安全监控与响应。通过代码示例展示了两家云服务提供商在实际应用中的具体操作,帮助企业在选择云服务时做出明智决策。
51 0
|
2月前
|
人工智能 边缘计算 云计算
2024.11|云计算行业的商业模式创新方法及实践
截至2024年,全球云计算行业迈入全新阶段,从IaaS到大规模AI模型平台,技术与商业模式不断创新。本文分析全球最新技术进展,探讨云计算商业模式创新策略与实践,解析云服务厂商如何通过技术革新实现价值最大化,推动企业数字化与智能化转型。重点讨论AI与云计算的深度融合、边缘计算与去中心化发展、平台化与生态系统建设,以及数据安全与绿色云计算等关键议题。
107 30
|
2月前
|
运维 监控 持续交付
云计算环境下的运维自动化实践
本文探讨了在云计算环境下实施运维自动化的必要性、挑战及解决方案,重点介绍了如何利用现代技术工具实现高效的云资源管理和监控。通过具体案例分析,展示了自动化运维在提升系统稳定性、降低人力成本方面的优势。
|
2月前
|
云安全 监控 安全
云计算环境下的网络安全策略与实践
在数字化时代,云计算已成为企业和个人存储、处理数据的重要方式。然而,随着云服务的普及,网络安全问题也日益凸显。本文将探讨如何在云计算环境中实施有效的网络安全措施,包括加密技术、访问控制、安全监控和应急响应计划等方面。我们将通过具体案例分析,展示如何在实际场景中应用这些策略,以保护云中的数据不受威胁。
|
2月前
|
安全 数据中心
数据中心服务器机架是什么
数据中心服务器机架是用于容纳服务器、存储器等IT设备的结构,旨在提升数据中心的管理与运营效率。常见的类型包括开放式机架、封闭式机柜和壁挂式机架,每种类型各有特点,适用于不同的场景需求。选择时需考虑尺寸、承重、冷却效率及安全性等因素,以确保最佳的使用效果。
71 4
|
2月前
|
弹性计算 监控 大数据
云计算中的弹性伸缩:原理与实践
云计算中的弹性伸缩:原理与实践
|
2月前
|
存储 算法 调度
云计算环境下的性能优化实践
云计算环境下的性能优化实践
|
2月前
|
云安全 存储 监控
云计算安全:AWS与Azure的安全策略与实践比较
【10月更文挑战第27天】本文对比分析了AWS和Azure在云计算安全领域的策略与实践,涵盖技术、定价、混合云工具等方面。通过代码示例展示了如何在两个平台上实施安全措施,如监控告警、数据加密和身份管理。总结了两者的优缺点,帮助读者根据具体需求选择合适的云服务提供商。
49 4