带你读《企业数字化基石-阿里巴巴云计算基础设施实践》第三章数据中心能效3.2数据中心服务器电能利用率(一)

简介: 《企业数字化基石-阿里巴巴云计算基础设施实践》第三章数据中心能效3.2(一)

3.2  数据中心服务器电能利用率

PUE很重要,但是低的 PUE 并不代表数据中心能效高,例如数据中心温度提升,IT设备的耗电量(风扇等部件消耗)增加,PUE会降低,但是整个数据中心能效会变得更差 ;所以引入了 SPUE的概念,其关联因素主要包括 IT设备的散热系统、IT设备的电源系统,以及IT 设备的单位能力的电力消耗量(TB 存储、每 GB 读写次数、每 GHz 计算量的电能消耗量

3.1.1 服务器电源的能效

随着服务器计算能力的提升,高功耗 CPU的使用、GPU应用场景的增加,都加大了服务器的整机功耗,直接导致电费支出在数据中心日常费用的占比越来越高。从服务器的供电设计看,提高 PSU和单板电源的转化效率、减少电源的传输损耗,将有利于减少服务器能耗,节省数据中心电费开支。

PSU

PSUPowerSupplyUnit的效率当前已经发展到钛金级别,钛金电源在50%负载以下的供电效率比铂金电源提高   2%,并且低载效率的提高也符合服务器集群的应用。

400W 的服务器、800WPSU来说,更换成钛金电源后,每台服务器可以节8.8W 的功耗,1年节省 77 度电,10万台设备 1 年可以节省 770 万度电。在 PSU功耗小于 50% 的情况下,钛金 PSU效率提高更多,能够减少更多的电费开支。

单板 DCDC电源

服务器的电源消耗主要在 CPU和内存上,CPU供电 VRM主要向动态节能和效率提升的方向发展。

•    动态节能技术VRD厂商都在应用新的动态节能技术,此技术能够随着CPU应用功耗的减小,关闭开关电源的相数达到减小损耗的目的。目前在CPU使用中,在开启动态节能后,CPU功耗在 150W 以内,电源效率可以明显提高。

•   VRD效率提升 VRD技术主要往小体积、高密度、高集成的方向发展。但是受限于硅 MOS的开关损耗,整体的效率无法明显提高。VRD的效率进一步提高依赖于半导体新技术的突破。就目前来说,600kHz的开关频率可以达到效率和性能的最优,方案上配合新的 Drmos和低 DCR电感,在整体VRD效率上可以达到94% 左右。目前阿里的雷神项目使用的就是这套方案。

•    VRD 电源的控制方式:逐步都使用数字电源的方案,增加电源配置的灵活性。

 

VRD的技术和 IntelVRD规范同步实施,当前 VRD规范发展到 VR13,在整体效率设计和节能设计上也达到了新的高度。基于Purley平台的雷神项目就是按照 VR13 规范完成设计的。

服务器单板 48V供电

提到单板供电方案,就不得不提 Google在单板 48V供电方面的研究和应用。Google48V方案主要配合机柜整体使用,在服务器单板上当前主要针对 CPU/存供电采用 48V方案。因为从服务器耗电分布上,超过 80%的电量消耗在 CPU和内存上,这方面的效率提升直接影响到服务器整机的效率表现。图 3-11和表 3-23-3均引用自谷歌开发计算机峰会简报,即 TheDatacenterasaComputer(作者 :路易斯 安德烈 巴罗佐、吉米 克里达拉斯、乌尔斯霍尔兹勒

 

服务器在峰值负载时CPUDRAM内存提升消耗的功率超过80%

image.png

首先,PSU改成 48V输出后,PSU的效率可以提升,对比的数据参考如表 3-2所示。

image.png

其次,综合了 PSU和单板电源的效率数据对比数据计算基于整机 600W 功耗,在使用 48V供电后,整机的电源转换效率可以提高 1.5%。换算后单机功耗可以减少 11.5W。按照 10 万台运行 1年,预估可以节省电量 1000 万度。

3-348V整体效率提升

image.png

虽然 48V的应用可以带来服务器电源整体效率的提高,但是服务器的周边设备大部分都是 12V供电,比如 PCIe设备、硬盘(存储设备。解决这类问题需要一定的时间,对当前来说,48V的系统应用在 CPU计算节点服务器上可以得到比较好的效率改善,但是在 GPU和存储型节点上,48V的系统应用需要综合 TCO整体考虑。

相关文章
|
3月前
|
机器学习/深度学习 人工智能 运维
企业内训|LLM大模型在服务器和IT网络运维中的应用-某日企IT运维部门
本课程是为某在华日资企业集团的IT运维部门专门定制开发的企业培训课程,本课程旨在深入探讨大型语言模型(LLM)在服务器及IT网络运维中的应用,结合当前技术趋势与行业需求,帮助学员掌握LLM如何为运维工作赋能。通过系统的理论讲解与实践操作,学员将了解LLM的基本知识、模型架构及其在实际运维场景中的应用,如日志分析、故障诊断、网络安全与性能优化等。
103 2
|
3月前
|
存储 安全 网络安全
云计算与网络安全:构建安全的数字基石## 一、
本文探讨了云计算与网络安全之间的紧密联系,强调在享受云服务带来的便利与效率的同时,必须重视并加强信息安全管理。通过分析云服务的基本概念、特点及面临的主要安全风险,提出了一系列增强网络安全的策略与措施,旨在为企业和个人用户提供一个更加安全、可靠的云计算环境。 ## 二、
|
4月前
|
人工智能 安全 网络安全
云计算与网络安全:构建安全的数字基石##
在当今数字化时代,云计算已成为推动企业创新和效率的关键驱动力。然而,随着数据上云,网络安全威胁也日益增多,对信息的保护提出了更高要求。本文将深入探讨云计算服务模型、面临的主要网络安全挑战,以及如何通过技术手段和管理策略来强化信息安全,确保数据的完整性、可用性和保密性。 ##
|
4月前
|
存储 安全 网络安全
云计算与网络安全:构建安全的数字基石##
随着云计算技术的飞速发展,越来越多的企业和个人选择将数据和应用迁移到云端。然而,在享受云计算带来的便利和效率的同时,网络安全问题也日益凸显。本文将深入探讨云计算环境中的网络安全挑战,分析云服务、网络安全及信息安全等关键技术领域的现状与发展趋势,并提出相应的解决策略。 ##
|
2月前
|
弹性计算 监控 数据库
制造企业ERP系统迁移至阿里云ECS的实例,详细介绍了从需求分析、数据迁移、应用部署、网络配置到性能优化的全过程
本文通过一个制造企业ERP系统迁移至阿里云ECS的实例,详细介绍了从需求分析、数据迁移、应用部署、网络配置到性能优化的全过程,展示了企业级应用上云的实践方法与显著优势,包括弹性计算资源、高可靠性、数据安全及降低维护成本等,为企业数字化转型提供参考。
64 5
|
2月前
|
弹性计算 监控 容灾
阿里云ECS提供强大的云上灾备解决方案,通过高可用基础设施、多样的数据备份方式及异地灾备服务,帮助企业实现业务的持续稳定运行
在数字化时代,企业对信息技术的依赖加深,确保业务连续性至关重要。阿里云ECS提供强大的云上灾备解决方案,通过高可用基础设施、多样的数据备份方式及异地灾备服务,帮助企业实现业务的持续稳定运行。无论是小型企业还是大型企业,都能从中受益,确保在面对各种风险时保持业务稳定。
55 4
|
2月前
|
安全 数据中心
数据中心服务器机架是什么
数据中心服务器机架是用于容纳服务器、存储器等IT设备的结构,旨在提升数据中心的管理与运营效率。常见的类型包括开放式机架、封闭式机柜和壁挂式机架,每种类型各有特点,适用于不同的场景需求。选择时需考虑尺寸、承重、冷却效率及安全性等因素,以确保最佳的使用效果。
84 4
|
3月前
|
机器学习/深度学习 弹性计算 运维
云计算系列之阿里云ECS服务器管理实战
本文档介绍了阿里云ECS(Elastic Compute Service)的基本概念、实例管理、磁盘操作、快照与镜像功能及其应用场景,最后通过具体案例解析ECS的实际应用。ECS是阿里云提供的高效、可靠的云计算服务,支持多种业务需求,如Web应用、高并发网站、数据库等,帮助企业快速构建稳定安全的应用,提升运维效率,降低IT成本。文档还详细说明了ECS实例的创建方式、连接方法及日常管理操作,帮助用户更好地利用ECS服务。
102 2
云计算系列之阿里云ECS服务器管理实战
|
2月前
|
运维 云计算 数据安全/隐私保护
云计算:重塑企业数字化转型之
云计算:重塑企业数字化转型之
48 0
|
3月前
|
Cloud Native 持续交付 云计算
云端新纪元:探索云原生技术的奥秘在当今数字化时代,云计算已成为推动企业创新和增长的关键动力。随着云平台的不断成熟,云原生技术应运而生,以其独特的优势引领着一场新的技术革命。本文将深入探讨云原生的核心概念、主要特点以及它如何改变现代软件开发和部署的方式,为您揭开云原生这一神秘面纱。
云原生是一种构建和运行应用程序的方法,充分利用了云平台的弹性、分布式本质以及声明式基础设施。本文将解析云原生的十二要素,微服务架构的优势,以及容器化、持续集成与持续部署(CI/CD)等核心技术的实践应用。通过深入浅出的方式,让读者理解云原生不仅是一种技术,更是一种文化和方法论,它正在重塑软件开发流程,提高资源利用率和应用系统的可扩展性与容错性。