边缘服务器“三明治”散热架构诞生记

简介: 边缘服务器“三明治”散热架构诞生记

在延绵百里的崇山峻岭中,边缘算力赋能高压电塔远程智能巡检,守护着电网传输安全,而一旦边缘服务器设备无法抵抗恶劣天气的影响,就会降低电力传输的可靠性,对用电单位造成经济损失。

在石油、天然气的管道钻探场景中,边缘算力正在帮助预警潜在钻探故障,但如果边缘服务器在极端气候环境中“宕机”,会降低油气开采的效率,油气企业损失的将是真金白银。边缘算力的“边缘”两个字其实已经很好的表述了边缘算力会部署到的场景,也意味着边缘服务器有可能会面对雨雪、沙尘、曝晒、严寒等所有恶劣的自然条件。所以,“边缘”也可以是一种“边际”,一种不断挑战极限的技术创新。

1灵魂拷问,为什么要不断挑战极限


第一个灵魂拷问,一台边缘场景下的服务器,为什么要去挑战70度的高温,它的意义何在?Gartner一份报告显示,未来几年,数据所处的位置将会出现翻天覆地的变化,预计到2025年,仅有30%的数据还会运行在本地,运行于公有云的数据会增长到40%,而将有30%的数据会运行在边缘。这意味着,未来将有越来越的数据在边缘处理,越来越多的边缘服务器将遍布于千行百业的系统“末梢”,这些边缘服务器所承担的算力,将会接近于云端的算力总量。乔布斯,曾经跟麦金塔电脑操作系统工程师拉里·凯尼恩抱怨开机启动时间过长。他说,如果有500万人使用Mac,而每天开机都要多用10秒钟,加起来每年都要浪费大约3亿分钟,而3亿分钟相当于至少100个人的终身寿命。凯尼恩听完乔布斯的演示后当时就震惊了,几周过后麦金塔电脑的启动时间缩短了28秒。这个故事告诉我们,当一个产品有了量变的可能,那么质变必然随之而来。对于边缘服务器来说,当行业场景一个又一个被打开,从城市路口的信控箱、电信机房、油井现场的控制箱、边缘电气柜、工业现场控制柜,再到车载环境各类恶劣的环境对边缘服务器的环境适应性、算力性能都提出了很高的要求。

所有的极限挑战,都来自于场景的要求。例如在智慧路口的边缘场景中,由于边缘设备放置在几乎密不透风的信控箱中,夏季最热的时候,如三亚这样的城市信控箱内部最高温度将达到60-70℃,高温很容易让CPU降频甚至宕机,进而拖累整个数字系统。真实的需求产生了,浪潮信息也发现,边缘服务器必须保证在70℃的高温下也不会罢工,才能确保万无一失。


2   细节与匠心 极致表现的三明治散热架构


边缘服务器的散热一直是一个最核心的产品设计难题。由于边缘计算硬件的部署环境,一般比中心服务器的环境要恶劣更加复杂,中心服务器部署在机房,恒温恒湿,有专人管理,而边缘计算硬件部署的环境可能是高温的室外,或者粉尘较大的空间,正因为恶劣的环境,如果通过风扇散热,很容易让灰尘进入系统,损害服务器内部的零部件。这就形成了第二个灵魂拷问:既需要散热,又不能通过风扇实现,那么要如何突破70度的散热极限呢?通常边缘服务器的热量主要来自CPU工作时发热,尤其当CPU高速运作时,温度最高可达90℃,要让90℃高温,在无风的状态下快速传导到大约70℃的环境空气中,就需要在散热上盖和热源之间增加高导热系数的导热材料,让热量快速传递出去,这个思路虽然是对的,但是如何实现则成为了一个新的难题。技术研发陷入僵局之后,一块加班中的三明治,触发了浪潮信息工程师的灵感,也因此催生了三明治散热架构的诞生。

通过模拟三明治一层层食材叠加的逻辑,将服务器散热上盖底部压铸出导热凸台,通过导热凸台与导热界面材料、热源部件依次贴合的结构,就可以排出热源上方的空气,大大消除内部界面热阻。形成了从散热盖、凸台、界面材料到热源的“三明治”式的散热架构。我们知道,三明治的好处在于可以客户口味的不用,调换面包的厚度和食材的样式。所以,采用三明治散热架构的浪潮EIS 800也针对服务器百变的需求,设计了不同的铝挤工艺上盖,让导热凸台、界面材料的位置、大小随着内部器件的变化而变化,实现产品的灵活百变和高效散热。另外,三明治的口感,会因食材的微小差异而发生微妙的变化,如食材厚度,酱汁浓度,蔬菜的新鲜度都会让三明治的味道发生偏移,要打造口感最佳的三明治,就要不断研究调整各项食材的材质和比重。在对三明治散热架构的研究中,浪潮信息研发人员发现,界面材料厚度的微小差异,会影响散热的效率,据仿真模拟数据显示,材料厚度缩小0.6毫米,CPU的温度就可以降低2.1℃,因此,需要在CPU、内存等等部件凸台最小结构公差下,设计出最小厚度的界面材料。经过多次仿真和实测,最终采用高导热和高压缩性的界面材料和凸台填充在热源与散热外壳之间,导热效率达到10W/m·K,是空气导热效率的435倍,让服务器适应的极限环温从原来的60℃提升到67℃。距离70℃的终极要求,仅有3℃之遥。这也是“天堑”一般的三度,要如何去突破呢?除了提升内部的热传导效率,散热工程师还要考虑设备与环境之间如何进行高效的导热,才能实现极限环境的适应。研发人员结合热仿真软件对多组参数组合进行对比分析,并绘制响应面优化曲线,最终确定出一组关于鳍片厚度、间隙和高度的最优组合,在有限体积内形成超过3000cm2的散热面积,达到了最佳散热能力。同时,为了进一步减小上盖散热器内部的扩散热阻,散热上盖中设计了2D热管网络,热管走向经过反复优化仿真,精准布局,有效规避局部热点的产生,提升整机均温能力。终于,一台在无风条件下,70℃极限环境也能高效运转的边缘服务器横空出世,这就是EIS 800。


3 微小的创新可以改变世界


乔布斯曾经说过:“微小的创新可以改变世界”。在边缘服务器小小的“身体”内,围绕散热这个小小的设计,是通过无数次的微小的研究实现的,它的每一次看似微小的进步,都是对细节的完美追求,对产品设计的匠心精神,对客户需求的一丝不苟。

除了针对高温的设计,EIS 800对低温环境的支持同样出色,例如在东北油田,考虑到一些低温条件下电子设备难以启动的情况,边缘服务器设计了低温热启动装置,当环境温度低于-40℃时,自适应调节系统会加热服务器,让内部每一个芯片满足温度要求后再开机启动。正因为如此,在数字经济的延伸到行业纵深的每一个角度,才有了稳定的算力保证,不惧严寒酷暑,不惧高温炙烤,为千行百业的数字化“最后一公里”提供支撑。冰冻三尺非一日之寒。蒲松龄曾经在自己家的道路旁设了茶舍,“见行者过,必强与语,搜奇说异,随人所知”。日复一日,年复一年,最终才有了《聊斋》的诞生。所有行业的目标都是追求卓越,这目标看起来很大,很遥不可及,其实落到实处就是对每一个产品苛求细节,对每一个微小的创新,不断积累。早在2017年起,浪潮信息就投入研发边缘计算服务器,并将其分别放在几个不同的产品部门进行培育,面向每个客户场景的差异化,和每一项边缘服务器技术的创新性不断突破和创新。如去年发布的EIS800系列产品,针对室内、室外和微中心三类计算节点形态,以及各种场景都有针对性的产品设计。据研发测试,在无风扇的EIS800上,三明治架构可将被动散热能力较上一代产品提升近100%。三明治散热架构,显然是浪潮信息在边缘服务器创新之路上,提炼出来的普世价值。通过微小的创新,改变世界,不放弃每一个边缘场景的研究,就是站在客户身后,遵从每一个客户需求的表现。

相关文章
|
5天前
|
弹性计算 负载均衡 Java
【上云基础系列 02-01】通过SLB+1台ECS+ESS弹性伸缩,搭建一个精简版的上云标准弹性架构(含方案及教程)
通常,构建一个弹性架构(即使是一个最基础的入门版),至少需要2台ECS。但是,很多小微企业刚开始上云的时候,为了节省成本不愿意购买更多的服务器。通过 “ALB+ESS弹性伸缩+1台ECS+RDS”方案,在保障低成本的同时,也不牺牲业务架构的弹性设计,更避免了很多人因为节省成本选择了单体架构后频繁改造架构的困局。 方案中的几个设计非常值得小微企业借鉴:(1)通过ALB/RDS的按量付费,节省了初期流量不大时的费用;(2)通过ESS弹性伸缩,不需要提前购买服务器资源,但是当业务增长或减少时却保持了资源弹性自动扩缩容。
|
5天前
|
存储 人工智能 并行计算
2025年阿里云弹性裸金属服务器架构解析与资源配置方案
🚀 核心特性与技术创新:提供100%物理机性能输出,支持NVIDIA A100/V100 GPU直通,无虚拟化层损耗。网络与存储优化,400万PPS吞吐量,ESSD云盘IOPS达100万,RDMA延迟<5μs。全球部署覆盖华北、华东、华南及海外节点,支持跨地域负载均衡。典型应用场景包括AI训练、科学计算等,支持分布式训练和并行计算框架。弹性裸金属服务器+OSS存储+高速网络综合部署,满足高性能计算需求。
|
1月前
|
机器学习/深度学习 弹性计算 人工智能
阿里云服务器ECS架构区别及选择参考:X86计算、ARM计算等架构介绍
在我们选购阿里云服务器的时候,云服务器架构有X86计算、ARM计算、GPU/FPGA/ASIC、弹性裸金属服务器、高性能计算可选,有的用户并不清楚他们之间有何区别,本文主要简单介绍下这些架构各自的主要性能及适用场景,以便大家了解不同类型的架构有何不同,主要特点及适用场景有哪些。
141 10
|
1月前
|
存储 人工智能 运维
面向AI的服务器计算软硬件架构实践和创新
阿里云在新一代通用计算服务器设计中,针对处理器核心数迅速增长(2024年超100核)、超多核心带来的业务和硬件挑战、网络IO与CPU性能增速不匹配、服务器物理机型复杂等问题,推出了磐久F系列通用计算服务器。该系列服务器采用单路设计减少爆炸半径,优化散热支持600瓦TDP,并实现CIPU节点比例灵活配比及部件模块化可插拔设计,提升运维效率和客户响应速度。此外,还介绍了面向AI的服务器架构挑战与软硬件结合创新,包括内存墙问题、板级工程能力挑战以及AI Infra 2.0服务器的开放架构特点。最后,探讨了大模型高效推理中的显存优化和量化压缩技术,旨在降低部署成本并提高系统效率。
|
3月前
|
机器学习/深度学习 弹性计算 人工智能
阿里云服务器架构有啥区别?X86计算、Arm、GPU异构、裸金属和高性能计算对比
阿里云ECS涵盖x86、ARM、GPU/FPGA/ASIC、弹性裸金属及高性能计算等多种架构。x86架构采用Intel/AMD处理器,适用于广泛企业级应用;ARM架构低功耗,适合容器与微服务;GPU/FPGA/ASIC专为AI、图形处理设计;弹性裸金属提供物理机性能;高性能计算则针对大规模并行计算优化。
150 7
|
3月前
|
存储 缓存 弹性计算
Codota的服务器存储架构
Codota的服务器存储架构
51 5
|
4月前
|
监控 网络协议 安全
DNS服务器故障不容小觑,从应急视角谈DNS架构
DNS服务器故障不容小觑,从应急视角谈DNS架构
97 4
|
4月前
|
机器学习/深度学习 监控 Serverless
无服务器架构(Serverless)
无服务器架构(Serverless)
137 4
|
2月前
|
弹性计算 API 持续交付
后端服务架构的微服务化转型
本文旨在探讨后端服务从单体架构向微服务架构转型的过程,分析微服务架构的优势和面临的挑战。文章首先介绍单体架构的局限性,然后详细阐述微服务架构的核心概念及其在现代软件开发中的应用。通过对比两种架构,指出微服务化转型的必要性和实施策略。最后,讨论了微服务架构实施过程中可能遇到的问题及解决方案。
|
3月前
|
Cloud Native Devops 云计算
云计算的未来:云原生架构与微服务的革命####
【10月更文挑战第21天】 随着企业数字化转型的加速,云原生技术正迅速成为IT行业的新宠。本文深入探讨了云原生架构的核心理念、关键技术如容器化和微服务的优势,以及如何通过这些技术实现高效、灵活且可扩展的现代应用开发。我们将揭示云原生如何重塑软件开发流程,提升业务敏捷性,并探索其对企业IT架构的深远影响。 ####
82 3