边缘服务器“三明治”散热架构诞生记

简介: 边缘服务器“三明治”散热架构诞生记

在延绵百里的崇山峻岭中,边缘算力赋能高压电塔远程智能巡检,守护着电网传输安全,而一旦边缘服务器设备无法抵抗恶劣天气的影响,就会降低电力传输的可靠性,对用电单位造成经济损失。

在石油、天然气的管道钻探场景中,边缘算力正在帮助预警潜在钻探故障,但如果边缘服务器在极端气候环境中“宕机”,会降低油气开采的效率,油气企业损失的将是真金白银。边缘算力的“边缘”两个字其实已经很好的表述了边缘算力会部署到的场景,也意味着边缘服务器有可能会面对雨雪、沙尘、曝晒、严寒等所有恶劣的自然条件。所以,“边缘”也可以是一种“边际”,一种不断挑战极限的技术创新。

1灵魂拷问,为什么要不断挑战极限


第一个灵魂拷问,一台边缘场景下的服务器,为什么要去挑战70度的高温,它的意义何在?Gartner一份报告显示,未来几年,数据所处的位置将会出现翻天覆地的变化,预计到2025年,仅有30%的数据还会运行在本地,运行于公有云的数据会增长到40%,而将有30%的数据会运行在边缘。这意味着,未来将有越来越的数据在边缘处理,越来越多的边缘服务器将遍布于千行百业的系统“末梢”,这些边缘服务器所承担的算力,将会接近于云端的算力总量。乔布斯,曾经跟麦金塔电脑操作系统工程师拉里·凯尼恩抱怨开机启动时间过长。他说,如果有500万人使用Mac,而每天开机都要多用10秒钟,加起来每年都要浪费大约3亿分钟,而3亿分钟相当于至少100个人的终身寿命。凯尼恩听完乔布斯的演示后当时就震惊了,几周过后麦金塔电脑的启动时间缩短了28秒。这个故事告诉我们,当一个产品有了量变的可能,那么质变必然随之而来。对于边缘服务器来说,当行业场景一个又一个被打开,从城市路口的信控箱、电信机房、油井现场的控制箱、边缘电气柜、工业现场控制柜,再到车载环境各类恶劣的环境对边缘服务器的环境适应性、算力性能都提出了很高的要求。

所有的极限挑战,都来自于场景的要求。例如在智慧路口的边缘场景中,由于边缘设备放置在几乎密不透风的信控箱中,夏季最热的时候,如三亚这样的城市信控箱内部最高温度将达到60-70℃,高温很容易让CPU降频甚至宕机,进而拖累整个数字系统。真实的需求产生了,浪潮信息也发现,边缘服务器必须保证在70℃的高温下也不会罢工,才能确保万无一失。


2   细节与匠心 极致表现的三明治散热架构


边缘服务器的散热一直是一个最核心的产品设计难题。由于边缘计算硬件的部署环境,一般比中心服务器的环境要恶劣更加复杂,中心服务器部署在机房,恒温恒湿,有专人管理,而边缘计算硬件部署的环境可能是高温的室外,或者粉尘较大的空间,正因为恶劣的环境,如果通过风扇散热,很容易让灰尘进入系统,损害服务器内部的零部件。这就形成了第二个灵魂拷问:既需要散热,又不能通过风扇实现,那么要如何突破70度的散热极限呢?通常边缘服务器的热量主要来自CPU工作时发热,尤其当CPU高速运作时,温度最高可达90℃,要让90℃高温,在无风的状态下快速传导到大约70℃的环境空气中,就需要在散热上盖和热源之间增加高导热系数的导热材料,让热量快速传递出去,这个思路虽然是对的,但是如何实现则成为了一个新的难题。技术研发陷入僵局之后,一块加班中的三明治,触发了浪潮信息工程师的灵感,也因此催生了三明治散热架构的诞生。

通过模拟三明治一层层食材叠加的逻辑,将服务器散热上盖底部压铸出导热凸台,通过导热凸台与导热界面材料、热源部件依次贴合的结构,就可以排出热源上方的空气,大大消除内部界面热阻。形成了从散热盖、凸台、界面材料到热源的“三明治”式的散热架构。我们知道,三明治的好处在于可以客户口味的不用,调换面包的厚度和食材的样式。所以,采用三明治散热架构的浪潮EIS 800也针对服务器百变的需求,设计了不同的铝挤工艺上盖,让导热凸台、界面材料的位置、大小随着内部器件的变化而变化,实现产品的灵活百变和高效散热。另外,三明治的口感,会因食材的微小差异而发生微妙的变化,如食材厚度,酱汁浓度,蔬菜的新鲜度都会让三明治的味道发生偏移,要打造口感最佳的三明治,就要不断研究调整各项食材的材质和比重。在对三明治散热架构的研究中,浪潮信息研发人员发现,界面材料厚度的微小差异,会影响散热的效率,据仿真模拟数据显示,材料厚度缩小0.6毫米,CPU的温度就可以降低2.1℃,因此,需要在CPU、内存等等部件凸台最小结构公差下,设计出最小厚度的界面材料。经过多次仿真和实测,最终采用高导热和高压缩性的界面材料和凸台填充在热源与散热外壳之间,导热效率达到10W/m·K,是空气导热效率的435倍,让服务器适应的极限环温从原来的60℃提升到67℃。距离70℃的终极要求,仅有3℃之遥。这也是“天堑”一般的三度,要如何去突破呢?除了提升内部的热传导效率,散热工程师还要考虑设备与环境之间如何进行高效的导热,才能实现极限环境的适应。研发人员结合热仿真软件对多组参数组合进行对比分析,并绘制响应面优化曲线,最终确定出一组关于鳍片厚度、间隙和高度的最优组合,在有限体积内形成超过3000cm2的散热面积,达到了最佳散热能力。同时,为了进一步减小上盖散热器内部的扩散热阻,散热上盖中设计了2D热管网络,热管走向经过反复优化仿真,精准布局,有效规避局部热点的产生,提升整机均温能力。终于,一台在无风条件下,70℃极限环境也能高效运转的边缘服务器横空出世,这就是EIS 800。


3 微小的创新可以改变世界


乔布斯曾经说过:“微小的创新可以改变世界”。在边缘服务器小小的“身体”内,围绕散热这个小小的设计,是通过无数次的微小的研究实现的,它的每一次看似微小的进步,都是对细节的完美追求,对产品设计的匠心精神,对客户需求的一丝不苟。

除了针对高温的设计,EIS 800对低温环境的支持同样出色,例如在东北油田,考虑到一些低温条件下电子设备难以启动的情况,边缘服务器设计了低温热启动装置,当环境温度低于-40℃时,自适应调节系统会加热服务器,让内部每一个芯片满足温度要求后再开机启动。正因为如此,在数字经济的延伸到行业纵深的每一个角度,才有了稳定的算力保证,不惧严寒酷暑,不惧高温炙烤,为千行百业的数字化“最后一公里”提供支撑。冰冻三尺非一日之寒。蒲松龄曾经在自己家的道路旁设了茶舍,“见行者过,必强与语,搜奇说异,随人所知”。日复一日,年复一年,最终才有了《聊斋》的诞生。所有行业的目标都是追求卓越,这目标看起来很大,很遥不可及,其实落到实处就是对每一个产品苛求细节,对每一个微小的创新,不断积累。早在2017年起,浪潮信息就投入研发边缘计算服务器,并将其分别放在几个不同的产品部门进行培育,面向每个客户场景的差异化,和每一项边缘服务器技术的创新性不断突破和创新。如去年发布的EIS800系列产品,针对室内、室外和微中心三类计算节点形态,以及各种场景都有针对性的产品设计。据研发测试,在无风扇的EIS800上,三明治架构可将被动散热能力较上一代产品提升近100%。三明治散热架构,显然是浪潮信息在边缘服务器创新之路上,提炼出来的普世价值。通过微小的创新,改变世界,不放弃每一个边缘场景的研究,就是站在客户身后,遵从每一个客户需求的表现。

相关文章
|
29天前
|
运维 监控 负载均衡
深入理解无服务器架构:优势与挑战
【10月更文挑战第6天】深入理解无服务器架构:优势与挑战
|
16天前
|
监控 网络协议 安全
DNS服务器故障不容小觑,从应急视角谈DNS架构
DNS服务器故障不容小觑,从应急视角谈DNS架构
38 4
|
16天前
|
机器学习/深度学习 监控 Serverless
无服务器架构(Serverless)
无服务器架构(Serverless)
|
22天前
|
存储 固态存储 安全
阿里云服务器X86计算架构解析与X86计算架构云服务器收费价格参考
阿里云服务器架构分为X86计算、Arm计算、高性能计算等多种架构,其中X86计算是用户选择最多的一种架构,本文将深入探讨阿里云X86计算架构的云服务器,包括其技术特性、适用场景、性能优势以及最新价格情况。
|
23天前
|
编解码 弹性计算 应用服务中间件
阿里云服务器Arm计算架构解析:Arm计算架构云服务器租用收费标准价格参考
阿里云服务器架构分为X86计算、Arm计算、高性能计算等多种架构,其中Arm计算架构以其低功耗、高效率的特点受到广泛关注。本文将深入解析阿里云Arm计算架构云服务器的技术特点、适用场景以及包年包月与按量付费的收费标准与最新活动价格情况,以供选择参考。
|
1月前
|
监控 Serverless 云计算
探索Serverless架构:无服务器计算的新纪元
Serverless架构作为云计算的新范式,让开发者无需管理服务器即可构建和运行应用,从而专注于代码开发。其核心优势包括成本效益、自动扩展及高效部署。通过事件驱动模型和微服务部署,开发者按需付费,减少了资源浪费。尽管面临冷启动、状态管理和调试等挑战,Serverless架构仍凭借其高效性与可扩展性展现出广阔的应用前景。流行平台如AWS Lambda、Azure Functions等使其实施更为便捷。
|
1月前
|
存储 SQL 消息中间件
Hadoop-26 ZooKeeper集群 3台云服务器 基础概念简介与环境的配置使用 架构组成 分布式协调框架 Leader Follower Observer
Hadoop-26 ZooKeeper集群 3台云服务器 基础概念简介与环境的配置使用 架构组成 分布式协调框架 Leader Follower Observer
44 0
|
6天前
|
弹性计算
阿里云2核16G服务器多少钱一年?亲测价格查询1个月和1小时收费标准
阿里云2核16G服务器提供多种ECS实例规格,内存型r8i实例1年6折优惠价为1901元,按月收费334.19元,按小时收费0.696221元。更多规格及详细报价请访问阿里云ECS页面。
39 9
|
3天前
|
监控 Ubuntu Linux
使用VSCode通过SSH远程登录阿里云Linux服务器异常崩溃
通过 VSCode 的 Remote - SSH 插件远程连接阿里云 Ubuntu 22 服务器时,会因高 CPU 使用率导致连接断开。经排查发现,VSCode 连接根目录 ".." 时会频繁调用"rg"(ripgrep)进行文件搜索,导致 CPU 负载过高。解决方法是将连接目录改为"root"(或其他具体的路径),避免不必要的文件检索,从而恢复正常连接。
|
6天前
|
弹性计算 异构计算
2024年阿里云GPU服务器多少钱1小时?亲测价格查询方法
2024年阿里云GPU服务器每小时收费因实例规格不同而异。可通过阿里云GPU服务器页面选择“按量付费”查看具体价格。例如,NVIDIA A100的gn7e实例为34.742元/小时,NVIDIA A10的gn7i实例为12.710156元/小时。更多详情请访问阿里云官网。
40 2