液冷技术再下一城 阿里云三篇论文入选DesignCon 2022

简介: 阿里云三篇液冷技术论文入选DesignCon 2022~


首图-图标.png

“Where the Chip meets the Board!芯片单板一相逢,便胜却技术无数”!4月5日-7日,国际高速电路设计领域顶会DesignCon 2022在美国加州圣塔克拉举行。继去年“基于液冷服务器信号完整性研究”论文首次入选,今年,阿里云基础设施服务器研发团队踔厉奋发,三篇论文入选,研究课题全面覆盖液冷环境下高速互联性能、低成本PCB设计和系统级性能优化等领域,全面验证了阿里云浸没式液冷技术演进方向的可行性,为未来大规模生产部署和商业化应用提供了扎实的理论基础。


lQLPDhtOLlokyUjNAXTNBOiwAvwzyskFKAcCUMPaN8DiAA_1256_372.png

DesignCon被誉为高速通信和半导体行业奥斯卡盛会,是面向高速信号处理和半导体领域芯片、板级和系统设计工程师的全球首屈一指的国际性会议。每年,全球半导体巨擎、学术/行业组织,以及跨界新兴技术创业者汇聚于此,展示和交流该领域最新基础研究进展、技术产品实现和综合解决方案。


DesignCon 2022 涵括三天的技术会议和两天的展览,丰富的议题、最新的技术分享、产品和解决方案展示相信将给与会人员带来一场“行业前沿动态与业界技术潮流”碰撞的技术盛宴!

333.jpg

此次DesignCon的会议环节,覆盖信号和电源完整性、芯片I/O、高速数据链路设计、互连建模和分析、信号处理和编解码等传统技术,以及机器学习和人工智能、5G和通信等新兴应用技术共计13个领域,14个专题分会场,收录超过150个专业论文解读和技术分享。


拥有全球最大规模浸没式液冷数据中心的阿里云,6年来一直走在浸没式液冷技术产研结合前列,瑀瑀前行!今年的DesignCon,阿里云基础设施服务器研发团队进一步全方位展示了在浸没式液冷领域的技术引领力,同时联合上下游、不同领域合作伙伴建立合作关系,瞄准行业痛点,解决液冷技术发展和落地应用带来的全新挑战。阿里云在浸没式液冷领域的开创性战略布局和积累成果,已吸引越来越多的全球同行开始专注于浸没式液冷环境下SI技术研究,通过引领芯片、电路板、连接器、线缆以及系统级全域端到端创新设计,提前两代技术研发布局, 从而构建了液冷产品技术更高的竞争力。


此次入选三篇论文主要涉及领域及概要如下:



/ /

112G-PAM4-QSFP Interconnect: A Study in Air Cooling and Immersion Cooling


背景:随着服务器和交换机性能不断提升, 功耗增加带来的散热问题已引起业界重视,特别是112G及更高的数据传输速率加剧了系统设计工程师、制造商和数据中心所面临的散热挑战,浸没式液冷技术已经被证明是一个行之有效的解决方案。本研究评估了浸没式液冷环境下包括电缆、连接器和电缆组件的112G高速互连系统的性能,并比较了传统的高速互联系统在风冷和浸没式液冷两种环境下的性能差异,以及探讨如何改进基于风冷环境设计的互联系统从而使其可直接应用于浸没式液冷环境。

1.jpg

成果:研究表明,112G PAM4链路对噪声非常敏感,基于风冷设计的112G互连方案直接移植到浸没式液冷环境中时,阻抗发生变化和阻抗不连续性增加,这可能会使112G PAM4链路的性能低于IEEE 800G以太网规范。



/ /

PCB Manufacturing Design Guidelines for Cost Reduction in Immersion Cooling


背景:在传统风冷环境下,导致电子设备故障的四大环境因素主要是高温和宽温波动、相对高湿度、振动以及灰尘腐蚀。浸没式液冷相比较传统风冷技术,通过提供更低、更稳定的工作温度范围(30~50℃),无湿度、无振动和无尘环境,使得浸没式液冷环境下的服务器硬件平均故障率降低50%以上,相关研究成果已经发表在2021年OCP China峰会。


目前,绝大部分用于浸没式液冷的PCB是以满足风冷环境下宽温度和高湿度范围的可靠性要求而设计的。随着越来越多的数据中心采用浸没式液冷技术解决方案,有必要开发一种针对温和浸没式液冷环境下高性能和低成本的PCB制造设计指导方案

2.jpg

成果:建立一个特别适用于浸没式液冷环境下,具有成本竞争力的PCB产品制造设计指南,从而帮助那些采用浸没式液冷解决方案的未来数据中心,实现单位TCO下的最佳性能



/ ③ /

Risks and Enablers of Server Platform Design in Immersion Cooling


背景:浸没式液冷技术越来越多的出现在许多数据中心和边缘计算应用场景中,虽然它为数据中心带来了巨大的能效比,但也对基于传统风冷设计的高速信号总线应用于浸没式液冷环境而带来了新的信号完整性挑战。

3.jpg

成果:本文研究了浸没式液冷环境下DDR4/DDR5接口和高速差分 PCIe Gen5上的信号完整性风险,并提出了由于冷却液体介质变化引起眼图margin退化的改善方法



随着未来算力需求的不断增加,服务器硬件密度、芯片功效及信号速率也在不断逼近极限,此外,国家层面碳中和规划以及数据中心节能减排要求日趋严格对行业的发展提出了更高的要求,服务器浸没式液冷技术俨然已是当前及未来云数据中心首选能效提升解决方案,必将成为阿里巴巴整体ESG战略下减碳工作的“技术先行者”。


从2016年阿里巴巴西溪园区1号楼顶的神秘装置,再到近几年天猫“双11”技术保障中的明星“黑科技”,再到2020年仁和数据中心大规模部署的液冷服务器集群。经过7年多的技术迭代和实践验证,阿里云通过技术创新和产业化,在液冷数据中心解决方案方面走出了一条从实验室到小规模,进而过渡到大规模技术研发与生产应用相结合的路线。一系列技术和实践证明:浸没式液冷具有高能效、高密度、高可靠、高可用的特点,是打开“芯”算力散热瓶颈、支持未来智能算力需求、打造绿色低碳的新型基础设施不可或缺的坚实技术底座!



我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。

欢迎关注 “阿里云基础设施”同名微信微博知乎

获取关于我们的更多信息~ 

相关文章
|
1天前
|
人工智能 计算机视觉 网络架构
OpenAI攻克扩散模型短板,清华校友路橙、宋飏合作最新论文
扩散模型在生成AI领域取得显著成果,但其训练不稳定性和采样速度慢限制了发展。OpenAI与清华校友合作,提出连续时间一致性模型(CMs),通过TrigFlow等创新解决了这些问题,大幅提升了训练稳定性和计算效率,实现了与最优模型相当的样本质量,同时减少了计算资源消耗。
8 2
|
3月前
|
机器学习/深度学习 存储 人工智能
大模型的淘金时代,HPE给出了一份智能经济“奇点”攻略
大模型的淘金时代,HPE给出了一份智能经济“奇点”攻略
大模型的淘金时代,HPE给出了一份智能经济“奇点”攻略
|
3月前
|
SQL 存储 Oracle
"挑战极限!Oracle数据库精英试炼场:夺命连环5问,你能否一路披荆斩棘,登顶技术巅峰?"
【8月更文挑战第9天】Oracle,数据库领域的巨擘,以卓越的数据处理能力、稳定性和安全性成为企业级应用首选。今天我们带来“Oracle夺命连环25问”。首问:核心组件有哪些?答:实例(含内存结构和后台进程)、物理存储(数据文件、控制文件等)及逻辑存储(表空间、段等)。第二问:如何理解事务隔离级别?答:Oracle支持四种级别,默认READ COMMITTED,避免脏读,但可能遇到不可重复读和幻读。
46 0
|
机器学习/深度学习 人工智能 自然语言处理
ICML2023杰出论文大幅减少至6篇,北大、武理工校友获奖,大模型水印受青睐
ICML2023杰出论文大幅减少至6篇,北大、武理工校友获奖,大模型水印受青睐
100 0
ICML2023杰出论文大幅减少至6篇,北大、武理工校友获奖,大模型水印受青睐
|
机器学习/深度学习 人工智能 架构师
谷歌长文总结四代TPU打造经验:里程碑式的TPUv4是怎样炼成的?
谷歌长文总结四代TPU打造经验:里程碑式的TPUv4是怎样炼成的?
357 0
2021年度训练联盟热身训练赛第三场——C,G,I
2021年度训练联盟热身训练赛第三场——C,G,I
91 0
2021年度训练联盟热身训练赛第一场——Weird Flecks, But OK(最小圆覆盖)
2021年度训练联盟热身训练赛第一场——Weird Flecks, But OK(最小圆覆盖)
96 0
|
机器学习/深度学习 人工智能 自然语言处理
明年AI学术会议投稿规模炸裂!注意ICML 2019的这些变化
今日,ICML 2019 程序主席之一 Ruslan Salakhutdinov 教授在 Twitter 上表示为了鼓励可复现性和高质量的论文提交,今年 ICML 的程序委员会在论文提交上作出了三项改变。希望机器之心计划提交 ICML 2019 论文的读者们注意。
260 0
明年AI学术会议投稿规模炸裂!注意ICML 2019的这些变化
|
机器学习/深度学习 人工智能 大数据
再下一城!阿里文娱AI大脑北斗星团队论文入选NIPS 2021
NIPS (Conference and Workshop on Neural Information Processing System) 神经信息处理系统大会是机器学习领域的顶级会议。在NIPS 2021,阿里巴巴文娱AI大脑北斗星团队有一文入选,研究成果属于视觉分类领域。
568 0
再下一城!阿里文娱AI大脑北斗星团队论文入选NIPS 2021
|
人工智能 编解码 达摩院
为拿下算法 “奥斯卡”,阿里团队设计了一个冠军方案
被誉为计算机视觉领域 “奥斯卡” 的 CVPR 刚刚落下帷幕,2021 年首届 “新内容 新交互” 全球视频云创新挑战赛正火热进行中,这两场大赛都不约而同地将关注点放在了视频目标分割领域,本文将详细分享来自阿里达摩院的团队在 CVPR DAVIS 视频目标分割比赛夺冠背后的技术经验,为本届大赛参赛选手提供 “他山之石”。
为拿下算法 “奥斯卡”,阿里团队设计了一个冠军方案