“Where the Chip meets the Board!芯片单板一相逢,便胜却技术无数”!4月5日-7日,国际高速电路设计领域顶会DesignCon 2022在美国加州圣塔克拉举行。继去年“基于液冷服务器信号完整性研究”论文首次入选,今年,阿里云基础设施服务器研发团队踔厉奋发,三篇论文入选,研究课题全面覆盖液冷环境下高速互联性能、低成本PCB设计和系统级性能优化等领域,全面验证了阿里云浸没式液冷技术演进方向的可行性,为未来大规模生产部署和商业化应用提供了扎实的理论基础。
DesignCon被誉为高速通信和半导体行业的奥斯卡盛会,是面向高速信号处理和半导体领域芯片、板级和系统设计工程师的全球首屈一指的国际性会议。每年,全球半导体巨擎、学术/行业组织,以及跨界新兴技术创业者汇聚于此,展示和交流该领域最新基础研究进展、技术产品实现和综合解决方案。
DesignCon 2022 涵括三天的技术会议和两天的展览,丰富的议题、最新的技术分享、产品和解决方案展示相信将给与会人员带来一场“行业前沿动态与业界技术潮流”碰撞的技术盛宴!
此次DesignCon的会议环节,覆盖信号和电源完整性、芯片I/O、高速数据链路设计、互连建模和分析、信号处理和编解码等传统技术,以及机器学习和人工智能、5G和通信等新兴应用技术共计13个领域,14个专题分会场,收录超过150个专业论文解读和技术分享。
拥有全球最大规模浸没式液冷数据中心的阿里云,6年来一直走在浸没式液冷技术产研结合前列,瑀瑀前行!今年的DesignCon,阿里云基础设施服务器研发团队进一步全方位展示了在浸没式液冷领域的技术引领力,同时联合上下游、不同领域合作伙伴建立合作关系,瞄准行业痛点,解决液冷技术发展和落地应用带来的全新挑战。阿里云在浸没式液冷领域的开创性战略布局和积累成果,已吸引越来越多的全球同行开始专注于浸没式液冷环境下SI技术研究,通过引领芯片、电路板、连接器、线缆以及系统级全域端到端创新设计,提前两代技术研发布局, 从而构建了液冷产品技术更高的竞争力。
此次入选三篇论文主要涉及领域及概要如下:
/ ① /
112G-PAM4-QSFP Interconnect: A Study in Air Cooling and Immersion Cooling
背景:随着服务器和交换机性能不断提升, 功耗增加带来的散热问题已引起业界重视,特别是112G及更高的数据传输速率加剧了系统设计工程师、制造商和数据中心所面临的散热挑战,浸没式液冷技术已经被证明是一个行之有效的解决方案。本研究评估了浸没式液冷环境下包括电缆、连接器和电缆组件的112G高速互连系统的性能,并比较了传统的高速互联系统在风冷和浸没式液冷两种环境下的性能差异,以及探讨如何改进基于风冷环境设计的互联系统从而使其可直接应用于浸没式液冷环境。
成果:研究表明,112G PAM4链路对噪声非常敏感,基于风冷设计的112G互连方案直接移植到浸没式液冷环境中时,阻抗发生变化和阻抗不连续性增加,这可能会使112G PAM4链路的性能低于IEEE 800G以太网规范。
/ ② /
PCB Manufacturing Design Guidelines for Cost Reduction in Immersion Cooling
背景:在传统风冷环境下,导致电子设备故障的四大环境因素主要是高温和宽温波动、相对高湿度、振动以及灰尘腐蚀。浸没式液冷相比较传统风冷技术,通过提供更低、更稳定的工作温度范围(30~50℃),无湿度、无振动和无尘环境,使得浸没式液冷环境下的服务器硬件平均故障率降低50%以上,相关研究成果已经发表在2021年OCP China峰会。
目前,绝大部分用于浸没式液冷的PCB是以满足风冷环境下宽温度和高湿度范围的可靠性要求而设计的。随着越来越多的数据中心采用浸没式液冷技术解决方案,有必要开发一种针对温和浸没式液冷环境下高性能和低成本的PCB制造设计指导方案。
成果:建立一个特别适用于浸没式液冷环境下,具有成本竞争力的PCB产品制造设计指南,从而帮助那些采用浸没式液冷解决方案的未来数据中心,实现单位TCO下的最佳性能。
/ ③ /
Risks and Enablers of Server Platform Design in Immersion Cooling
背景:浸没式液冷技术越来越多的出现在许多数据中心和边缘计算应用场景中,虽然它为数据中心带来了巨大的能效比,但也对基于传统风冷设计的高速信号总线应用于浸没式液冷环境而带来了新的信号完整性挑战。
成果:本文研究了浸没式液冷环境下DDR4/DDR5接口和高速差分 PCIe Gen5上的信号完整性风险,并提出了由于冷却液体介质变化引起眼图margin退化的改善方法。
随着未来算力需求的不断增加,服务器硬件密度、芯片功效及信号速率也在不断逼近极限,此外,国家层面碳中和规划以及数据中心节能减排要求日趋严格对行业的发展提出了更高的要求,服务器浸没式液冷技术俨然已是当前及未来云数据中心首选能效提升解决方案,必将成为阿里巴巴整体ESG战略下减碳工作的“技术先行者”。
从2016年阿里巴巴西溪园区1号楼顶的神秘装置,再到近几年天猫“双11”技术保障中的明星“黑科技”,再到2020年仁和数据中心大规模部署的液冷服务器集群。经过7年多的技术迭代和实践验证,阿里云通过技术创新和产业化,在液冷数据中心解决方案方面走出了一条从实验室到小规模,进而过渡到大规模技术研发与生产应用相结合的路线。一系列技术和实践证明:浸没式液冷具有高能效、高密度、高可靠、高可用的特点,是打开“芯”算力散热瓶颈、支持未来智能算力需求、打造绿色低碳的新型基础设施不可或缺的坚实技术底座!
我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。