OSFP MSA发布液冷标准Cage

简介: 2025年4月,阿里云基础设施网络团队提案的分离式OSFP cage,获得OSFP MSA委员会全票通过,合入OSFP MSA Rev 5.2 发布,成为行业首个支持OSFP冷板液冷的cage标准。分离式cage凭借低成本、易组装、易维修、产业链分层解耦的优势,能解决高密AI交换机的光模块液冷难题。

【阅读原文】戳:OSFP MSA发布液冷标准Cage

阿里网络提案OSFP MSA全票通过

开源、开放助力液冷产业发展

 

2025年4月,阿里云基础设施网络团队提案的分离式OSFP Cage,获得OSFP MSA委员会全票通过,合入OSFP MSA Rev 5.2发布,成为行业首个支持OSFP冷板液冷的Cage标准。分离式Cage凭借低成本、易组装、易维修、产业链分层解耦优势,能解决高密AI交换机的光模块液冷难题。MSA正式发布,意味着全球用户、供应商可基于标准液冷产品设计系统,秉承网络团队的开源、开放理念,助力液冷产业发展。

 

image.png

 

 

MSA简介:光模块产业全球企业联盟

 

MSA(Multi-Source Agreement)是一种多源协议,旨在为光模块提供标准化的接口和规范。MSA组织是光模块产业影响最大的全球性企业联盟之一,汇聚全世界众多互联网用户、芯片、设备、光模块、连接器厂家,所有不同类型光模块相关规范基本由MSA组织规定,如SFP、SFP+、XFP、QSFP、OSFP等。只有经过全球范围用户/厂商充分讨论、一致认可的提案,才能被MSA接纳和发布。

 

 

行业难题:光模块冷板液冷

 

交换机带宽持续增长,导致光模块功耗增长超20多倍,远超风冷散热能力提升速度,风冷、液冷切换拐点越来越近,行业多数观点认为1.6T~3.2T OSFP模块是不同用户选择液冷的临界点。光模块功耗已超过交换芯片功耗,液冷系统如果不能支持光模块液冷,未来就无法解决系统散热和满足节能需求。AI交换机大Radix设计,导致光模块冷板液冷设计挑战很大,详解见:《深度揭秘:下一代液冷AI交换机该是什么样?》,尤其是stack I/O应用。

 

image.png image.png

 

 

解决难题:加速液冷AI交换机部署

 

相比光模块其他的液冷解决方案,阿里提案的分离式OSFP Cage,实现冷板供应商和Cage供应商分层解耦,可以一块冷板覆盖多个底层光模块,成本更低,组装方便。支持flyover和non-flyover两种设计,满足不同场景应用需求。

 

image.png image.png

 

 

工程实践:分离式Cage液冷部署

 

阿里51.2T冷板液冷AI交换机Liquid Tigatron采用分离式Cage,2024年已上线支持多个业务长期稳定运行。基于分离式Cage设计的光模块液冷成本,和光模块风冷成本相当。在实现节能减排的同时,不会带来成本较大上涨,更容易被用户接受。每部署一台液冷Tigatron交换机,机房可多放一颗GPU,集群算力会有相应提升。

 

image.png image.png image.png image.png

 

 

总结

 

液冷-节能减排缓解AI场景的电力瓶颈,液冷-高效冷却解决芯片功耗持续增长的挑战。液冷在可靠性的挑战要比风冷大很多,用户需要尽早进行规模部署积累经验,并提前进行产业布局,才能从容面对即将到来液冷时代。




我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。

欢迎关注 “阿里云基础设施”同名微信微博知乎

获取关于我们的更多信息~

目录
打赏
0
38
38
1
247
分享
相关文章
关于混合SDN网络的统一信息模型方面研究事件通知的多样性问题
关于混合SDN网络的统一信息模型方面研究事件通知的多样性问题
3GPP标准化九大原则(中) | 带你读《5G UDN(超密集网络)技术详解》之六
未来蜂窝移动业务市场的急速发展,驱使着运营商们在 5G 时代,必须进 行 UDN 部署(至少在局部区域),因此全球范围有许多组织机构和项目,都 在对 5G UDN 和小小区技术进行研究和尝试标准化。
CVPR 2023 | 清华黄高团队提出适配边端和云端的即插即用型高效神经网络网络架构——Slide-Transformer
CVPR 2023 | 清华黄高团队提出适配边端和云端的即插即用型高效神经网络网络架构——Slide-Transformer
810 0
即插即用系列 | 清华提出最新移动端高效网络架构 CloFormer: 注意力机制与卷积的完美融合!
即插即用系列 | 清华提出最新移动端高效网络架构 CloFormer: 注意力机制与卷积的完美融合!
951 0
首次统一卷积与自注意力,上海交大、华为海思提出X-volution,发力网络核心基础架构创新
卷积和自注意力各有优势,但二者的有效结合一直是一大难题。为了取二者之长,上海交大 - 华为海思联合团队提出了一种名为 X-volution 的新型算子。该算子在性能上的显著提升、计算的通用性与即插即用的特性为深度学习基础计算单元库以及 NPU 计算架构的演进提供了一种新的基础武器。
285 0
首次统一卷积与自注意力,上海交大、华为海思提出X-volution,发力网络核心基础架构创新
5G UDN的部署场景 | 带你读《5G UDN(超密集网络)技术详解》之十八
5G UDN 一系列相关技术的研究,都是以具体的部署场景为驱动的,要求 能对各种场景先建模仿真,尽可能反映客观物理环境。计算机模拟仿真处理能 力的巨大提升,使得这一研究方法成为可能。
5G UDN的部署场景 | 带你读《5G UDN(超密集网络)技术详解》之十八
关键技术六:LTE-A LAA 及 LWA 联合互操作 | 带你读《5G UDN(超密集网络)技术详解》之十五
本章节进一步详细解释 LTE 小小区相关的关键技术之六:LTE-A LAA 及 LWA 联合互操作 ,并且关联着说明它们对后续 5G NR 小小区的基线性影响和适用情况。
关键技术六:LTE-A LAA 及 LWA 联合互操作 | 带你读《5G UDN(超密集网络)技术详解》之十五
3GPP标准化九大原则(上) | 带你读《5G UDN(超密集网络)技术详解》之五
未来蜂窝移动业务市场的急速发展,驱使着运营商们在 5G 时代,必须进 行 UDN 部署(至少在局部区域),因此全球范围有许多组织机构和项目,都 在对 5G UDN 和小小区技术进行研究和尝试标准化。
3GPP标准化九大原则(下) | 带你读《5G UDN(超密集网络)技术详解》之七
未来蜂窝移动业务市场的急速发展,驱使着运营商们在 5G 时代,必须进 行 UDN 部署(至少在局部区域),因此全球范围有许多组织机构和项目,都 在对 5G UDN 和小小区技术进行研究和尝试标准化。

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等