【阅读原文】戳:OSFP MSA发布液冷标准Cage
阿里网络提案OSFP MSA全票通过
开源、开放助力液冷产业发展
2025年4月,阿里云基础设施网络团队提案的分离式OSFP Cage,获得OSFP MSA委员会全票通过,合入OSFP MSA Rev 5.2发布,成为行业首个支持OSFP冷板液冷的Cage标准。分离式Cage凭借低成本、易组装、易维修、产业链分层解耦优势,能解决高密AI交换机的光模块液冷难题。MSA正式发布,意味着全球用户、供应商可基于标准液冷产品设计系统,秉承网络团队的开源、开放理念,助力液冷产业发展。
MSA简介:光模块产业全球企业联盟
MSA(Multi-Source Agreement)是一种多源协议,旨在为光模块提供标准化的接口和规范。MSA组织是光模块产业影响最大的全球性企业联盟之一,汇聚全世界众多互联网用户、芯片、设备、光模块、连接器厂家,所有不同类型光模块相关规范基本由MSA组织规定,如SFP、SFP+、XFP、QSFP、OSFP等。只有经过全球范围用户/厂商充分讨论、一致认可的提案,才能被MSA接纳和发布。
行业难题:光模块冷板液冷
交换机带宽持续增长,导致光模块功耗增长超20多倍,远超风冷散热能力提升速度,风冷、液冷切换拐点越来越近,行业多数观点认为1.6T~3.2T OSFP模块是不同用户选择液冷的临界点。光模块功耗已超过交换芯片功耗,液冷系统如果不能支持光模块液冷,未来就无法解决系统散热和满足节能需求。AI交换机大Radix设计,导致光模块冷板液冷设计挑战很大,详解见:《深度揭秘:下一代液冷AI交换机该是什么样?》,尤其是stack I/O应用。
解决难题:加速液冷AI交换机部署
相比光模块其他的液冷解决方案,阿里提案的分离式OSFP Cage,实现冷板供应商和Cage供应商分层解耦,可以一块冷板覆盖多个底层光模块,成本更低,组装方便。支持flyover和non-flyover两种设计,满足不同场景应用需求。
工程实践:分离式Cage液冷部署
阿里51.2T冷板液冷AI交换机Liquid Tigatron采用分离式Cage,2024年已上线支持多个业务长期稳定运行。基于分离式Cage设计的光模块液冷成本,和光模块风冷成本相当。在实现节能减排的同时,不会带来成本较大上涨,更容易被用户接受。每部署一台液冷Tigatron交换机,机房可多放一颗GPU,集群算力会有相应提升。
总结
液冷-节能减排缓解AI场景的电力瓶颈,液冷-高效冷却解决芯片功耗持续增长的挑战。液冷在可靠性的挑战要比风冷大很多,用户需要尽早进行规模部署积累经验,并提前进行产业布局,才能从容面对即将到来液冷时代。
我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。
获取关于我们的更多信息~