阿里云首次规模部署LPO光模块

简介: 2024年阿里云基础设施网络团队完成线性可插拔光模块(LPO, Linear Pluggable Optics)规模上线,成为全球首家实现LPO技术规模部署的云服务商。

【阅读原文】戳:阿里云首次规模部署LPO光模块

阿里云全球首次规模部署LPO光模块,

引领AI数据中心网络高效能时代

 


2024年阿里云基础设施网络团队完成线性可插拔光模块(LPO, Linear Pluggable Optics)规模上线,成为全球首家实现LPO技术规模部署的云服务商,本次规模部署的LPO光模块为基于单通道100Gbps的400G DR4光模块,目前已成功支撑多个AI用户长期平稳运行,数据显示LPO光模块和传统光模块在保持同等传输性能和稳定性前提下,能够降低光模块功耗超50%以上。这一突破性技术应用将显著提升AI智算网络的能效,为下一代高性能计算(HPC)和人工智能(AI)负载提供更高效、低碳的基础设施支持。

 

 


技术背景:AI智算网络带宽提升的挑战

 


回顾过去十年数据中心网络演进路线,随着网络带宽不断提升,光模块的功耗上升速度高于交换芯片的功耗上升速度,2019年12.8T交换芯片首次使用50Gbps PAM4调制格式的Serdes,彼时DSP芯片开始在光模块中使用,光模块的功耗开始赶上交换芯片的功耗,未来1.6T/3.2T网络,光的功耗将超过电的功耗2倍以上,功耗问题成为网络带宽提升最大的挑战之一。

 

image.png

 

 


技术突破:LPO破解带宽功耗墙

 


面对这一关键挑战,阿里云选择LPO技术作为突破方向。LPO技术通过ASIC直驱线性光模块,去除传统光模块中的DSP(数字信号处理)芯片,将光模块功耗降低50%以上,同时降低了光模块的成本,减少传输延迟,为AI数据中心提供更高带宽、更低时延的网络连接。

 

image.png

 

image.png

 

 


工程实践:协同攻坚技术难题

 


LPO技术因其具备CPO(Co-Packaged Optic)的低功耗、低时延、低成本等所有优点,并具有可插拔可维护的优势,然而这些技术优势的实现需克服重重的技术挑战,LPO技术面临光电信号完整性、不同厂家间互联互通以及模块生产测试等方面的技术挑战,使各大云厂商望而怯步。阿里云基础设施网络团队持续攻坚各项技术难题,通过交换机和光模块协同设计优化和端到端链路优化,并深入研究LPO和交换机的边界条件,制定了LPO光模块技术标准和生产指南,成功解决了各项技术难题。此次部署的LPO光模块是来自多个模块生产商的多芯片方案,并在AI智算网络中互联互通组网。

 


 

绿色效益:推动可持续发展

 


LPO技术的规模化应用是阿里云践行绿色计算理念的重要里程碑。相比传统方案,单个400G光模块模块功耗降低5W,LPO技术的规模部署可以显著降低数据中心碳排放,从而降低PUE,这与阿里云“绿色AI”战略高度契合,通过底层技术革新助力客户实现高效低碳的算力部署。

 


 

展望未来

 


本次LPO光模块规模部署在保证稳定性的前提下,证明了LPO技术在AI智算网络中可规模部署,并且能够带来显著的能效收益。此次基于400G DR4 LPO技术的应用为未来1.6T/3.2T时代光链路功耗降低提供可能的路径。

 

展望未来,阿里云将持续投入LPO、LRO、CPO等前沿光互联领域的技术创新,推动AI智算中心向更高效、更智能的方向发展。




我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。

欢迎关注 “阿里云基础设施”同名微信微博知乎

获取关于我们的更多信息~

目录
打赏
0
7
7
0
243
分享
相关文章
函数计算发布功能问题之用户在使用主流函数计算产品的日志服务时可能会遇到使用成本的问题如何解决
函数计算发布功能问题之用户在使用主流函数计算产品的日志服务时可能会遇到使用成本的问题如何解决
函数计算产品使用问题之首次启动时间非常长,该怎么优化
函数计算产品作为一种事件驱动的全托管计算服务,让用户能够专注于业务逻辑的编写,而无需关心底层服务器的管理与运维。你可以有效地利用函数计算产品来支撑各类应用场景,从简单的数据处理到复杂的业务逻辑,实现快速、高效、低成本的云上部署与运维。以下是一些关于使用函数计算产品的合集和要点,帮助你更好地理解和应用这一服务。
倚天服务器与X86服务器业务部署差异
倚天服务器是一种基于ARM架构的服务器,与传统的X86服务器在硬件架构、操作系统和软件环境等方面存在一定的差异。本报告将重点从操作系统和软件安装包的版本差异两个方面进行详细说明。
492 56
Serverless 应用引擎产品使用之在使用阿里云函数计算部署网站时,网站打开不稳定如何解决
阿里云Serverless 应用引擎(SAE)提供了完整的微服务应用生命周期管理能力,包括应用部署、服务治理、开发运维、资源管理等功能,并通过扩展功能支持多环境管理、API Gateway、事件驱动等高级应用场景,帮助企业快速构建、部署、运维和扩展微服务架构,实现Serverless化的应用部署与运维模式。以下是对SAE产品使用合集的概述,包括应用管理、服务治理、开发运维、资源管理等方面。
702 1
一、基于Fortinet的出海业务访问加速方案--详细部署步骤
本方案基于CADT提供一个一键交付零配置的部署模板,帮助企业快速构建出海业务访问加速的环境。方案结合了Fortinet产品以及阿里云的ECS,BGP公网精品IP等产品,实现低成本的出海业务加速。
439 0
阿里云推出企业级大模型RAG系统,几次点击即可连接PB级知识库
阿里云推出企业级大模型RAG系统,几次点击即可连接PB级知识库
1758 1
首次公开!阿里云开源PolarDB总体架构和企业级特性
在3月2日的阿里云开源 PolarDB 企业级架构发布会上,阿里云 PolarDB 内核技术专家北侠带来了主题为《PolarDB 总体架构设计和企业级特性》的精彩演讲。
30944 1
首次公开!阿里云开源PolarDB总体架构和企业级特性
无需额外数据,首次实现ImageNet 87.1% 精度,颜水成团队开源VOLO
VOLO 是第一个在 ImageNet 上无需额外数据达到 87.1% top-1 准确率的模型,进一步拉近了视觉 Transformer 与最顶级 CNN 模型的性能距离。
288 0
无需额外数据,首次实现ImageNet 87.1% 精度,颜水成团队开源VOLO
函数计算 GB 镜像秒级启动:下一代软硬件架构协同优化揭秘
本文将介绍借助函数计算下一代 IaaS 底座神龙裸金属和安全容器,进一步降低绝对延迟且能够大幅降低冷启动频率。
函数计算 GB 镜像秒级启动:下一代软硬件架构协同优化揭秘