阿里云首次规模部署LPO光模块

简介: 2024年阿里云基础设施网络团队完成线性可插拔光模块(LPO, Linear Pluggable Optics)规模上线,成为全球首家实现LPO技术规模部署的云服务商。

【阅读原文】戳:阿里云首次规模部署LPO光模块

阿里云全球首次规模部署LPO光模块,

引领AI数据中心网络高效能时代

 


2024年阿里云基础设施网络团队完成线性可插拔光模块(LPO, Linear Pluggable Optics)规模上线,成为全球首家实现LPO技术规模部署的云服务商,本次规模部署的LPO光模块为基于单通道100Gbps的400G DR4光模块,目前已成功支撑多个AI用户长期平稳运行,数据显示LPO光模块和传统光模块在保持同等传输性能和稳定性前提下,能够降低光模块功耗超50%以上。这一突破性技术应用将显著提升AI智算网络的能效,为下一代高性能计算(HPC)和人工智能(AI)负载提供更高效、低碳的基础设施支持。

 

 


技术背景:AI智算网络带宽提升的挑战

 


回顾过去十年数据中心网络演进路线,随着网络带宽不断提升,光模块的功耗上升速度高于交换芯片的功耗上升速度,2019年12.8T交换芯片首次使用50Gbps PAM4调制格式的Serdes,彼时DSP芯片开始在光模块中使用,光模块的功耗开始赶上交换芯片的功耗,未来1.6T/3.2T网络,光的功耗将超过电的功耗2倍以上,功耗问题成为网络带宽提升最大的挑战之一。

 

image.png

 

 


技术突破:LPO破解带宽功耗墙

 


面对这一关键挑战,阿里云选择LPO技术作为突破方向。LPO技术通过ASIC直驱线性光模块,去除传统光模块中的DSP(数字信号处理)芯片,将光模块功耗降低50%以上,同时降低了光模块的成本,减少传输延迟,为AI数据中心提供更高带宽、更低时延的网络连接。

 

image.png

 

image.png

 

 


工程实践:协同攻坚技术难题

 


LPO技术因其具备CPO(Co-Packaged Optic)的低功耗、低时延、低成本等所有优点,并具有可插拔可维护的优势,然而这些技术优势的实现需克服重重的技术挑战,LPO技术面临光电信号完整性、不同厂家间互联互通以及模块生产测试等方面的技术挑战,使各大云厂商望而怯步。阿里云基础设施网络团队持续攻坚各项技术难题,通过交换机和光模块协同设计优化和端到端链路优化,并深入研究LPO和交换机的边界条件,制定了LPO光模块技术标准和生产指南,成功解决了各项技术难题。此次部署的LPO光模块是来自多个模块生产商的多芯片方案,并在AI智算网络中互联互通组网。

 


 

绿色效益:推动可持续发展

 


LPO技术的规模化应用是阿里云践行绿色计算理念的重要里程碑。相比传统方案,单个400G光模块模块功耗降低5W,LPO技术的规模部署可以显著降低数据中心碳排放,从而降低PUE,这与阿里云“绿色AI”战略高度契合,通过底层技术革新助力客户实现高效低碳的算力部署。

 


 

展望未来

 


本次LPO光模块规模部署在保证稳定性的前提下,证明了LPO技术在AI智算网络中可规模部署,并且能够带来显著的能效收益。此次基于400G DR4 LPO技术的应用为未来1.6T/3.2T时代光链路功耗降低提供可能的路径。

 

展望未来,阿里云将持续投入LPO、LRO、CPO等前沿光互联领域的技术创新,推动AI智算中心向更高效、更智能的方向发展。




我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。

欢迎关注 “阿里云基础设施”同名微信微博知乎

获取关于我们的更多信息~

相关文章
|
5月前
|
人工智能 光互联 数据中心
横跨半世纪的光通讯巅峰盛会OFC落幕,阿里云在全球光通信顶会OFC2025上发表多个创新成果和报告
​2025年3月,全球光通讯领域最具标杆意义的年度盛会——OFC(光纤通信学术会议暨展览会)迎来其50周年里程碑,在美国加州旧金山盛大开幕。来自全球83个国家和地区,约17000名专家、学者、企业和政府人员齐聚美国,共同融入这场知识与思想的盛会。
|
5月前
|
存储 双11 数据中心
数据中心网络关键技术,技术发明一等奖!
近日,阿里云联合清华大学与中国移动申报的“性能可预期的大规模数据中心网络关键技术与应用”项目荣获中国电子学会技术发明一等奖。该项目通过端网融合架构,实现数据中心网络性能的可预期性,在带宽保障、时延控制和故障恢复速度上取得重大突破,显著提升服务质量。成果已应用于阿里云多项产品及重大社会活动中,如巴黎奥运会直播、“双十一”购物节等,展现出国际领先水平。
|
7月前
2024阿里云技术年报 基础设施篇
2024阿里云技术年报 基础设施篇
172 11
|
1月前
|
人工智能 运维 安全
重塑 AI 算力底座!阿里云服务器操作系统 V4 正式发布
Alinux 4不仅是技术突破,更是产业变革的催化剂。
|
4月前
|
存储 人工智能 弹性计算
飞天发布时刻丨阿里云基础设施助力企业全球化业务创新
丰富灵活的算力服务、稳定高可用的存储产品,覆盖了出海企业 AI 创新、 大数据分析、 应用管理和办公协同等不同场景和需求,助力客户业务全球化布局。
|
5月前
|
存储 人工智能 安全
AI 驱动下的阿里云基础设施:技术创新与产品演进
本文整理自阿里云智能集团副总裁、阿里云弹性计算产品线与存储产品线负责人吴结生在“2025 AI势能大会”上的演讲,重点介绍了阿里云在AI基础设施领域的技术创新与产品演进。内容涵盖CIPU架构、盘古存储系统、高性能网络HPN等关键技术,以及第九代英特尔企业实例、ESSD同城冗余云盘等新产品发布。同时,文章详细阐述了灵骏集群的优化措施和可观测能力的提升,展示阿里云如何通过持续创新为AI负载提供强大支持,助力企业在AI时代实现智能化转型。
AI 驱动下的阿里云基础设施:技术创新与产品演进
|
8月前
|
人工智能 网络协议 数据中心
阿里云基础设施网络2024年创新总结
本文将盘点阿里云基础设施网络团队2024年在AI时代可预期网络的技术突破、学术成果、开源生态共建与重要会议技术布道等,与业界同仁一同探讨和展望AI时代的网络技术发展热点和趋势。
阿里云基础设施网络2024年创新总结
|
5月前
|
人工智能 大数据 云计算
OSFP MSA发布液冷标准Cage
2025年4月,阿里云基础设施网络团队提案的分离式OSFP cage,获得OSFP MSA委员会全票通过,合入OSFP MSA Rev 5.2 发布,成为行业首个支持OSFP冷板液冷的cage标准。分离式cage凭借低成本、易组装、易维修、产业链分层解耦的优势,能解决高密AI交换机的光模块液冷难题。
|
11月前
|
人工智能 关系型数据库 数据中心
2024 OCP全球峰会:阿里云为代表的中国企业,引领全球AI网络合作和技术创新
今年的OCP(Open Compute Project)峰会于2024年10月14日至17日在美国加州圣何塞举行,在这场全球瞩目的盛会上,以阿里云为代表的中国企业,展示了他们在AI网络架构、液冷技术、SRv6和广域网等前沿领域的强大创新能力,持续引领全球合作与技术创新。
|
7月前
|
人工智能 Cloud Native 安全
AI云全面支撑大模型落地!一文看完2025企业用云十大趋势
AI云全面支撑大模型落地!一文看完2025企业用云十大趋势
580 1

热门文章

最新文章