阿里云迎来AI网络领域两大重要突破-阿里云开发者社区

阿里云迎来AI网络领域两大重要突破

2024-05-24 372

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 阿里云迎来AI网络领域两大重要突破

今日，阿里云成功入选超以太网联盟（UEC）技术咨询委员会，成为唯一的中国公司成员，将与微软、Meta、AMD、博通等其他12名成员，共同推进开放网络系统及核心技术的研发及标准制定，打造下一代AI网络基础设施。

此外，网络通信领域国际顶会SIGCOMM2024近期确定收录论文名单，阿里云6篇论文入选。其中，介绍阿里云最新一代的智算集群网络架构HPN 7.0的成果论文，成为SIGCOMM历史上在AI智算集群网络架构领域的首篇论文，专家认为是继谷歌Jupiter经典网络之后的AI网络架构新范式。

新晋入选UEC技术委员会，

牵头制定下一代AI网络架构标准

超以太网联盟UEC (Ultra Ethernet Consortium)是Linux基金会于2023年7月发起发起成立开源组织，致力于打造面向AI时代的超大规模新型网络技术及系统。成立不到一年，UEC已成为当下全球AI基础设施领域最受人关注、发展最迅速的技术联盟。

当前，UEC联盟建立了物理层、链路层、传输层、软件层等8个工作组，推进新兴网络技术研究；同时，UEC联盟特设技术咨询委员会，负责制定技术路线图，把控核心技术及方向，协同推进各小组工作，并统筹所有技术提案及标准制定。

UEC技术委员会是联盟中最核心的技术决策中心，只有技术实力过硬、对开源社区贡献大的会员机构才能入选。微软、Meta、AMD、Intel、博通、思科等10名UEC发起成员，与最新投票选出的阿里云、Enfabrica、Marvell等3名成员，共同组成了新一届UEC技术委员会。

UEC联盟主席梅茨欢迎阿里云等3位技术委员会新成员，他在邮件中表示，在技术委员会的推动和全体成员的努力下，UEC联盟将很快迎来第一个里程碑。

在UEC联盟中，阿里云正牵头推进面向AI需求的网络性能提升项目等技术草案，并持续向成员分享阿里云最新的技术积累和实践。

HPN7.0入选顶会SIGCOMM

AI高性能网络迎来架构新范式

为AI智算集群重新设计的网络架构HPN7.0，即是阿里云在AI高性能网络领域的创新和实践。相关成果论文已被SIGCOMM2024接收录用，成为该国际网络通信顶会历史上首篇关于AI网络架构的论文。

HPN 7.0针对大模型训练场景下规模大、大流多、突发强烈、稳定性需求高的特点，创新性地设计了“双上联+多轨+双平面”的网络架构，并配合最新一代的51.2Tbps单芯片以太网交换机和400G 高性能网卡，自研Solar-RDMA和ACCL通信库，实现了单层千卡、两层万卡的高性能和高稳定互联。

从2023年9 月开始，HPN7.0在阿里云展开大规模部署，大模型训练性能较上一代架构在典型场景下提升14.9%，且大幅提高了智算网络整体稳定性。前不久阿里云发布通义千问2.5版本大模型，中文性能全面赶超GPT-4Turbo，就是基于HPN7.0高性能网络集群训练而成。

阿里云基础设施网络负责人蔡德忠介绍称：“阿里云从2017年开始探索端网融合的可预期网络，HPN7.0更进一步，把端网融合的体系结构从网络协议栈拓展到网络架构和通信库，实现了面向AI智算时代的全新网络集群架构创新。”

阿里云在高性能网络领域已深耕多年，提出了端网融合的可预期网络技术体系，并在业界率先完成RDMA低延时网络、智算集群网络架构HPN 7.0等先进技术的大规模实践。除UEC技术委员会成员身份外，阿里云也是开放网络SONiC社区7个发起成员之一和技术委员会副主席单位。同时阿里巴巴还曾获评AMiner全球十大网络研究机构，是榜单中唯一的中国科技企业。

/ END /

阿里云迎来AI网络领域两大重要突破

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

阿里云迎来AI网络领域两大重要突破

热门文章

最新文章

相关课程

相关电子书

相关实验场景