阿里云迎来AI网络领域两大重要突破

简介: 阿里云迎来AI网络领域两大重要突破


今日,阿里云成功入选超以太网联盟(UEC)技术咨询委员会,成为唯一的中国公司成员,将与微软、Meta、AMD、博通等其他12名成员,共同推进开放网络系统及核心技术的研发及标准制定,打造下一代AI网络基础设施。


此外,网络通信领域国际顶会SIGCOMM2024近期确定收录论文名单,阿里云6篇论文入选。其中,介绍阿里云最新一代的智算集群网络架构HPN 7.0的成果论文成为SIGCOMM历史上在AI智算集群网络架构领域的首篇论文,专家认为是继谷歌Jupiter经典网络之后的AI网络架构新范式



新晋入选UEC技术委员会,

牵头制定下一代AI网络架构标准



超以太网联盟UEC (Ultra Ethernet Consortium)是Linux基金会于2023年7月发起发起成立开源组织,致力于打造面向AI时代的超大规模新型网络技术及系统。成立不到一年,UEC已成为当下全球AI基础设施领域最受人关注、发展最迅速的技术联盟。



当前,UEC联盟建立了物理层、链路层、传输层、软件层等8个工作组,推进新兴网络技术研究;同时,UEC联盟特设技术咨询委员会,负责制定技术路线图,把控核心技术及方向,协同推进各小组工作,并统筹所有技术提案及标准制定。


UEC技术委员会是联盟中最核心的技术决策中心,只有技术实力过硬、对开源社区贡献大的会员机构才能入选。微软、Meta、AMD、Intel、博通、思科等10名UEC发起成员,与最新投票选出的阿里云、Enfabrica、Marvell等3名成员,共同组成了新一届UEC技术委员会。


UEC联盟主席梅茨欢迎阿里云等3位技术委员会新成员,他在邮件中表示,在技术委员会的推动和全体成员的努力下,UEC联盟将很快迎来第一个里程碑。


在UEC联盟中,阿里云正牵头推进面向AI需求的网络性能提升项目等技术草案,并持续向成员分享阿里云最新的技术积累和实践。



HPN7.0入选顶会SIGCOMM

AI高性能网络迎来架构新范式



为AI智算集群重新设计的网络架构HPN7.0,即是阿里云在AI高性能网络领域的创新和实践。相关成果论文已被SIGCOMM2024接收录用,成为该国际网络通信顶会历史上首篇关于AI网络架构的论文。


0e1756609178f6af04002a3ab6a736e9.png


HPN 7.0针对大模型训练场景下规模大、大流多、突发强烈、稳定性需求高的特点,创新性地设计了“双上联+多轨+双平面”的网络架构,并配合最新一代的51.2Tbps单芯片以太网交换机和400G 高性能网卡,自研Solar-RDMA和ACCL通信库,实现了单层千卡、两层万卡的高性能和高稳定互联。


从2023年9 月开始,HPN7.0在阿里云展开大规模部署,大模型训练性能较上一代架构在典型场景下提升14.9%,且大幅提高了智算网络整体稳定性。前不久阿里云发布通义千问2.5版本大模型,中文性能全面赶超GPT-4Turbo,就是基于HPN7.0高性能网络集群训练而成。


阿里云基础设施网络负责人蔡德忠介绍称:“阿里云从2017年开始探索端网融合的可预期网络,HPN7.0更进一步,把端网融合的体系结构从网络协议栈拓展到网络架构和通信库,实现了面向AI智算时代的全新网络集群架构创新。”



阿里云在高性能网络领域已深耕多年,提出了端网融合的可预期网络技术体系,并在业界率先完成RDMA低延时网络、智算集群网络架构HPN 7.0等先进技术的大规模实践。除UEC技术委员会成员身份外,阿里云也是开放网络SONiC社区7个发起成员之一和技术委员会副主席单位。同时阿里巴巴还曾获评AMiner全球十大网络研究机构,是榜单中唯一的中国科技企业。


/ END /

目录
相关文章
|
1月前
|
人工智能 文字识别 监控
|
1月前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI
|
1月前
|
云安全 人工智能 自然语言处理
阿里云x硅基流动:AI安全护栏助力构建可信模型生态
阿里云AI安全护栏:大模型的“智能过滤系统”。
|
1月前
|
人工智能 vr&ar UED
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
|
1月前
|
人工智能 数据处理 API
阿里云、Ververica、Confluent 与 LinkedIn 携手推进流式创新,共筑基于 Apache Flink Agents 的智能体 AI 未来
Apache Flink Agents 是由阿里云、Ververica、Confluent 与 LinkedIn 联合推出的开源子项目,旨在基于 Flink 构建可扩展、事件驱动的生产级 AI 智能体框架,实现数据与智能的实时融合。
330 6
阿里云、Ververica、Confluent 与 LinkedIn 携手推进流式创新,共筑基于 Apache Flink Agents 的智能体 AI 未来
|
1月前
|
机器学习/深度学习 人工智能 Serverless
吉利汽车携手阿里云函数计算,打造新一代 AI 座舱推理引擎
当前吉利汽车研究院人工智能团队承担了吉利汽车座舱 AI 智能化的方案建设,在和阿里云的合作中,基于星睿智算中心 2.0 的 23.5EFLOPS 强大算力,构建 AI 混合云架构,面向百万级用户的实时推理计算引入阿里云函数计算的 Serverless GPU 算力集群,共同为智能座舱的交互和娱乐功能提供大模型推理业务服务,涵盖的场景如针对模糊指令的复杂意图解析、文生图、情感 TTS 等。
|
1月前
|
存储 人工智能 OLAP
AI Agent越用越笨?阿里云AnalyticDB「AI上下文工程」一招破解!
AI 上下文工程是管理大模型输入信息的系统化框架,解决提示工程中的幻觉、上下文溢出与信息冲突等问题。通过上下文的采集、存储、加工与调度,提升AI推理准确性与交互体验。AnalyticDB PostgreSQL 版提供增强 RAG、长记忆、Supabase 等能力,助力企业构建高效、稳定的 AI 应用。
|
1月前
|
机器学习/深度学习 人工智能 算法
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
NBA中国与阿里云达成合作,首发360°实时回放技术,融合AI视觉引擎,实现多视角、低延时、沉浸式观赛新体验,重新定义体育赛事观看方式。
309 0
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
|
1月前
|
弹性计算 安全 应用服务中间件
阿里云渠道商:怎么配置阿里云网络ACL?
阿里云网络ACL是子网级无状态防火墙,支持精准流量控制、规则热生效且免费使用。本文详解5步配置流程,助您实现Web与数据库层的安全隔离,提升云上网络安全。
|
1月前
|
存储 人工智能 OLAP
AI Agent越用越笨?阿里云AnalyticDB「AI上下文工程」一招破解!
AI上下文工程是优化大模型交互的系统化框架,通过管理指令、记忆、知识库等上下文要素,解决信息缺失、长度溢出与上下文失效等问题。依托AnalyticDB等技术,实现上下文的采集、存储、组装与调度,提升AI Agent的准确性与协同效率,助力企业构建高效、稳定的智能应用。