超大规模云网络技术新突破!阿里云斩获中国自动化学会科技进步一等奖

简介: 阿里云携手浙江大学、上海交大联合攻坚的超大规模云网络技术及应用成果,斩获中国自动化学会(CAA)科技进步奖一等奖。该成果实现了超大规模云网络调控技术的高性能突破,将十万级任务配置下发提升至秒级的超高水平,填补了该项技术的国内空白。


中国自动化学会近日公布了2023年度科学技术奖获奖名单,阿里云携手浙江大学、上海交大联合攻坚的超大规模云网络技术及应用成果,斩获中国自动化学会(CAA)科技进步奖一等奖。该成果实现了超大规模云网络调控技术的高性能突破,将十万级任务配置下发提升至秒级的超高水平,填补了该项技术的国内空白。由院士和专家组成的科技成果鉴定委员会评价本技术:该项目技术复杂,研制难度大,技术创新性强,是我国在云计算网络领域赶超世界先进水平、构建自主生态的成功实践和重大成果。

 

图|阿里云斩获中国自动化学会(CAA)科技进步奖一等奖

 

 

 

奖项介绍

 

 

中国自动化学会(CAA)是中国最早成立的国家一级学术群众团体之一,于1961年由著名航天科学家,中国科学院、中国工程院资深院士钱学森创立,每年评选一次CAA科学技术奖,包括科技进步奖、自然科学奖和技术发明奖等,其中优秀成果可进一步推荐进入国家科技进步奖评审,奖项意义重大。其中,CAA科技进步奖需满足技术创新性突出、经济效益或者社会效益显著、推动行业科技进步作用明显等条件,是我国自动化领域最权威的奖项之一。

 

 

研究背景

 

 

随着大模型的出现,AI技术迎来了新的一轮爆发,随之而来的是AI技术“三要素”算法、算力以及数据的激增。相比传统应用,AI技术从模型训练到实时推理都会带来海量的数据流动,而如何确保这些数据在网络中高效高质按需的传输,需要一套超大规模超高性能的网络控制技术。然而,网络控制技术,尤其是大规模云计算网络控制的关键技术,早期由国外高校及企业提出,并长期由国外厂商和机构垄断。为此,阿里云联合浙江大学以及上海交通大学历经10余年,打造了超大规模云网络新型超高性能调控关键技术,并且在阿里云大规模部署应用,相关成果发表在国际网络领域旗舰会议NSDI(Networked Systems Design and Implementation)上,打破了该领域在学术界以及工业界的垄断。

 

 

技术突破

 

 

针对AI训练高吞吐、AI推理高实时以及AI应用迭代快的要求,本项目以智能动态为核心指导思想,针对性地开展超高性能云计算网络调控系统及应用研究。

 

1. 创新提出海量网络数据管理平台,可实现网络数据高性能写入、存储以及查询,大幅提升系统决策效率;

 

2. 设计毫秒级高性能配置演算引擎,实现动态复杂网络配置的实时演算;

 

3. 提出大规模高可靠配置下发技术,大幅提升十万级大规模任务配置效率,做到秒级下发、分钟级校验;

 

4. 引入多模态网络异常检测机制,首次实现零侵入的应用层网络异常在线诊断,配置自愈大幅提升至分钟级。

 

图|超大规模云网络调控关键技术架构

 

 

 

“网络是数字经济的高速公路,网络技术的每一次突破都带动了数字社会的前进。从十年前的云计算兴起,到如今的人工智能爆发,我们始终专注在云计算网络,并且联合国内外顶尖学者研究研制新型技术,最终打造出了洛神云网络技术体系。此次获奖,不仅是洛神针对AI场景下大吞吐高实时网络控制的应对之道,也是洛神自身数字化智能化的践行之路。面向未来,洛神将继续突破创新,打造简单易用的智能云网络服务,支撑全球数字化转型,加速推进AI时代到来。”阿里巴巴研究员、阿里云智能云网络负责人祝顺民说。

 

 

总结

 

 

本次获奖是阿里云洛神云网络继2021年浙江省技术发明一等奖、2021年CCF技术发明一等奖以及2023年CCF技术发明二等奖后第四次荣获高水平奖项。作为阿里云飞天操作系统的核心子系统,洛神云网络支撑了阿里巴巴集团核心业务,并成功服务全球400万+客户,覆盖在线教育、金融、零售、制造业等众多行业,在超高性能网络转发、超大规模网络控制、超高精度网络观测等核心方向均取得了突破。近几年,洛神的相关工作发表在SIGCOMM、NSDI、INFOCOM、MobiCom等国外顶级会议上。自2020年以来,阿里云在SIGCOMM/NSDI两大通信领域顶会已累计发表论文数十篇,并在2022年权威机构AMiner公布的AI 2000人工智能最具影响力榜单中,跻身全球十大计算机网络研究机构。




我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。

欢迎关注 “阿里云基础设施”同名微博知乎

获取关于我们的更多信息~

相关文章
|
3月前
|
供应链 安全 网络协议
|
3月前
|
边缘计算 安全 算法
阿里云CDN:构建全球化智能加速网络的数字高速公路
阿里云CDN构建全球化智能加速网络,拥有2800多个边缘节点覆盖67个国家,实现毫秒级网络延迟。其三级节点拓扑结构与智能路由系统,结合流量预测模型,确保高命中率。全栈式加速技术包括QUIC协议优化和Brotli压缩算法,保障安全与性能。五层防御机制有效抵御攻击,行业解决方案涵盖视频、物联网及游戏等领域,支持新兴AR/VR与元宇宙需求,持续推动数字内容分发技术边界。
157 13
|
2月前
|
调度 Python
探索Python高级并发与网络编程技术。
可以看出,Python的高级并发和网络编程极具挑战,却也饱含乐趣。探索这些技术,你将会发现:它们好比是Python世界的海洋,有穿越风暴的波涛,也有寂静深海的奇妙。开始旅途,探索无尽可能吧!
67 15
|
2月前
|
人工智能 算法 异构计算
阿里云基础网络技术5篇论文入选全球网络顶会NSDI
近日,阿里云基础网络技术5篇论文被NSDI 2025主会录用。研究涵盖大模型训练网络故障诊断、仿真、容器网络性能诊断、CDN流控算法智能选择及GPU解耦推理优化等领域。其中,《Evolution of Aegis》提出增强现有体系+训练过程感知的两阶段演进路线,显著降低故障诊断耗时;《SimAI》实现高精度大模型集群训练模拟;《Learning Production-Optimized Congestion Control Selection》通过AliCCS优化CDN拥塞控制;《Prism》设计全新GPU解耦推理方案;《ScalaCN》解决容器化RDMA场景性能问题。
98 7
阿里云基础网络技术5篇论文入选全球网络顶会NSDI
|
2月前
|
机器学习/深度学习 算法 PyTorch
Perforated Backpropagation:神经网络优化的创新技术及PyTorch使用指南
深度学习近年来在多个领域取得了显著进展,但其核心组件——人工神经元和反向传播算法自提出以来鲜有根本性突破。穿孔反向传播(Perforated Backpropagation)技术通过引入“树突”机制,模仿生物神经元的计算能力,实现了对传统神经元的增强。该技术利用基于协方差的损失函数训练树突节点,使其能够识别神经元分类中的异常模式,从而提升整体网络性能。实验表明,该方法不仅可提高模型精度(如BERT模型准确率提升3%-17%),还能实现高效模型压缩(参数减少44%而无性能损失)。这一革新为深度学习的基础构建模块带来了新的可能性,尤其适用于边缘设备和大规模模型优化场景。
84 16
Perforated Backpropagation:神经网络优化的创新技术及PyTorch使用指南
|
2月前
|
监控 算法 JavaScript
基于 JavaScript 图算法的局域网网络访问控制模型构建及局域网禁止上网软件的技术实现路径研究
本文探讨局域网网络访问控制软件的技术框架,将其核心功能映射为图论模型,通过节点与边表示终端设备及访问关系。以JavaScript实现DFS算法,模拟访问权限判断,优化动态策略更新与多层级访问控制。结合流量监控数据,提升网络安全响应能力,为企业自主研发提供理论支持,推动智能化演进,助力数字化管理。
68 4
|
3月前
|
存储 双11 数据中心
数据中心网络关键技术,技术发明一等奖!
近日,阿里云联合清华大学与中国移动申报的“性能可预期的大规模数据中心网络关键技术与应用”项目荣获中国电子学会技术发明一等奖。该项目通过端网融合架构,实现数据中心网络性能的可预期性,在带宽保障、时延控制和故障恢复速度上取得重大突破,显著提升服务质量。成果已应用于阿里云多项产品及重大社会活动中,如巴黎奥运会直播、“双十一”购物节等,展现出国际领先水平。
|
2月前
|
canal 负载均衡 智能网卡
阿里云洛神云网络论文入选SIGCOMM'25主会,相关实习生岗位火热招聘中
阿里云飞天洛神云网络的两项核心技术Nezha和Hermes被SIGCOMM 2025主会录用。Nezha通过计算网络解耦实现vSwitch池化架构,大幅提升网络性能;Hermes则提出用户态引导I/O事件通知框架,优化L7负载均衡。这两项技术突破解决了云网络中的关键问题,展现了阿里云在网络领域的领先实力。
313 2
|
3月前
|
人工智能 运维 监控
阿里云携手神州灵云打造云内网络性能监测标杆 斩获中国信通院高质量数字化转型十大案例——金保信“云内网络可观测”方案树立云原生运维新范式
2025年,金保信社保卡有限公司联合阿里云与神州灵云申报的《云内网络性能可观测解决方案》入选高质量数字化转型典型案例。该方案基于阿里云飞天企业版,融合云原生引流技术和流量“染色”专利,解决云内运维难题,实现主动预警和精准观测,将故障排查时间从数小时缩短至15分钟,助力企业降本增效,形成可跨行业复制的数字化转型方法论。
134 6
|
3月前
|
安全 网络安全 定位技术
网络通讯技术:HTTP POST协议用于发送本地压缩数据到服务器的方案。
总的来说,无论你是一名网络开发者,还是普通的IT工作人员,理解并掌握POST方法的运用是非常有价值的。它就像一艘快速,稳定,安全的大船,始终为我们在网络海洋中的冒险提供了可靠的支持。
109 22