超大规模云网络技术新突破!阿里云斩获中国自动化学会科技进步一等奖

简介: 阿里云携手浙江大学、上海交大联合攻坚的超大规模云网络技术及应用成果,斩获中国自动化学会(CAA)科技进步奖一等奖。该成果实现了超大规模云网络调控技术的高性能突破,将十万级任务配置下发提升至秒级的超高水平,填补了该项技术的国内空白。


中国自动化学会近日公布了2023年度科学技术奖获奖名单,阿里云携手浙江大学、上海交大联合攻坚的超大规模云网络技术及应用成果,斩获中国自动化学会(CAA)科技进步奖一等奖。该成果实现了超大规模云网络调控技术的高性能突破,将十万级任务配置下发提升至秒级的超高水平,填补了该项技术的国内空白。由院士和专家组成的科技成果鉴定委员会评价本技术:该项目技术复杂,研制难度大,技术创新性强,是我国在云计算网络领域赶超世界先进水平、构建自主生态的成功实践和重大成果。

 

图|阿里云斩获中国自动化学会(CAA)科技进步奖一等奖

 

 

 

奖项介绍

 

 

中国自动化学会(CAA)是中国最早成立的国家一级学术群众团体之一,于1961年由著名航天科学家,中国科学院、中国工程院资深院士钱学森创立,每年评选一次CAA科学技术奖,包括科技进步奖、自然科学奖和技术发明奖等,其中优秀成果可进一步推荐进入国家科技进步奖评审,奖项意义重大。其中,CAA科技进步奖需满足技术创新性突出、经济效益或者社会效益显著、推动行业科技进步作用明显等条件,是我国自动化领域最权威的奖项之一。

 

 

研究背景

 

 

随着大模型的出现,AI技术迎来了新的一轮爆发,随之而来的是AI技术“三要素”算法、算力以及数据的激增。相比传统应用,AI技术从模型训练到实时推理都会带来海量的数据流动,而如何确保这些数据在网络中高效高质按需的传输,需要一套超大规模超高性能的网络控制技术。然而,网络控制技术,尤其是大规模云计算网络控制的关键技术,早期由国外高校及企业提出,并长期由国外厂商和机构垄断。为此,阿里云联合浙江大学以及上海交通大学历经10余年,打造了超大规模云网络新型超高性能调控关键技术,并且在阿里云大规模部署应用,相关成果发表在国际网络领域旗舰会议NSDI(Networked Systems Design and Implementation)上,打破了该领域在学术界以及工业界的垄断。

 

 

技术突破

 

 

针对AI训练高吞吐、AI推理高实时以及AI应用迭代快的要求,本项目以智能动态为核心指导思想,针对性地开展超高性能云计算网络调控系统及应用研究。

 

1. 创新提出海量网络数据管理平台,可实现网络数据高性能写入、存储以及查询,大幅提升系统决策效率;

 

2. 设计毫秒级高性能配置演算引擎,实现动态复杂网络配置的实时演算;

 

3. 提出大规模高可靠配置下发技术,大幅提升十万级大规模任务配置效率,做到秒级下发、分钟级校验;

 

4. 引入多模态网络异常检测机制,首次实现零侵入的应用层网络异常在线诊断,配置自愈大幅提升至分钟级。

 

图|超大规模云网络调控关键技术架构

 

 

 

“网络是数字经济的高速公路,网络技术的每一次突破都带动了数字社会的前进。从十年前的云计算兴起,到如今的人工智能爆发,我们始终专注在云计算网络,并且联合国内外顶尖学者研究研制新型技术,最终打造出了洛神云网络技术体系。此次获奖,不仅是洛神针对AI场景下大吞吐高实时网络控制的应对之道,也是洛神自身数字化智能化的践行之路。面向未来,洛神将继续突破创新,打造简单易用的智能云网络服务,支撑全球数字化转型,加速推进AI时代到来。”阿里巴巴研究员、阿里云智能云网络负责人祝顺民说。

 

 

总结

 

 

本次获奖是阿里云洛神云网络继2021年浙江省技术发明一等奖、2021年CCF技术发明一等奖以及2023年CCF技术发明二等奖后第四次荣获高水平奖项。作为阿里云飞天操作系统的核心子系统,洛神云网络支撑了阿里巴巴集团核心业务,并成功服务全球400万+客户,覆盖在线教育、金融、零售、制造业等众多行业,在超高性能网络转发、超大规模网络控制、超高精度网络观测等核心方向均取得了突破。近几年,洛神的相关工作发表在SIGCOMM、NSDI、INFOCOM、MobiCom等国外顶级会议上。自2020年以来,阿里云在SIGCOMM/NSDI两大通信领域顶会已累计发表论文数十篇,并在2022年权威机构AMiner公布的AI 2000人工智能最具影响力榜单中,跻身全球十大计算机网络研究机构。




我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。

欢迎关注 “阿里云基础设施”同名微博知乎

获取关于我们的更多信息~

相关文章
|
4月前
|
监控 安全 Linux
Arista CloudVision 2025.1 - 多云和数据中心网络自动化、监控和分析
Arista CloudVision 2025.1 - 多云和数据中心网络自动化、监控和分析
155 2
Arista CloudVision 2025.1 - 多云和数据中心网络自动化、监控和分析
|
4月前
|
调度 Python
探索Python高级并发与网络编程技术。
可以看出,Python的高级并发和网络编程极具挑战,却也饱含乐趣。探索这些技术,你将会发现:它们好比是Python世界的海洋,有穿越风暴的波涛,也有寂静深海的奇妙。开始旅途,探索无尽可能吧!
104 15
|
4月前
|
机器学习/深度学习 算法 PyTorch
Perforated Backpropagation:神经网络优化的创新技术及PyTorch使用指南
深度学习近年来在多个领域取得了显著进展,但其核心组件——人工神经元和反向传播算法自提出以来鲜有根本性突破。穿孔反向传播(Perforated Backpropagation)技术通过引入“树突”机制,模仿生物神经元的计算能力,实现了对传统神经元的增强。该技术利用基于协方差的损失函数训练树突节点,使其能够识别神经元分类中的异常模式,从而提升整体网络性能。实验表明,该方法不仅可提高模型精度(如BERT模型准确率提升3%-17%),还能实现高效模型压缩(参数减少44%而无性能损失)。这一革新为深度学习的基础构建模块带来了新的可能性,尤其适用于边缘设备和大规模模型优化场景。
130 16
Perforated Backpropagation:神经网络优化的创新技术及PyTorch使用指南
|
4月前
|
监控 算法 JavaScript
基于 JavaScript 图算法的局域网网络访问控制模型构建及局域网禁止上网软件的技术实现路径研究
本文探讨局域网网络访问控制软件的技术框架,将其核心功能映射为图论模型,通过节点与边表示终端设备及访问关系。以JavaScript实现DFS算法,模拟访问权限判断,优化动态策略更新与多层级访问控制。结合流量监控数据,提升网络安全响应能力,为企业自主研发提供理论支持,推动智能化演进,助力数字化管理。
94 4
|
5月前
|
存储 双11 数据中心
数据中心网络关键技术,技术发明一等奖!
近日,阿里云联合清华大学与中国移动申报的“性能可预期的大规模数据中心网络关键技术与应用”项目荣获中国电子学会技术发明一等奖。该项目通过端网融合架构,实现数据中心网络性能的可预期性,在带宽保障、时延控制和故障恢复速度上取得重大突破,显著提升服务质量。成果已应用于阿里云多项产品及重大社会活动中,如巴黎奥运会直播、“双十一”购物节等,展现出国际领先水平。
|
5月前
|
安全 网络安全 定位技术
网络通讯技术:HTTP POST协议用于发送本地压缩数据到服务器的方案。
总的来说,无论你是一名网络开发者,还是普通的IT工作人员,理解并掌握POST方法的运用是非常有价值的。它就像一艘快速,稳定,安全的大船,始终为我们在网络海洋中的冒险提供了可靠的支持。
155 22
|
5月前
|
存储 监控 算法
基于 Python 哈希表算法的局域网网络监控工具:实现高效数据管理的核心技术
在当下数字化办公的环境中,局域网网络监控工具已成为保障企业网络安全、确保其高效运行的核心手段。此类工具通过对网络数据的收集、分析与管理,赋予企业实时洞察网络活动的能力。而在其运行机制背后,数据结构与算法发挥着关键作用。本文聚焦于 PHP 语言中的哈希表算法,深入探究其在局域网网络监控工具中的应用方式及所具备的优势。
140 7
|
6月前
|
缓存 网络协议 API
掌握网络通信协议和技术:开发者指南
本文探讨了常见的网络通信协议和技术,如HTTP、SSE、GraphQL、TCP、WebSocket和Socket.IO,分析了它们的功能、优劣势及适用场景。开发者需根据应用需求选择合适的协议,以构建高效、可扩展的应用程序。同时,测试与调试工具(如Apipost)能助力开发者在不同网络环境下优化性能,提升用户体验。掌握这些协议是现代软件开发者的必备技能,对项目成功至关重要。
|
6月前
|
缓存 监控 算法
基于 C# 网络套接字算法的局域网实时监控技术探究
在数字化办公与网络安全需求增长的背景下,局域网实时监控成为企业管理和安全防护的关键。本文介绍C#网络套接字算法在局域网实时监控中的应用,涵盖套接字创建、绑定监听、连接建立和数据传输等操作,并通过代码示例展示其实现方式。服务端和客户端通过套接字进行屏幕截图等数据的实时传输,保障网络稳定与信息安全。同时,文章探讨了算法的优缺点及优化方向,如异步编程、数据压缩与缓存、错误处理与重传机制,以提升系统性能。
120 2

热门文章

最新文章