超大规模云网络技术新突破!阿里云斩获中国自动化学会科技进步一等奖

简介: 超大规模云网络技术新突破!阿里云斩获中国自动化学会科技进步一等奖

中国自动化学会近日公布了2023年度科学技术奖获奖名单,阿里云携手浙江大学、上海交大联合攻坚的超大规模云网络技术及应用成果,斩获中国自动化学会(CAA)科技进步奖一等奖。该成果实现了超大规模云网络调控技术的高性能突破,将十万级任务配置下发提升至秒级的超高水平,填补了该项技术的国内空白。由院士和专家组成的科技成果鉴定委员会评价本技术:该项目技术复杂,研制难度大,技术创新性强,是我国在云计算网络领域赶超世界先进水平、构建自主生态的成功实践和重大成果。


图|阿里云斩获中国自动化学会(CAA)科技进步奖一等奖


奖项介绍


中国自动化学会(CAA)是中国最早成立的国家一级学术群众团体之一,于1961年由著名航天科学家,中国科学院、中国工程院资深院士钱学森创立,每年评选一次CAA科学技术奖,包括科技进步奖、自然科学奖和技术发明奖等,其中优秀成果可进一步推荐进入国家科技进步奖评审,奖项意义重大。其中,CAA科技进步奖需满足技术创新性突出、经济效益或者社会效益显著、推动行业科技进步作用明显等条件,是我国自动化领域最权威的奖项之一。


研究背景


随着大模型的出现,AI技术迎来了新的一轮爆发,随之而来的是AI技术“三要素”算法、算力以及数据的激增。相比传统应用,AI技术从模型训练到实时推理都会带来海量的数据流动,而如何确保这些数据在网络中高效高质按需的传输,需要一套超大规模超高性能的网络控制技术。然而,网络控制技术,尤其是大规模云计算网络控制的关键技术,早期由国外高校及企业提出,并长期由国外厂商和机构垄断。为此,阿里云联合浙江大学以及上海交通大学历经10余年,打造了超大规模云网络新型超高性能调控关键技术,并且在阿里云大规模部署应用,相关成果发表在国际网络领域旗舰会议NSDI(Networked Systems Design and Implementation)上,打破了该领域在学术界以及工业界的垄断。


技术突破


针对AI训练高吞吐、AI推理高实时以及AI应用迭代快的要求,本项目以智能动态为核心指导思想,针对性地开展超高性能云计算网络调控系统及应用研究。


1. 创新提出海量网络数据管理平台,可实现网络数据高性能写入、存储以及查询,大幅提升系统决策效率;


2. 设计毫秒级高性能配置演算引擎,实现动态复杂网络配置的实时演算;


3. 提出大规模高可靠配置下发技术,大幅提升十万级大规模任务配置效率,做到秒级下发、分钟级校验;


4. 引入多模态网络异常检测机制,首次实现零侵入的应用层网络异常在线诊断,配置自愈大幅提升至分钟级。


图|超大规模云网络调控关键技术架构



“网络是数字经济的高速公路,网络技术的每一次突破都带动了数字社会的前进。从十年前的云计算兴起,到如今的人工智能爆发,我们始终专注在云计算网络,并且联合国内外顶尖学者研究研制新型技术,最终打造出了洛神云网络技术体系。此次获奖,不仅是洛神针对AI场景下大吞吐高实时网络控制的应对之道,也是洛神自身数字化智能化的践行之路。面向未来,洛神将继续突破创新,打造简单易用的智能云网络服务,支撑全球数字化转型,加速推进AI时代到来。”阿里巴巴研究员、阿里云智能云网络负责人祝顺民说。


总结


本次获奖是阿里云洛神云网络继2021年浙江省技术发明一等奖、2021年CCF技术发明一等奖以及2023年CCF技术发明二等奖后第四次荣获高水平奖项。作为阿里云飞天操作系统的核心子系统,洛神云网络支撑了阿里巴巴集团核心业务,并成功服务全球400万+客户,覆盖在线教育、金融、零售、制造业等众多行业,在超高性能网络转发、超大规模网络控制、超高精度网络观测等核心方向均取得了突破。近几年,洛神的相关工作发表在SIGCOMM、NSDI、INFOCOM、MobiCom等国外顶级会议上。自2020年以来,阿里云在SIGCOMM/NSDI两大通信领域顶会已累计发表论文数十篇,并在2022年权威机构AMiner公布的AI 2000人工智能最具影响力榜单中,跻身全球十大计算机网络研究机构。


/ END /

相关文章
|
5月前
|
弹性计算 Devops Shell
用阿里云 DevOps Flow 实现 ECS 部署自动化:从准备到落地的完整指南
阿里云 DevOps Flow 是一款助力开发者实现自动化部署的高效工具,支持代码流水线构建、测试与部署至ECS实例,显著提升交付效率与稳定性。本文详解如何通过 Flow 自动部署 Bash 脚本至 ECS,涵盖环境准备、流水线搭建、源码接入、部署流程设计及结果验证,助你快速上手云上自动化运维。
459 0
|
8月前
|
存储 运维 监控
云服务运行安全创新标杆:阿里云飞天洛神云网络子系统“齐天”再次斩获奖项
阿里云“超大规模云计算网络一体化运行管理平台——齐天系统”凭借卓越的技术创新与实践成果,荣获“云服务运行安全创新成果奖”,同时,齐天团队负责人吕彪获评“全栈型”专家认证。
|
4月前
|
弹性计算 安全 应用服务中间件
阿里云渠道商:怎么配置阿里云网络ACL?
阿里云网络ACL是子网级无状态防火墙,支持精准流量控制、规则热生效且免费使用。本文详解5步配置流程,助您实现Web与数据库层的安全隔离,提升云上网络安全。
|
4月前
|
人工智能 安全 架构师
2025云栖大会 | 阿里云网络技术Session主题资料和视频回放归档
2025年9月24日-26日,杭州,一年一度的云栖大会如期而至;阿里云飞天洛神云网络作为阿里云计算的连接底座,是飞天云操作系统的核心组件,致力于为上云企业提供高可靠、高性能、高弹性、智能的连接服务。本次云栖,云网络产品线也带来全系列产品升级,以及创新技术重磅解读,围绕增强确定性、提效自动化、深耕智能化和敏捷全球化带来技术、产品和服务升级,以及全新的云网络产品生态合作计划发布。
652 2
|
10月前
|
供应链 安全 网络协议
|
10月前
|
边缘计算 安全 算法
阿里云CDN:构建全球化智能加速网络的数字高速公路
阿里云CDN构建全球化智能加速网络,拥有2800多个边缘节点覆盖67个国家,实现毫秒级网络延迟。其三级节点拓扑结构与智能路由系统,结合流量预测模型,确保高命中率。全栈式加速技术包括QUIC协议优化和Brotli压缩算法,保障安全与性能。五层防御机制有效抵御攻击,行业解决方案涵盖视频、物联网及游戏等领域,支持新兴AR/VR与元宇宙需求,持续推动数字内容分发技术边界。
672 13
|
4月前
|
弹性计算 网络安全 数据中心
阿里云创建专有网络VPC的【IPv4网段】如何选择?有什么区别?
阿里云VPC创建时需选IPv4网段,默认提供10.0.0.0/16、172.16.0.0/16、192.168.0.0/16,三者无功能差异。若仅单VPC且不连本地数据中心,可任选其一,确保不冲突即可。多VPC或混合云场景需规划避免IP重叠。不支持100.64.0.0/10等特殊网段。建议结合IPAM进行地址管理。
|
9月前
|
人工智能 算法 异构计算
阿里云基础网络技术5篇论文入选全球网络顶会NSDI
近日,阿里云基础网络技术5篇论文被NSDI 2025主会录用。研究涵盖大模型训练网络故障诊断、仿真、容器网络性能诊断、CDN流控算法智能选择及GPU解耦推理优化等领域。其中,《Evolution of Aegis》提出增强现有体系+训练过程感知的两阶段演进路线,显著降低故障诊断耗时;《SimAI》实现高精度大模型集群训练模拟;《Learning Production-Optimized Congestion Control Selection》通过AliCCS优化CDN拥塞控制;《Prism》设计全新GPU解耦推理方案;《ScalaCN》解决容器化RDMA场景性能问题。
468 7
阿里云基础网络技术5篇论文入选全球网络顶会NSDI
|
9月前
|
监控 安全 Linux
Arista CloudVision 2025.1 - 多云和数据中心网络自动化、监控和分析
Arista CloudVision 2025.1 - 多云和数据中心网络自动化、监控和分析
384 2
Arista CloudVision 2025.1 - 多云和数据中心网络自动化、监控和分析

热门文章

最新文章