近日,中国自动化学会公布了2023年度科学技术奖获奖名单。阿里云携手浙江大学、上海交大联合攻坚的超大规模云网络技术及应用成果,斩获中国自动化学会科技进步奖一等奖。该成果实现了超大规模云网络调控技术的高性能突破,将十万级任务配置下发提升至秒级的超高水平,填补了该项技术的国内空白。
由多名专家及院士组成的CAA科学技术奖鉴定委员会评价称:该项目技术复杂,研制难度大,技术创新性强,是我国在云计算网络领域赶超世界先进水平、构建自主生态的成功实践和重大成果。
超大规模云网络
新型超高性能调控关键技术
进入AI时代,大模型的训练、推理及应用迭代需求爆发,对底层的网络提出了极大挑战。网络调控技术作为网络的“大脑”,是调控云网络资源、高效配置数据的核心。这一关键技术由国外机构及厂商最早提出并长期垄断。阿里云联合浙江大学以及上海交通大学进行了长期攻关,成功自研超大规模云网络新型超高性能调控关键技术,并在阿里云上大规模部署应用。
该项目围绕AI训练高吞吐、AI推理高实时以及AI应用迭代快的要求,针对性地开展超高性能云计算网络调控系统及应用研究,实现了系列创新:
- 通过数据管理平台的创新设计,可实现海量数据的高性能写入、存储、查询,大幅提升系统决策效率;
- 设计毫秒级高性能配置演算引擎,实现动态复杂网络配置的实时演算;
- 创新配置下发技术,大幅提升十万级大规模任务配置效率,做到秒级下发、分钟级校验;
- 引入多模态异常检测机制,首次实现零侵入的应用层网络异常在线诊断,配置自愈大幅提升至分钟级。
阿里巴巴研究员、阿里云智能云网络负责人祝顺民表示:“作为洛神云网络调控子技术,该成果是洛神针对AI场景下大吞吐高实时网络控制的最新探索,也是洛神自身数字化智能化的迭代升级。面向未来,洛神将继续突破创新,打造简单易用的智能云网络服务,支撑全球数字化转型,加速推进AI时代到来。”
目前,阿里云洛神云网络支撑着阿里巴巴集团核心业务,并成功服务全球300万余家客户。在超高性能网络转发、超大规模网络控制、超高精度网络观测等核心方向,洛神云网络均取得突破,数十篇论文被SIGCOMM、NSDI等国际顶会收录发表,并揽获浙江省技术发明一等奖、CCF技术发明一等奖等重磅奖项。
中国自动化学会
中国自动化学会(CAA)是中国最早成立的国家一级学术群众团体之一,于1961年由著名航天科学家,中国科学院、中国工程院资深院士钱学森创立,每年评选一次CAA科学技术奖,包括科技进步奖、自然科学奖和技术发明奖等,其中优秀成果可进一步推荐进入国家科技进步奖评审,奖项意义重大。其中,CAA科技进步奖需满足技术创新性突出、经济效益或者社会效益显著、推动行业科技进步作用明显等条件,是我国自动化领域最权威的奖项之一。
/ END /