超大规模云网络技术新突破!阿里云斩获中国自动化学会科技进步一等奖

简介: 阿里云携手浙江大学、上海交大联合攻坚的超大规模云网络技术及应用成果,斩获中国自动化学会(CAA)科技进步奖一等奖。该成果实现了超大规模云网络调控技术的高性能突破,将十万级任务配置下发提升至秒级的超高水平,填补了该项技术的国内空白。

【阅读原文】戳:超大规模云网络技术新突破!阿里云斩获中国自动化学会科技进步一等奖

中国自动化学会近日公布了2023年度科学技术奖获奖名单,阿里云携手浙江大学、上海交大联合攻坚的超大规模云网络技术及应用成果,斩获中国自动化学会(CAA)科技进步奖一等奖。该成果实现了超大规模云网络调控技术的高性能突破,将十万级任务配置下发提升至秒级的超高水平,填补了该项技术的国内空白。由院士和专家组成的科技成果鉴定委员会评价本技术:该项目技术复杂,研制难度大,技术创新性强,是我国在云计算网络领域赶超世界先进水平、构建自主生态的成功实践和重大成果。

 

图|阿里云斩获中国自动化学会(CAA)科技进步奖一等奖

 

 

 

奖项介绍

 

 

中国自动化学会(CAA)是中国最早成立的国家一级学术群众团体之一,于1961年由著名航天科学家,中国科学院、中国工程院资深院士钱学森创立,每年评选一次CAA科学技术奖,包括科技进步奖、自然科学奖和技术发明奖等,其中优秀成果可进一步推荐进入国家科技进步奖评审,奖项意义重大。其中,CAA科技进步奖需满足技术创新性突出、经济效益或者社会效益显著、推动行业科技进步作用明显等条件,是我国自动化领域最权威的奖项之一。

 

 

研究背景

 

 

随着大模型的出现,AI技术迎来了新的一轮爆发,随之而来的是AI技术“三要素”算法、算力以及数据的激增。相比传统应用,AI技术从模型训练到实时推理都会带来海量的数据流动,而如何确保这些数据在网络中高效高质按需的传输,需要一套超大规模超高性能的网络控制技术。然而,网络控制技术,尤其是大规模云计算网络控制的关键技术,早期由国外高校及企业提出,并长期由国外厂商和机构垄断。为此,阿里云联合浙江大学以及上海交通大学历经10余年,打造了超大规模云网络新型超高性能调控关键技术,并且在阿里云大规模部署应用,相关成果发表在国际网络领域旗舰会议NSDI(Networked Systems Design and Implementation)上,打破了该领域在学术界以及工业界的垄断。

 

 

技术突破

 

 

针对AI训练高吞吐、AI推理高实时以及AI应用迭代快的要求,本项目以智能动态为核心指导思想,针对性地开展超高性能云计算网络调控系统及应用研究。

 

1. 创新提出海量网络数据管理平台,可实现网络数据高性能写入、存储以及查询,大幅提升系统决策效率;

 

2. 设计毫秒级高性能配置演算引擎,实现动态复杂网络配置的实时演算;

 

3. 提出大规模高可靠配置下发技术,大幅提升十万级大规模任务配置效率,做到秒级下发、分钟级校验;

 

4. 引入多模态网络异常检测机制,首次实现零侵入的应用层网络异常在线诊断,配置自愈大幅提升至分钟级。

 

图|超大规模云网络调控关键技术架构

 

 

 

“网络是数字经济的高速公路,网络技术的每一次突破都带动了数字社会的前进。从十年前的云计算兴起,到如今的人工智能爆发,我们始终专注在云计算网络,并且联合国内外顶尖学者研究研制新型技术,最终打造出了洛神云网络技术体系。此次获奖,不仅是洛神针对AI场景下大吞吐高实时网络控制的应对之道,也是洛神自身数字化智能化的践行之路。面向未来,洛神将继续突破创新,打造简单易用的智能云网络服务,支撑全球数字化转型,加速推进AI时代到来。”阿里巴巴研究员、阿里云智能云网络负责人祝顺民说。

 

 

总结

 

 

本次获奖是阿里云洛神云网络继2021年浙江省技术发明一等奖、2021年CCF技术发明一等奖以及2023年CCF技术发明二等奖后第四次荣获高水平奖项。作为阿里云飞天操作系统的核心子系统,洛神云网络支撑了阿里巴巴集团核心业务,并成功服务全球400万+客户,覆盖在线教育、金融、零售、制造业等众多行业,在超高性能网络转发、超大规模网络控制、超高精度网络观测等核心方向均取得了突破。近几年,洛神的相关工作发表在SIGCOMM、NSDI、INFOCOM、MobiCom等国外顶级会议上。自2020年以来,阿里云在SIGCOMM/NSDI两大通信领域顶会已累计发表论文数十篇,并在2022年权威机构AMiner公布的AI 2000人工智能最具影响力榜单中,跻身全球十大计算机网络研究机构。



我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。

欢迎关注 “阿里云基础设施”同名微信微博知乎

获取关于我们的更多信息~

相关文章
|
1天前
|
安全 网络安全 数据安全/隐私保护
现代网络安全与信息保护技术探析
随着互联网的普及与信息技术的飞速发展,网络安全问题日益突出。本文从网络安全漏洞、加密技术及安全意识三个方面进行探讨与分享,旨在帮助读者深入了解现代网络安全的重要性及相关技术应对手段。
7 2
|
1天前
|
弹性计算 运维 Kubernetes
阿里云ECS与混合云策略的结合,不仅为企业搭建了一个既灵活又稳定的IT基础架构,还为业务的快速发展与创新提供了坚实的技术支撑。
【7月更文挑战第3天】阿里云ECS在混合云中扮演关键角色,提供弹性计算资源和多样计费模式,确保业务连续性与灵活性。通过VPC互通、应用迁移、数据同步服务,如VPC对等连接、DTS,实现云上云下资源的高效整合。结合安全解决方案,保证在混合环境下的合规与安全。阿里云ECS助力企业数字化转型,应对市场变化。
9 1
|
2天前
|
运维 资源调度 监控
精准监控与自动化:提升运维效率的关键技术
在当今信息技术快速发展的背景下,运维管理越来越需要高效的监控和自动化工具来应对复杂的系统环境和服务需求。本文探讨了如何通过精准监控技术和自动化流程,提升运维效率并减少故障处理时间,从而实现IT基础设施的稳定性和可靠性。
|
2天前
|
数据采集 存储 JSON
解密网络爬虫与数据抓取技术的奇妙世界
【7月更文挑战第2天】网络爬虫是自动化数据抓取的关键工具,用于解锁互联网数据的潜力。本文深入探讨了爬虫基础,包括模拟HTTP请求、HTML解析和数据存储。通过实例展示如何用Python构建简单爬虫,强调法律与伦理考虑,如遵循robots.txt、尊重版权和隐私,以及应对反爬策略。合法、负责任的爬虫技术在商业、科研等领域发挥着重要作用,要求我们在数据探索中保持透明、最小影响和隐私保护。
6 1
|
5天前
|
运维 Kubernetes 安全
《阿里云产品四月刊》—享道出行:容器弹性技术驱动下的智慧出行稳定性实践(1)
阿里云瑶池数据库云原生化和一体化产品能力升级,多款产品更新迭代
|
5天前
|
弹性计算 Cloud Native 数据库
《阿里云产品四月刊》—享道出行:容器弹性技术驱动下的智慧出行稳定性实践(2)
阿里云瑶池数据库云原生化和一体化产品能力升级,多款产品更新迭代
|
5天前
|
弹性计算 Serverless 调度
《阿里云产品四月刊》—享道出行:容器弹性技术驱动下的智慧出行稳定性实践(3)
阿里云瑶池数据库云原生化和一体化产品能力升级,多款产品更新迭代
|
1天前
|
安全 测试技术 网络安全
网络安全中的渗透测试与风险评估:技术深度解析
【7月更文挑战第3天】在网络安全领域,渗透测试和风险评估是两种不可或缺的技术手段。通过模拟黑客的攻击手段来发现系统中的安全漏洞,以及通过系统性的方法来识别和评估潜在的风险和威胁,两者共同为组织提供了全面的网络安全保障。随着技术的不断发展和网络环境的日益复杂,渗透测试和风险评估的重要性将日益凸显。因此,网络安全从业者应不断学习和掌握这两种技术,以应对日益严峻的网络安全挑战。
|
2天前
|
网络协议 Java
Java网络编程基础与Socket实现技术
Java网络编程基础与Socket实现技术
|
3天前
|
运维 监控 Kubernetes
现代企业中的自动化运维技术
在当今快节奏的商业环境中,企业需要利用先进的自动化运维技术来提升效率和可靠性。本文探讨了自动化运维技术的发展趋势、关键技术和实施挑战,以及如何通过这些技术实现持续集成、持续交付和高效的系统管理。
11 0

热门文章

最新文章