首届CCF中国网络大会丨AI浪潮下的可预期智算网络

简介: 首届CCF中国网络大会丨AI浪潮下的可预期智算网络

【阅读原文】戳:首届CCF中国网络大会丨AI浪潮下的可预期智算网络



首届CCF中国网络大会(CCF CHINANET)于2023年9月8日-10日在浙江温州举办。CCF中国网络大会由中国计算机学会CCF(中国计算机学会)主办,由CCF互联网专委会、CCF网络与数据通信专委联合组织,由历史悠久的中国互联网学术年会(CCF ICoC)和CCF全国网络与数据通信学术会议(CCF NDCC)升级而成。会议的宗旨为“网络强国、产学共融”。


本次CCF中国网络大会以“产学研创融汇,服务网络强国”为主题,是中国网络领域学术界、产业界群贤毕至的盛会。来自国内外计算机网络与通信、网络空间安全领域的众多两院院士及国家级人才等知名学者莅临大会,来自多家知名企业的业界重磅嘉宾为参会者带来网络学术与技术盛宴。


图| 阿里云参会成员与行业专家合影


主论坛

阿里云基础设施网络事业部负责人蔡德忠在主论坛发表《可预期网络—Built for AI infrastructure》的主题演讲。演讲从大规模机器学习训练的需求出发,深入剖析了大模型对于算力横向扩展的诉求,以及网络在其中发挥的重要作用。演讲进一步介绍了阿里云支持大模型分布式训练的实际场景中遇到的实际问题,训练对于网络的长尾延迟以及稳定性提出了更高的要求。阿里云提出了可预期网络,通过端网融合的方式,打破信息壁垒,使得网络传输从“尽力而为”走向全面可预期。本次演讲同时还发布了阿里云HPN7.0架构,这是全球首个基于51.2Tbps Ethernet交换芯片的高性能GPU互联网络规模上线,在提供单机3.2Tbps高带宽接入的同时,支持千卡一跳互联,以及万卡两层互联。蔡德忠在演讲最后回顾网络发展的历史,专用系统解决方案可能在一段时间内到达性能领先,但是从长远发展来看,开放生态下多方参与共同演进的网络解决方案是持续保障高性能大规模机器学习训练的重要基础。


图|蔡德忠 主论坛演讲现场


专题论坛:
当算力网络遇上AI大模型

阿里云网络研究负责人翟恩南发表《网络运维的昨天、今天和明天》的主题演讲。演讲回顾了传统的自动化网络运维,以及自动化运维存在的问题。总结了当前由于网络的复杂性和规模的日益增加,运维人员单纯依靠自动化工具的运维已经无法保证网络稳定性和可靠性。从而提出了未来应该以大模型等人工智能为核心的技术所打造的智能化运维体系,把运维的决策能力从人交给系统(或智能)来应对当前具体极大挑战的运维任务,同时确保稳定性。


图|翟恩南 《当算力网络遇上AI大模型》专题论坛现场


专题论坛:新一代数据中心与未来网络体系

阿里云网络研究负责人翟恩南参加的第二个专题论坛是新一代数据中心与未来网络体系论坛。发表了题为《新一代高算力数据中心网络》的主题演讲。演讲首先回顾了阿里云基础设施网络在高性能网络方面这些年的技术创新积累,同时揭示了网络高性能背后的本质技术。从而提出了新一代的高算力数据中心网络应该满足端网融合的体系架构,即网络提供精确在网信息到服务器端,服务器端通过拥塞控制算法以及选路方法来提供注入公平性、最小带宽保证等属性。最后也展望了未来是一个人工智能的时代,算力的演进情况会成为制约我们能否在人工智能时代取得领先的决定性因素。


图|翟恩南 《新一代数据中心与未来网络体系》专题论坛现场


阿里云展台

阿里云在CCF中国网络大会设置了《Built for AI infra:构建AI时代网络基础设施》主题展台,展台展示了全球首个51.2Tbps自研交换机Tigatron。以及全新的HPN7.0网络架构,通过双上联+双平面、多轨、存算分离等核心设计,实现万卡高性能以及高稳定的大规模机器学习训练。此外展台还展示了最新的自研DASH智能网关以及SRv6边缘路由器。


图| 阿里云展台现场


中国高校计算机大赛--网络技术挑战赛

与本次CCF中国网络大会联合举办的还有中国高校计算机大赛--网络技术挑战赛。中国高校计算机大赛(China Collegiate Computing Contest,简称C4),为榜单类竞赛,属A类学科竞赛。是由教育部高等学校计算机类专业教学指导委员会、教育部高等学校软件工程专业教学指导委员会、教育部高等学校大学计算机课程教学指导委员会、全国高等学校计算机教育研究会联合创办。“网络技术挑战赛”为C4的竞赛模块之一,目的在于适应互联网技术与应用的发展,对接产业相关人才需求。


阿里云基础设施网络高级技术专家钱坤受邀参加网络技术挑战赛线上评审以及现场评审,为高校创新项目提供来自工业界视角的建议和改进思路。


图|钱坤 网络技术挑战赛小组评审现场


我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。

欢迎关注 “阿里云基础设施”同名微博知乎

获取关于我们的更多信息~

相关文章
|
6月前
|
机器学习/深度学习 人工智能 算法
AI 基础知识从 0.6 到 0.7—— 彻底拆解深度神经网络训练的五大核心步骤
本文以一个经典的PyTorch手写数字识别代码示例为引子,深入剖析了简洁代码背后隐藏的深度神经网络(DNN)训练全过程。
1057 56
|
5月前
|
人工智能 云栖大会 调度
「2025云栖大会」“简单易用的智能云网络,加速客户AI创新”专场分论坛诚邀莅临
”简单易用的智能云网络,加速客户AI创新“专场分论坛将于9月24日13:30-17:00在云栖小镇D1-5号馆举办,本场技术分论坛将发布多项云网络创新成果,深度揭秘支撑AI时代的超低时延、自适应调度与跨域协同核心技术。同时来自领先企业的技术先锋将首次公开其在模型训练、企业出海等高复杂场景中的突破性实践,展现如何通过下一代云网络实现算力效率跃升与成本重构,定义AI时代网络新范式。
223 4
|
6月前
|
人工智能 安全 网络安全
2025攻防演习回顾,AI赋能下的网络安全新格局
网络安全实战攻防演习历经9年发展,已成为检验安全体系、洞察威胁趋势的重要手段。攻击呈现实战化、体系化特征,APT、0day、勒索攻击等手段升级,AI、大数据等新技术带来新风险。攻击入口多元化、工具智能化、API成重点目标,“AI+人工”协同攻击加剧威胁。面对挑战,企业需构建纵深防御体系,从被动防御转向主动对抗。瑞数信息通过动态安全技术与AI融合,实现0day防护、漏扫干扰、勒索应急等能力,打造WAAP超融合平台,助力关键基础设施构建智能、协同、前瞻的主动防御体系。
537 1
|
6月前
|
机器学习/深度学习 传感器 人工智能
深度神经网络驱动的AI Agent
深度神经网络(DNN)驱动的AI Agent在实时预测中展现出强大能力,能够通过在线学习快速适应变化,广泛应用于金融、自动驾驶等领域,提升预测效率与决策水平。
|
5月前
|
人工智能 运维 安全
从被动防御到主动免疫进化!迈格网络 “天机” AI 安全防护平台,助推全端防护性能提升
迈格网络推出“天机”新版本,以AI自学习、全端防护、主动安全三大核心能力,重构网络安全防线。融合AI引擎与DeepSeek-R1模型,实现威胁预测、零日防御、自动化响应,覆盖Web、APP、小程序全场景,助力企业从被动防御迈向主动免疫,护航数字化转型。
从被动防御到主动免疫进化!迈格网络 “天机” AI 安全防护平台,助推全端防护性能提升
|
4月前
|
人工智能 运维 NoSQL
云栖大会|AI浪潮下的NoSQL演进:下一代数据库的破局之道
AI浪潮下的NoSQL演进:下一代数据库的破局之道
|
5月前
|
人工智能 运维 安全
AI来了,网络安全运维还能靠“人海战术”吗?
AI来了,网络安全运维还能靠“人海战术”吗?
286 28
|
5月前
|
机器学习/深度学习 资源调度 算法框架/工具
AI-ANNE: 将神经网络迁移到微控制器的深度探索——论文阅读
AI-ANNE框架探索将深度学习模型迁移至微控制器的可行路径,基于MicroPython在Raspberry Pi Pico上实现神经网络核心组件,支持本地化推理,推动TinyML在边缘设备中的应用。
311 10
|
5月前
|
人工智能 安全 网络安全
从不确定性到确定性,“动态安全+AI”成网络安全破题密码
2025年国家网络安全宣传周以“网络安全为人民,靠人民”为主题,聚焦AI安全、个人信息保护等热点。随着AI技术滥用加剧,智能化攻击频发,瑞数信息推出“动态安全+AI”防护体系,构建“三层防护+两大闭环”,实现风险前置识别与全链路防控,助力企业应对新型网络威胁,筑牢数字时代安全防线。(238字)
220 1