【阅读原文】戳:首届CCF中国网络大会丨AI浪潮下的可预期智算网络
首届CCF中国网络大会(CCF CHINANET)于2023年9月8日-10日在浙江温州举办。CCF中国网络大会由中国计算机学会CCF(中国计算机学会)主办,由CCF互联网专委会、CCF网络与数据通信专委联合组织,由历史悠久的中国互联网学术年会(CCF ICoC)和CCF全国网络与数据通信学术会议(CCF NDCC)升级而成。会议的宗旨为“网络强国、产学共融”。
本次CCF中国网络大会以“产学研创融汇,服务网络强国”为主题,是中国网络领域学术界、产业界群贤毕至的盛会。来自国内外计算机网络与通信、网络空间安全领域的众多两院院士及国家级人才等知名学者莅临大会,来自多家知名企业的业界重磅嘉宾为参会者带来网络学术与技术盛宴。
图| 阿里云参会成员与行业专家合影
主论坛
阿里云基础设施网络事业部负责人蔡德忠在主论坛发表《可预期网络—Built for AI infrastructure》的主题演讲。演讲从大规模机器学习训练的需求出发,深入剖析了大模型对于算力横向扩展的诉求,以及网络在其中发挥的重要作用。演讲进一步介绍了阿里云支持大模型分布式训练的实际场景中遇到的实际问题,训练对于网络的长尾延迟以及稳定性提出了更高的要求。阿里云提出了可预期网络,通过端网融合的方式,打破信息壁垒,使得网络传输从“尽力而为”走向全面可预期。本次演讲同时还发布了阿里云HPN7.0架构,这是全球首个基于51.2Tbps Ethernet交换芯片的高性能GPU互联网络规模上线,在提供单机3.2Tbps高带宽接入的同时,支持千卡一跳互联,以及万卡两层互联。蔡德忠在演讲最后回顾网络发展的历史,专用系统解决方案可能在一段时间内到达性能领先,但是从长远发展来看,开放生态下多方参与共同演进的网络解决方案是持续保障高性能大规模机器学习训练的重要基础。
图|蔡德忠 主论坛演讲现场
专题论坛: 当算力网络遇上AI大模型
阿里云网络研究负责人翟恩南发表《网络运维的昨天、今天和明天》的主题演讲。演讲回顾了传统的自动化网络运维,以及自动化运维存在的问题。总结了当前由于网络的复杂性和规模的日益增加,运维人员单纯依靠自动化工具的运维已经无法保证网络稳定性和可靠性。从而提出了未来应该以大模型等人工智能为核心的技术所打造的智能化运维体系,把运维的决策能力从人交给系统(或智能)来应对当前具体极大挑战的运维任务,同时确保稳定性。
图|翟恩南 《当算力网络遇上AI大模型》专题论坛现场
专题论坛:新一代数据中心与未来网络体系
阿里云网络研究负责人翟恩南参加的第二个专题论坛是新一代数据中心与未来网络体系论坛。发表了题为《新一代高算力数据中心网络》的主题演讲。演讲首先回顾了阿里云基础设施网络在高性能网络方面这些年的技术创新积累,同时揭示了网络高性能背后的本质技术。从而提出了新一代的高算力数据中心网络应该满足端网融合的体系架构,即网络提供精确在网信息到服务器端,服务器端通过拥塞控制算法以及选路方法来提供注入公平性、最小带宽保证等属性。最后也展望了未来是一个人工智能的时代,算力的演进情况会成为制约我们能否在人工智能时代取得领先的决定性因素。
图|翟恩南 《新一代数据中心与未来网络体系》专题论坛现场
阿里云展台
阿里云在CCF中国网络大会设置了《Built for AI infra:构建AI时代网络基础设施》主题展台,展台展示了全球首个51.2Tbps自研交换机Tigatron。以及全新的HPN7.0网络架构,通过双上联+双平面、多轨、存算分离等核心设计,实现万卡高性能以及高稳定的大规模机器学习训练。此外展台还展示了最新的自研DASH智能网关以及SRv6边缘路由器。
图| 阿里云展台现场
中国高校计算机大赛--网络技术挑战赛
与本次CCF中国网络大会联合举办的还有中国高校计算机大赛--网络技术挑战赛。中国高校计算机大赛(China Collegiate Computing Contest,简称C4),为榜单类竞赛,属A类学科竞赛。是由教育部高等学校计算机类专业教学指导委员会、教育部高等学校软件工程专业教学指导委员会、教育部高等学校大学计算机课程教学指导委员会、全国高等学校计算机教育研究会联合创办。“网络技术挑战赛”为C4的竞赛模块之一,目的在于适应互联网技术与应用的发展,对接产业相关人才需求。
阿里云基础设施网络高级技术专家钱坤受邀参加网络技术挑战赛线上评审以及现场评审,为高校创新项目提供来自工业界视角的建议和改进思路。
图|钱坤 网络技术挑战赛小组评审现场
我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。
获取关于我们的更多信息~