乌镇峰会丨阿里云蔡德忠:面向AI的下一代互联网

简介: 乌镇峰会丨阿里云蔡德忠:面向AI的下一代互联网

【阅读原文】戳:乌镇峰会丨阿里云蔡德忠:面向AI的下一代互联网


数字时代浪潮下,全球下一代互联网正处于蓬勃发展的关键时期,IPv6、人工智能、5G、物联网、云计算等先进的数字技术、网络技术快速改变人们的生活生产方式,下一代互联网的产业活力和价值提升迎来了更大空间。



11月9日下午,2023年世界互联网大会乌镇峰会期间,以“推动高质量发展,共建下一代互联网”为主题“下一代互联网创新发展论坛”在浙江乌镇举行。阿里云基础设施网络负责人蔡德忠受邀参加,接受论坛主持人提问和记者采访,以下是会议和采访实录。


阿里云基础设施网络负责人蔡德忠参加论坛圆桌环节


话题一:IPv6部署实践和经验


主持人:阿里云是全球领先的云服务提供商,请蔡总从云基础设施角度与我们分享IPv6部署经验以及未来的价值。


蔡德忠:大家好,首先想和大家分享一下阿里巴巴集团在IPv6规模化部署方面实践经验。阿里巴巴从2017年底开始发起集团层面的IPv6项目,大体上花了五年时间,分了三个阶段:


1.第一阶段是试点,主要是网络双栈部署,还有选取5个TOP APP和27款云产品进行全链路打通。


2.第二阶段,2019到2020年,在第一个阶段基础上增加覆盖度,就是增加更多的云产品、更多APP,扩展更多的region,覆盖更多的用户。到2020年底时候,我们IPv6活跃用户已经达到5亿。


3.第三阶段,2020到2021年,重点聚焦在IPv6的流量浓度,主要是优化云产品和APP全链路,提升IPv6用户的体验,让用户真正愿意从IPv4切换到IPv6。到2021年底,我们TOP20的APP流量IPv6流量已经达到90%以上,我们核心云产品已经全球部署IPv6,我觉得这个成绩挺斐然的。


我们在IPv6规模部署的经验有很多,主要有三点。


1.组织保障,我们在2018年时候成立了集团范围战役,由集团CTO亲自挂帅。


2.靠技术创新,创新的核心点是在IPv6这个庞大生态里面的耦合关系,怎么样给它进行解耦。在集团内部我们是云产品、APP和基础网络分层解耦、异步演进,在外部我们是和运营商网络、终端用户网络分层解耦、异步演进。


3.另外很重要一点是需要生态当中组织间合作,邬贺铨院士担任主任的推进IPv6规模部署专家委员会在里面起到很大牵引和协调的作用,我觉得这是很关键的一点。


面向未来,我们从2021年开始进入到IPv6规模化部署的下一个阶段,主要有两个并行工作。


第一,IPv6单栈部署,只有彻底摆脱IPv4地址依赖才能回到IPv6规模化部署的初衷。


第二,挖掘IPv6的技术红利,我们知道今天是AI大模型时代,如何构建AI Infrastructure是整个行业关心的一个热点,在这块需要很多基础网络协议层面创新,在阿里云我们是用IPv6作为基础协议构建下一代AI Infrastructure 。我们做了很多大胆尝试和创新,比如在数据中心内部我们用IPv6构建RDMA高性能网络传输,在数据中心之间我们用SRv6构建广域网架构升级、路由器白盒化,这些创新只是刚刚开始,但是我们已经感受到IPv6带来无限技术的可能。



话题二:关于加强组织、区域和国家间合作


主持人:阿里云是国际化公司,不仅服务国内也在全球提供服务,我想在这个方面国际部署和国际合作方面,蔡总讲讲您的思路。


蔡德忠:我想主要有两点,第一点是合作的必要性和紧迫性。第二点是想谈谈阿里云在合作方面的实践经验。


过去几十年人类社会发生了翻天覆地的变化,全面进入了数字化,数字社会建立在互联网的基础设施之上,互联网的基础协议是上个世纪发明的,所以很难匹配今天数字化的进程,所以在基础协议层面要做大的创新才能保持互联网的稳定安全,保持数字社会发展的可持续性。


但是基础协议层面的创新不是一件容易的事情,不是靠几家公司和几个国家可以完成的,需要全面的合作,我觉得这是有很大的必要性的。但是如何加强这方面的合作,有国际的标准组织,有各种各样的开源社区等,这里我讲一下阿里云在这方面的实践经验。


拿开源社区来举例,我们知道最大开源组织之一Linux Foundation, 里面有一个SONiC Project,阿里是创始成员之一。SONiC是目前网络设备操作系统的开源标准,阿里云在SONiC中推动成立了路由工作组,我们做这个目的是为了把我们IPv6部署过程当中的一系列实践和创新,基于SRv6的技术体系,反馈到社区,来推动全球IPv6规模化部署。


还有一点,目前来看可能是更重要的,因为我们正在进入大模型时代,整个行业关注的焦点就是如何构建下一代的AI Infra,里面的核心底层技术就是高性能的网络,目前整个行业出现了百花齐放、百家争鸣的状态,需要全行业的协作,推动标准的创立。阿里云在这方面和多个国际组织一起共同推动高性能网络协议的标准化工作,这块不仅仅是在四层的网络协议,也包括三层的IPv6这方面的工作。


所以整个行业的发展,只有靠全球协作才能构建更加未来的互联网,更加高效的AI Infra,才能让算力真正普惠全球人类。


话题三:AI时代的网络技术变革


采访记者:本次乌镇会议最火的话题之一就是AI人工智能,各个大型互联网平台企业都提出了对AI的设想和观点。蔡总请您也谈谈AI时代的网络技术机遇和发展趋势。


蔡德忠:我从云基础设施架构角度分享一下看法,本世纪以来,网络技术架构的发展大体上经历了三个阶段:电信网络/经典网络时代,互联网应用时代,以及目前的AI智算时代。


业务需求引发的规模驱动,推动着网络的技术变革,大模型是人工智能的分水岭,大模型带来的是开放的智能,生成式AI带来了智能的无限可能,这次AI大模型的浪潮已经不仅仅是影响到几个行业,而是对我们生活的方方面面都会带来深刻的变革。


大模型训练需要大算力,而大算力的获取一方面需要加速器芯片比如GPU的快速迭代,同时更需要很多加速器芯片互联在一起的集群算力,高性能的网络互联是集群算力可扩展的关键,所以我认为下一个十年的互联网技术架构的演进将围绕AI智算而进行,AI将重新定义未来数据中心架构,重新定义互联网架构,计算和网络的边界将模糊,计算和网络将进行融合创新,网络性能也将从传统的best-effort尽力而为演进到predictable可预期网络时代,可预期的网络性能才能真正有效支撑算力的线性扩展,最终达到算力的普惠化。


可预期网络的建立需要基础网络协议的持续创新,从4层的高性能网络传输协议,到三层的IPv6,再到二层的Ethernet协议演进,这些都需要我们公司间,区域间,国家间的全球协作才能保持互联网的可持续发展,才能构建面向未来更加高效的AI Infra ,才能让算力真正普惠全人类。


我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。


相关文章
|
4天前
|
存储 人工智能 缓存
官宣开源 阿里云与清华大学共建AI大模型推理项目Mooncake
近日,清华大学和研究组织9#AISoft,联合以阿里云为代表的多家企业和研究机构,正式开源大模型资源池化项目 Mooncake。
|
21天前
|
人工智能 架构师
活动火热报名中|阿里云&Elastic:AI Search Tech Day
2024年11月22日,阿里云与Elastic联合举办“AI Search Tech Day”技术思享会活动。
175 9
|
26天前
|
存储 人工智能 调度
阿里云吴结生:高性能计算持续创新,响应数据+AI时代的多元化负载需求
在数字化转型的大潮中,每家公司都在积极探索如何利用数据驱动业务增长,而AI技术的快速发展更是加速了这一进程。
|
20天前
|
人工智能 自然语言处理 算法
企业内训|AI/大模型/智能体的测评/评估技术-某电信运营商互联网研发中心
本课程是TsingtaoAI专为某电信运营商的互联网研发中心的AI算法工程师设计,已于近日在广州对客户团队完成交付。课程聚焦AI算法工程师在AI、大模型和智能体的测评/评估技术中的关键能力建设,深入探讨如何基于当前先进的AI、大模型与智能体技术,构建符合实际场景需求的科学测评体系。课程内容涵盖大模型及智能体的基础理论、测评集构建、评分标准、自动化与人工测评方法,以及特定垂直场景下的测评实战等方面。
74 4
|
21天前
|
存储 人工智能 大数据
阿里云吴结生:高性能计算持续创新,响应数据+AI时代的多元化负载需求
在数字化转型的大潮中,每家公司都在积极探索如何利用数据驱动业务增长,而AI技术的快速发展更是加速了这一进程。
|
25天前
|
人工智能 Kubernetes 云计算
第五届CID大会成功举办,阿里云基础设施加速AI智能产业发展!
2024年10月19日,第五届中国云计算基础架构开发者大会(CID)在北京朗丽兹西山花园酒店成功举办。本次大会汇聚了来自云计算领域的众多精英,不同背景的与会者齐聚一堂,共同探讨云计算技术的最新发展与未来趋势。
|
25天前
|
人工智能 Kubernetes 云计算
第五届CID大会成功举办,阿里云基础设施加速AI智能产业发展!
第五届中国云计算基础架构开发者大会(CID)于2024年10月19日在北京成功举办。大会汇聚了300多位现场参会者和超过3万名在线观众,30余位技术专家进行了精彩分享,涵盖高效部署大模型推理、Knative加速AI应用Serverless化、AMD平台PMU虚拟化技术实践、Kubernetes中全链路GPU高效管理等前沿话题。阿里云的讲师团队通过专业解读,为与会者带来了全新的视野和启发,推动了云计算技术的创新发展。
|
26天前
|
机器学习/深度学习 人工智能 弹性计算
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多种配置选项,包括CPU+GPU、CPU+FPGA等组合,支持高性能计算需求。本文汇总了阿里云GPU服务器的价格信息,涵盖NVIDIA A10、V100、T4、P4、P100等多款GPU卡,适用于人工智能、机器学习和深度学习等场景。详细价格表和实例规格见文内图表。
|
8天前
|
机器学习/深度学习 人工智能 算法
AI技术在医疗诊断中的应用及前景展望
本文旨在探讨人工智能(AI)技术在医疗诊断领域的应用现状、挑战与未来发展趋势。通过分析AI技术如何助力提高诊断准确率、缩短诊断时间以及降低医疗成本,揭示了其在现代医疗体系中的重要价值。同时,文章也指出了当前AI医疗面临的数据隐私、算法透明度等挑战,并对未来的发展方向进行了展望。
|
16天前
|
机器学习/深度学习 人工智能 自然语言处理
当前AI大模型在软件开发中的创新应用与挑战
2024年,AI大模型在软件开发领域的应用正重塑传统流程,从自动化编码、智能协作到代码审查和测试,显著提升了开发效率和代码质量。然而,技术挑战、伦理安全及模型可解释性等问题仍需解决。未来,AI将继续推动软件开发向更高效、智能化方向发展。