【阅读原文】戳:乌镇峰会丨阿里云蔡德忠:面向AI的下一代互联网
数字时代浪潮下,全球下一代互联网正处于蓬勃发展的关键时期,IPv6、人工智能、5G、物联网、云计算等先进的数字技术、网络技术快速改变人们的生活生产方式,下一代互联网的产业活力和价值提升迎来了更大空间。
11月9日下午,2023年世界互联网大会乌镇峰会期间,以“推动高质量发展,共建下一代互联网”为主题“下一代互联网创新发展论坛”在浙江乌镇举行。阿里云基础设施网络负责人蔡德忠受邀参加,接受论坛主持人提问和记者采访,以下是会议和采访实录。
阿里云基础设施网络负责人蔡德忠参加论坛圆桌环节
话题一:IPv6部署实践和经验
主持人:阿里云是全球领先的云服务提供商,请蔡总从云基础设施角度与我们分享IPv6部署经验以及未来的价值。
蔡德忠:大家好,首先想和大家分享一下阿里巴巴集团在IPv6规模化部署方面实践经验。阿里巴巴从2017年底开始发起集团层面的IPv6项目,大体上花了五年时间,分了三个阶段:
1.第一阶段是试点,主要是网络双栈部署,还有选取5个TOP APP和27款云产品进行全链路打通。
2.第二阶段,2019到2020年,在第一个阶段基础上增加覆盖度,就是增加更多的云产品、更多APP,扩展更多的region,覆盖更多的用户。到2020年底时候,我们IPv6活跃用户已经达到5亿。
3.第三阶段,2020到2021年,重点聚焦在IPv6的流量浓度,主要是优化云产品和APP全链路,提升IPv6用户的体验,让用户真正愿意从IPv4切换到IPv6。到2021年底,我们TOP20的APP流量IPv6流量已经达到90%以上,我们核心云产品已经全球部署IPv6,我觉得这个成绩挺斐然的。
我们在IPv6规模部署的经验有很多,主要有三点。
1.组织保障,我们在2018年时候成立了集团范围战役,由集团CTO亲自挂帅。
2.靠技术创新,创新的核心点是在IPv6这个庞大生态里面的耦合关系,怎么样给它进行解耦。在集团内部我们是云产品、APP和基础网络分层解耦、异步演进,在外部我们是和运营商网络、终端用户网络分层解耦、异步演进。
3.另外很重要一点是需要生态当中组织间合作,邬贺铨院士担任主任的推进IPv6规模部署专家委员会在里面起到很大牵引和协调的作用,我觉得这是很关键的一点。
面向未来,我们从2021年开始进入到IPv6规模化部署的下一个阶段,主要有两个并行工作。
第一,IPv6单栈部署,只有彻底摆脱IPv4地址依赖才能回到IPv6规模化部署的初衷。
第二,挖掘IPv6的技术红利,我们知道今天是AI大模型时代,如何构建AI Infrastructure是整个行业关心的一个热点,在这块需要很多基础网络协议层面创新,在阿里云我们是用IPv6作为基础协议构建下一代AI Infrastructure 。我们做了很多大胆尝试和创新,比如在数据中心内部我们用IPv6构建RDMA高性能网络传输,在数据中心之间我们用SRv6构建广域网架构升级、路由器白盒化,这些创新只是刚刚开始,但是我们已经感受到IPv6带来无限技术的可能。
话题二:关于加强组织、区域和国家间合作
主持人:阿里云是国际化公司,不仅服务国内也在全球提供服务,我想在这个方面国际部署和国际合作方面,蔡总讲讲您的思路。
蔡德忠:我想主要有两点,第一点是合作的必要性和紧迫性。第二点是想谈谈阿里云在合作方面的实践经验。
过去几十年人类社会发生了翻天覆地的变化,全面进入了数字化,数字社会建立在互联网的基础设施之上,互联网的基础协议是上个世纪发明的,所以很难匹配今天数字化的进程,所以在基础协议层面要做大的创新才能保持互联网的稳定安全,保持数字社会发展的可持续性。
但是基础协议层面的创新不是一件容易的事情,不是靠几家公司和几个国家可以完成的,需要全面的合作,我觉得这是有很大的必要性的。但是如何加强这方面的合作,有国际的标准组织,有各种各样的开源社区等,这里我讲一下阿里云在这方面的实践经验。
拿开源社区来举例,我们知道最大开源组织之一Linux Foundation, 里面有一个SONiC Project,阿里是创始成员之一。SONiC是目前网络设备操作系统的开源标准,阿里云在SONiC中推动成立了路由工作组,我们做这个目的是为了把我们IPv6部署过程当中的一系列实践和创新,基于SRv6的技术体系,反馈到社区,来推动全球IPv6规模化部署。
还有一点,目前来看可能是更重要的,因为我们正在进入大模型时代,整个行业关注的焦点就是如何构建下一代的AI Infra,里面的核心底层技术就是高性能的网络,目前整个行业出现了百花齐放、百家争鸣的状态,需要全行业的协作,推动标准的创立。阿里云在这方面和多个国际组织一起共同推动高性能网络协议的标准化工作,这块不仅仅是在四层的网络协议,也包括三层的IPv6这方面的工作。
所以整个行业的发展,只有靠全球协作才能构建更加未来的互联网,更加高效的AI Infra,才能让算力真正普惠全球人类。
话题三:AI时代的网络技术变革
采访记者:本次乌镇会议最火的话题之一就是AI人工智能,各个大型互联网平台企业都提出了对AI的设想和观点。蔡总请您也谈谈AI时代的网络技术机遇和发展趋势。
蔡德忠:我从云基础设施架构角度分享一下看法,本世纪以来,网络技术架构的发展大体上经历了三个阶段:电信网络/经典网络时代,互联网应用时代,以及目前的AI智算时代。
业务需求引发的规模驱动,推动着网络的技术变革,大模型是人工智能的分水岭,大模型带来的是开放的智能,生成式AI带来了智能的无限可能,这次AI大模型的浪潮已经不仅仅是影响到几个行业,而是对我们生活的方方面面都会带来深刻的变革。
大模型训练需要大算力,而大算力的获取一方面需要加速器芯片比如GPU的快速迭代,同时更需要很多加速器芯片互联在一起的集群算力,高性能的网络互联是集群算力可扩展的关键,所以我认为下一个十年的互联网技术架构的演进将围绕AI智算而进行,AI将重新定义未来数据中心架构,重新定义互联网架构,计算和网络的边界将模糊,计算和网络将进行融合创新,网络性能也将从传统的best-effort尽力而为演进到predictable可预期网络时代,可预期的网络性能才能真正有效支撑算力的线性扩展,最终达到算力的普惠化。
可预期网络的建立需要基础网络协议的持续创新,从4层的高性能网络传输协议,到三层的IPv6,再到二层的Ethernet协议演进,这些都需要我们公司间,区域间,国家间的全球协作才能保持互联网的可持续发展,才能构建面向未来更加高效的AI Infra ,才能让算力真正普惠全人类。
我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。