乌镇峰会丨阿里云蔡德忠:面向AI的下一代互联网

简介: 乌镇峰会丨阿里云蔡德忠:面向AI的下一代互联网

【阅读原文】戳:乌镇峰会丨阿里云蔡德忠:面向AI的下一代互联网


数字时代浪潮下,全球下一代互联网正处于蓬勃发展的关键时期,IPv6、人工智能、5G、物联网、云计算等先进的数字技术、网络技术快速改变人们的生活生产方式,下一代互联网的产业活力和价值提升迎来了更大空间。



11月9日下午,2023年世界互联网大会乌镇峰会期间,以“推动高质量发展,共建下一代互联网”为主题“下一代互联网创新发展论坛”在浙江乌镇举行。阿里云基础设施网络负责人蔡德忠受邀参加,接受论坛主持人提问和记者采访,以下是会议和采访实录。


阿里云基础设施网络负责人蔡德忠参加论坛圆桌环节


话题一:IPv6部署实践和经验


主持人:阿里云是全球领先的云服务提供商,请蔡总从云基础设施角度与我们分享IPv6部署经验以及未来的价值。


蔡德忠:大家好,首先想和大家分享一下阿里巴巴集团在IPv6规模化部署方面实践经验。阿里巴巴从2017年底开始发起集团层面的IPv6项目,大体上花了五年时间,分了三个阶段:


1.第一阶段是试点,主要是网络双栈部署,还有选取5个TOP APP和27款云产品进行全链路打通。


2.第二阶段,2019到2020年,在第一个阶段基础上增加覆盖度,就是增加更多的云产品、更多APP,扩展更多的region,覆盖更多的用户。到2020年底时候,我们IPv6活跃用户已经达到5亿。


3.第三阶段,2020到2021年,重点聚焦在IPv6的流量浓度,主要是优化云产品和APP全链路,提升IPv6用户的体验,让用户真正愿意从IPv4切换到IPv6。到2021年底,我们TOP20的APP流量IPv6流量已经达到90%以上,我们核心云产品已经全球部署IPv6,我觉得这个成绩挺斐然的。


我们在IPv6规模部署的经验有很多,主要有三点。


1.组织保障,我们在2018年时候成立了集团范围战役,由集团CTO亲自挂帅。


2.靠技术创新,创新的核心点是在IPv6这个庞大生态里面的耦合关系,怎么样给它进行解耦。在集团内部我们是云产品、APP和基础网络分层解耦、异步演进,在外部我们是和运营商网络、终端用户网络分层解耦、异步演进。


3.另外很重要一点是需要生态当中组织间合作,邬贺铨院士担任主任的推进IPv6规模部署专家委员会在里面起到很大牵引和协调的作用,我觉得这是很关键的一点。


面向未来,我们从2021年开始进入到IPv6规模化部署的下一个阶段,主要有两个并行工作。


第一,IPv6单栈部署,只有彻底摆脱IPv4地址依赖才能回到IPv6规模化部署的初衷。


第二,挖掘IPv6的技术红利,我们知道今天是AI大模型时代,如何构建AI Infrastructure是整个行业关心的一个热点,在这块需要很多基础网络协议层面创新,在阿里云我们是用IPv6作为基础协议构建下一代AI Infrastructure 。我们做了很多大胆尝试和创新,比如在数据中心内部我们用IPv6构建RDMA高性能网络传输,在数据中心之间我们用SRv6构建广域网架构升级、路由器白盒化,这些创新只是刚刚开始,但是我们已经感受到IPv6带来无限技术的可能。



话题二:关于加强组织、区域和国家间合作


主持人:阿里云是国际化公司,不仅服务国内也在全球提供服务,我想在这个方面国际部署和国际合作方面,蔡总讲讲您的思路。


蔡德忠:我想主要有两点,第一点是合作的必要性和紧迫性。第二点是想谈谈阿里云在合作方面的实践经验。


过去几十年人类社会发生了翻天覆地的变化,全面进入了数字化,数字社会建立在互联网的基础设施之上,互联网的基础协议是上个世纪发明的,所以很难匹配今天数字化的进程,所以在基础协议层面要做大的创新才能保持互联网的稳定安全,保持数字社会发展的可持续性。


但是基础协议层面的创新不是一件容易的事情,不是靠几家公司和几个国家可以完成的,需要全面的合作,我觉得这是有很大的必要性的。但是如何加强这方面的合作,有国际的标准组织,有各种各样的开源社区等,这里我讲一下阿里云在这方面的实践经验。


拿开源社区来举例,我们知道最大开源组织之一Linux Foundation, 里面有一个SONiC Project,阿里是创始成员之一。SONiC是目前网络设备操作系统的开源标准,阿里云在SONiC中推动成立了路由工作组,我们做这个目的是为了把我们IPv6部署过程当中的一系列实践和创新,基于SRv6的技术体系,反馈到社区,来推动全球IPv6规模化部署。


还有一点,目前来看可能是更重要的,因为我们正在进入大模型时代,整个行业关注的焦点就是如何构建下一代的AI Infra,里面的核心底层技术就是高性能的网络,目前整个行业出现了百花齐放、百家争鸣的状态,需要全行业的协作,推动标准的创立。阿里云在这方面和多个国际组织一起共同推动高性能网络协议的标准化工作,这块不仅仅是在四层的网络协议,也包括三层的IPv6这方面的工作。


所以整个行业的发展,只有靠全球协作才能构建更加未来的互联网,更加高效的AI Infra,才能让算力真正普惠全球人类。


话题三:AI时代的网络技术变革


采访记者:本次乌镇会议最火的话题之一就是AI人工智能,各个大型互联网平台企业都提出了对AI的设想和观点。蔡总请您也谈谈AI时代的网络技术机遇和发展趋势。


蔡德忠:我从云基础设施架构角度分享一下看法,本世纪以来,网络技术架构的发展大体上经历了三个阶段:电信网络/经典网络时代,互联网应用时代,以及目前的AI智算时代。


业务需求引发的规模驱动,推动着网络的技术变革,大模型是人工智能的分水岭,大模型带来的是开放的智能,生成式AI带来了智能的无限可能,这次AI大模型的浪潮已经不仅仅是影响到几个行业,而是对我们生活的方方面面都会带来深刻的变革。


大模型训练需要大算力,而大算力的获取一方面需要加速器芯片比如GPU的快速迭代,同时更需要很多加速器芯片互联在一起的集群算力,高性能的网络互联是集群算力可扩展的关键,所以我认为下一个十年的互联网技术架构的演进将围绕AI智算而进行,AI将重新定义未来数据中心架构,重新定义互联网架构,计算和网络的边界将模糊,计算和网络将进行融合创新,网络性能也将从传统的best-effort尽力而为演进到predictable可预期网络时代,可预期的网络性能才能真正有效支撑算力的线性扩展,最终达到算力的普惠化。


可预期网络的建立需要基础网络协议的持续创新,从4层的高性能网络传输协议,到三层的IPv6,再到二层的Ethernet协议演进,这些都需要我们公司间,区域间,国家间的全球协作才能保持互联网的可持续发展,才能构建面向未来更加高效的AI Infra ,才能让算力真正普惠全人类。


我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。


相关文章
|
23天前
|
存储 人工智能 编解码
阿里云GPU云服务器深度评测:算力怪兽如何重塑AI与图形处理的未来?
在AI与高性能计算需求激增的今天,传统CPU已难满足“暴力计算”需求。阿里云GPU云服务器依托NVIDIA顶级显卡算力,结合专为GPU优化的神行工具包(DeepGPU),为深度学习、科学计算、图形渲染等领域提供高效、弹性的算力支持。本文全面解析其产品优势、工具链及六大真实应用场景,助你掌握AI时代的算力利器。
阿里云GPU云服务器深度评测:算力怪兽如何重塑AI与图形处理的未来?
|
24天前
|
存储 弹性计算 运维
AI 时代下阿里云基础设施的稳定性架构揭秘
十五年磨一剑,稳定性为何是今天的“命门”?
|
22天前
|
存储 人工智能 安全
【阿里云基础设施 AI Tech Day】 AI Infra 建设方案及最佳实践沙龙圆
聚焦 AI Infra 建设方案及最佳实践,「智驱未来,云网随行:AI Infra 建设方案及最佳实践」沙龙阿里云基础设施 AI Tech Day 北京站于 8 月 8 日下午在北京全球创新社区顺利举办,活动现场吸引了来自月之暗面、字节、小米、爱奇艺、360、雪球、猿辅导、奥迪等 16 家相关 AI 领域领先企业或有AI建设诉求企业的 32 名业务/技术骨干参与。本次技术沙龙旨在聚焦企业建设高效、高可用的 AI Infra,深入解析 AI 驱动的原子能力与场景化架构设计,分享从基础网络建设、算力池化、存储调度,以及 VPC RDMA 性能优化、Agent 智能体出海等场景的全链路方案,助力企业
123 1
|
30天前
|
人工智能 弹性计算 监控
【云故事探索】NO.16:阿里云弹性计算加速精准学 AI 教育普惠落地
智能精准学联合阿里云,打造全球首个K12教育超级智能体“寒雪老师”,依托弹性计算实现AI一对一教育普惠愿景。面对实时交互与流量潮汐挑战,借助阿里云算力实现低延迟、高并发服务,保障千万学子流畅学习体验。
|
26天前
|
存储 人工智能 分布式计算
数据不用搬,AI直接炼!阿里云AnalyticDB AI数据湖仓一站式融合AI+BI
阿里云瑶池旗下的云原生数据仓库AnalyticDB MySQL版(以下简称ADB)诞生于高性能实时数仓时代,实现了PB级结构化数据的高效处理和分析。在前几年,为拥抱大数据的浪潮,ADB从传统数仓拓展到数据湖仓,支持Paimon/Iceberg/Delta Lake/Hudi湖格式,为开放的数据湖提供数据库级别的性能、可靠性和管理能力,从而更好地服务以SQL为核心的大规模数据处理和BI分析,奠定了坚实的湖仓一体基础。
|
29天前
|
存储 人工智能 分布式计算
从数据工程师到AI工程师,我的阿里云ODPS应用实践
阿里云DataWorks提供完善的智能计算与多模态数据处理能力,通过Object Table与MaxFrame实现非结构化数据高效治理,结合OSS与AI模型,助力电商、媒体等行业实现数据驱动的智能化升级。
|
人工智能 缓存 NoSQL
【深度】企业 AI 落地实践(四):如何构建端到端的 AI 应用观测体系
本文探讨了AI应用在实际落地过程中面临的三大核心问题:如何高效使用AI模型、控制成本以及保障输出质量。文章详细分析了AI应用的典型架构,并提出通过全栈可观测体系实现从用户端到模型推理层的端到端监控与诊断。结合阿里云的实践经验,介绍了基于OpenTelemetry的Trace全链路追踪、关键性能指标(如TTFT、TPOT)采集、模型质量评估与MCP工具调用观测等技术手段,帮助企业在生产环境中实现AI应用的稳定、高效运行。同时,针对Dify等低代码平台的应用部署与优化提供了具体建议,助力企业构建可扩展、可观测的AI应用体系。
|
1月前
|
机器学习/深度学习 人工智能 PyTorch
GPT为定制AI应用工程师转型第一周学习计划
本计划帮助开发者快速入门AI领域,首周涵盖AI基础理论、Python编程及PyTorch实战。前两天学习机器学习、深度学习与Transformer核心概念,掌握LLM工作原理。第三至四天快速掌握Python语法与Jupyter使用,完成基础编程任务。第五至七天学习PyTorch,动手训练MNIST手写识别模型,理解Tensor操作与神经网络构建。
111 0
|
2月前
|
人工智能 监控 数据可视化
BISHENG下一代企业AI应用的“全能型“LLM软件
杭州奥零数据科技有限公司成立于2023年,专注于数据中台业务,维护开源项目AllData并提供商业版解决方案。AllData提供数据集成、存储、开发、治理及BI展示等一站式服务,支持AI大模型应用,助力企业高效利用数据价值。

热门文章

最新文章