趋势六、端网融合的可预期网络
基于云定义的可预期网络技术,即将从数据中心的局域应用走 向全网推广。
摘要
可预期网络(Predictable Fabric)是 由云计算定义,服务器端侧和网络协同 的高性能网络互联系统。计算体系和网 络体系正在相互融合,高性能网络互联 使能算力集群的规模扩展,从而形成了 大算力资源池,加速了算力普惠化,让 算力走向大规模产业应用。可预期网络 不仅支持新兴的大算力和高性能计算场 景,也适用于通用计算场景,是融合了 传统网络和未来网络的产业趋势。通过 云定义的协议、软件、芯片、硬件、架构、 平台的全栈创新,可预期高算力网络有 望颠覆目前基于传统互联网 TCP 协议的 技术体系,成为下一代数据中心网络的 基本特征,并从数据中心的局域应用走 向全网推广。
趋势解读
可预 期 网 络(Predictable Fabric) 是由云计算定义,服务器端侧和 网络协同的高性能网络互联系统。计算 体系和网络体系正在相互融合,它通过高 性能网络互联使能算力集群的规模扩展, 从而形成大算力资源池,加速了算力普惠 化,让算力走向大规模产业应用。可预期 网络不仅支持新兴的大算力和高性能计 算场景,也适用于通用计算场景,是融合 了传统网络和未来网络的产业趋势。
网络的本质是连接。高带宽、低时 延、高稳定性、少抖动一直是网络追求 的目标。传统 TCP 网络协议栈,虽然在 互联网中广泛部署和应用,但是 TCP 协 议栈诞生时期的网络带宽和质量已经无 法与如今大带宽高质量的数据中心网络 相提并论。端侧和网络分层解耦,基于 网络黑盒传统尽力而为(best-effort)的 网络体系结构,无法满足当今大算力池 化所需要的高性能网络互联需求。因此, “可预期的”高性能网络架构在大算力需 求驱动下应运而生。这对于传统基于“尽 力而为”的网络体系提出了新的挑战。
可预期网络以大算力为基本出发点, 把端网融合作为实现方式。可预期网络 摒弃传统端侧计算、存储和网络分层解 耦的架构,创新地采用端侧和网络侧协 同设计和深度融合的思路,构建了基于 端网融合的新型网络传输协议、拥塞控 制算法、多路径智能化调度、以及芯片、 硬件深度定制和卸载等技术的全新算网 体系。可预期网络能够大幅度提升分布 式并行计算的网络通信效率,从而构建 高效的算力资源池,实现了云上大算力 的弹性供给。云计算重新定义的可预期 网络技术体系,将对产业链上下游、芯 片技术演进产生深远影响,成为算力普 惠化的新范式。
算力网络的发展正在经历从 0 到 1 的过程,需要互联网科技公司和运营商 共同定义。如果将算力网络作为未来的 关键基础设施,它将对网络可预期性提 出更高的要求。数字化社会下的算力普 惠,将持续驱动数据中心网络向高性能、 资源池化的云计算方向发展,这将使网 络可预期技术在未来2-3年内发生质变, 逐渐成为主流技术趋势。
专家点评
过去十年,网络行业发生最大的变革是互联网公司在超大规模需求驱动下,重新定义了网络系统:以软件为中心 的设备白盒替代了传统协议为中心的经典网络。未来十年,在大规模算力需求驱动下,云计算将重新定义下一代 高性能网络系统,端网融合架构已经开始触发网络的生态变革,集计算和网络于一体的 DPU 芯片更是雨后春笋般 出现,势将推动整个网络向可预期方向演进。
蔡德忠
阿里云智能副总裁兼首席网络科学家