磐久可预期网络不断进化,未来可期

简介: 磐久可预期网络不断进化,未来可期

首图-图标.png


【阅读原文】戳:磐久可预期网络不断进化,未来可期


“计算·进化·未来”

11月5日,「磐久可预期网络」

再次与你相约2022杭州.云栖大会


阿里云磐久可预期网络(简称“可预期网络”)是以应用为中心,通过阿里云全栈自研+端网融合技术实现的高性能可预期网络系统。整个网络系统通过阿里云自研交换机、自研路由器、自研光网络系统及设备、自研网卡以及自研高性能网络协议栈,打造了一个端到端的硬核技术体系,并通过创新性的端网融合技术将各个自研组件进行高效协同,在性能、稳定性、规模等方面均实现了极大提升,为阿里云的超大规模计算、存储集群提供了一个坚实网络底座。


可预期网络自2020年提出以来,不断进化,在2022年云栖大会的可预期网络前沿技术论坛上,发布了多项重磅成果。可预期网络,未来可期!



01

【可预期网络前沿技术】分论坛


本论坛聚焦云计算基础设施行业和产业升级,展示行业最前沿的技术、核心产品、解决方案,共建开放生态、创造发展机遇。在此次论坛上阿里云基础设施网络研发事业部负责人蔡德忠发布了可预期网络最新技术和产品;谭光明教授、黄韬教授带来了从学术界对未来网络演进的思考;Nick Mckeown、Ofer Iny则从工业届的角度对可预期网络演进中的关键技术-可编程技术和下一代芯片技术做了深入分析;付斌章、姚志平分享了PredFabric和可预期网络的关键技术创新和落地情况。


嘉宾演讲人员.png

图 | 《可预期网络前沿技术》分论坛演讲嘉宾


基于阿里云基础设施网络过去5年的大规模部署实践,阿里云基础设施网络研发事业部负责人蔡德忠和大家一起探讨了未来网络技术演进趋势,分享了阿里云的可预期网络发展理念,还同期发布了磐久可预期网络的最新技术创新和产品。


  1. PredFabric 可预期数据中心网络(架构,协议,网卡,服务平台
  2. 基于SONiC的单芯片通用路由器
  3. 新型接入路由器系统 – ePF
  4. 基于SONiC的光电一体DCI设备


DSC01571-opq334610829.jpg

图 | 阿里云基础设施网络研发事业部负责人蔡德忠


PredFabric 可预期数据中心网络(架构,协议,网卡,服务平台)

阿里云自研高性能网络PredFabric,创新性的将上层业务语义和底层网络协议实现有机结合。首先,通过Solar-RDMA RD(Reliable Datagram)传输模式,HPCC拥塞控制算法和多路径乱序传输协议,成功解决了大规模网络的扩展性难题,同时可以更好容忍网络异常,并消除了Slow IO。进一步,Nimitz容器网络通过SR-IOV技术实现了设备的IO虚拟化,并通过OVS流表的硬件加速实现了容器间RDMA通信的极致性能。最后,通过uFAB技术和NUSA(Network Unified Service Architecture)实现了网络性能以及在极端场景下的行为可预期,确保上层业务可以“放心用”高性能网络。目前PredFabric已服务于云存储、灵骏计算、搜推广等多个业务场景,成为阿里云高性能集群的坚实技术底座。同时,基于Solar-RDMA协议的FIC高性能存储网卡已正式商用并规模部署。


1.jpg

图 | 阿里云基础设施网络研发事业部资深技术专家付斌章


基于SONiC的单芯片通用路由器

自研eSR路由器是业界首创SRv6 for SONiC,单芯片单协议栈、全线速加密的自研路由器设备。在超大规模部署及高水平稳定、效率、性能及成本优势的自研交换机基础上,阿里网络通过自研路由器把自研优势引入到路由器领域。更进一步,SRv6 for SONiC让阿里云端网融合理念从数据中心进一步服务到更多的最终应用及用户,让可预期服务化成为网络核心竞争力。基于此,阿里自研网络走出数据中心网络,作为全域网络快速演进、自主可控的硬核能力,在阿里云可控可预期服务化网络的方向上迈出坚实的一步。


2.jpg

图 | 阿里云基础设施网络研发事业部资深技术专家施学美


新型接入路由器系统 – ePF

Elastic Peering Fabric(ePF),新型接入路由器系统,采用全解耦的分布式架构,硬件层面采用单芯片设备(例如自研eSR设备),可以按需弹性scale in/out。ePF采用业界首创的自研BGP控制器+SRTE Fabric的创新设计,使得全网收敛速度比传统设备提高数十倍;ePF全面支持SRv6,通过SRv6端网融合技术为南北向流量提供精细化/自定义的调度。ePF对交付、运营效率有大幅提升,实现故障定位自动化、流量可视化、运维全链路白屏化。ePF彻底解决了传统商用路由器成本高、性能与容量受限,迭代更新慢等问题,大幅简化了网络设备与协议,提升了稳定性,也降低了成本。


3.jpg

图 | 阿里云基础设施网络研发事业部资深技术专家汤勇平


基于SONiC的光电一体DCI设备OBX

光电一体的DCI光网络设备OBX使用自主研发的业界首个基于SONiC的光网络设备软件AONOS(Another Optical Network Operating System),AONOS可用作光网络电层设备和光层设备的操作系统。OBX采用可插拔结构,包括相干收发模块、光放大模块、线路保护模块、波分复用解复用模块等,运行AONOS系统。OBX颠覆光网络设备传统软硬件设计,全栈技术自主可控。可针对业务需求简单灵活组网,适合多种应用场景,并已在实际网络中规模部署。


4.jpg

图 | 阿里云基础设施光网络首席科学家谢崇进



02

“计算之力”主题展馆磐久可预期网络部分最新技术产品展示


磐久可预期网络展区展出了自研路由器eSR/ePF、自研高性能网卡FIC、光网络设备OBX和板载光模块交换机OBO、下一代DNS、IPv6应用等多项可预期网络前沿技术,可预期网络支持多种业务场景,可提供灵活扩展、极致带宽、极低时延的网络服务。


1H3A2295-opq333760542.jpg

“满眼生机转化钧,天工人巧日争新”。今天,云计算正在成为数字经济的新型社会基础设施,作为云计算底座的基础网络将面临更大规模、更高稳定性、更优性能、最佳效率和成本的挑战。作为云计算的坚实技术底座,磐久可预期网络将持续推动技术创新,为我国独立自主掌控先进的基础网络技术做出重要贡献,为了无法计算的价值!



点击 此处 看精彩回放


我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。

欢迎关注 “阿里云基础设施”同名微信微博知乎

获取关于我们的更多信息~

相关文章
|
运维 分布式计算 安全
云计算时代的DCI技术
实现数据中心间互通的纽带——DCI网络
云计算时代的DCI技术
|
Web App开发 存储 缓存
RDMA优化整理(一)
简要的介绍了下RDMA的背景,并给出了一些RDMA编程优化技巧
4290 1
RDMA优化整理(一)
|
6月前
|
存储 人工智能 安全
AI 驱动下的阿里云基础设施:技术创新与产品演进
本文整理自阿里云智能集团副总裁、阿里云弹性计算产品线与存储产品线负责人吴结生在“2025 AI势能大会”上的演讲,重点介绍了阿里云在AI基础设施领域的技术创新与产品演进。内容涵盖CIPU架构、盘古存储系统、高性能网络HPN等关键技术,以及第九代英特尔企业实例、ESSD同城冗余云盘等新产品发布。同时,文章详细阐述了灵骏集群的优化措施和可观测能力的提升,展示阿里云如何通过持续创新为AI负载提供强大支持,助力企业在AI时代实现智能化转型。
AI 驱动下的阿里云基础设施:技术创新与产品演进
|
7月前
|
canal 编解码 运维
SIGCOMM 2024 | 洛神云网络学术活动与论文分享
SIGCOMM 2024 | 洛神云网络学术活动与论文分享
379 6
|
人工智能 网络协议 Android开发
国内首个!高通量以太网协议标准正式发布
近日,在CCF全国高性能计算学术年会上,阿里云、中国科学院计算技术研究所等40余家机构举办发布会,联合发布国内首个高通量以太网ETH+协议标准,可实现集合通信性能30%的提升。
958 7
|
人工智能 数据中心 云计算
AI网络新生态ALS发起成立,信通院、阿里云、AMD等携手制定互连新标准
9月3日,在2024 ODCC开放数据中心大会上,阿里云联合信通院、AMD等国内外十余家业界伙伴发起AI芯片互连开放生态ALS(ALink System)。
AI网络新生态ALS发起成立,信通院、阿里云、AMD等携手制定互连新标准
|
12月前
|
人工智能 关系型数据库 数据中心
2024 OCP全球峰会:阿里云为代表的中国企业,引领全球AI网络合作和技术创新
今年的OCP(Open Compute Project)峰会于2024年10月14日至17日在美国加州圣何塞举行,在这场全球瞩目的盛会上,以阿里云为代表的中国企业,展示了他们在AI网络架构、液冷技术、SRv6和广域网等前沿领域的强大创新能力,持续引领全球合作与技术创新。
|
人工智能 大数据 云计算
中国首个高通量以太网联盟诞生!阿里云等40多家企业率先加入
阿里云与中国科学院计算技术研究所联合发起高通量以太网联盟,中国首个高通量以太网协议即将发布
|
存储 边缘计算 安全
阿里云全球基础设施展示,公共云地域、边缘节点、超级数据中心分布图
本文为大家介绍了阿里云在2024年的全球基础设施布局,包括公共云地域、边缘节点、超级数据中心等各个阶段和方面。阿里云基础设施已覆盖全球四大洲,拥有30个公共云地域和89个可用区,以及超过3200个边缘节点,为其用户提供了广泛且深入的服务覆盖。
阿里云全球基础设施展示,公共云地域、边缘节点、超级数据中心分布图
|
人工智能 负载均衡 网络性能优化
灵骏可预期网络:Built for AI Infrastructure
通用人工智能离我们越来越近,全世界的关注和投入正在带来日新“周”异的变化。回顾人工智能的诞生和发展历程,人类计算能力的进步几乎牵动了每一次的重大技术突破,当前的大模型热潮更是如此,只是动辄千万亿参数级的模型体量,所需计算资源远超单颗芯片的上限,超大规模的计算集群成为支撑技术发展和应用创新的关键基础设施。面向智能:云基础设施网络技术面临新挑战如何突破单个芯片、单个服务器节点的算力上限,在超大规模情况
31378 11
灵骏可预期网络:Built for AI Infrastructure