阿里云飞天洛神2.0:开放弹性的云网络NFV平台

本文涉及的产品
公网NAT网关,每月750个小时 15CU
简介: 作为飞天系统的核心组件,洛神平台支撑了超大规模租户、超大规模虚拟机的高性能云网络。其中洛神2.0 NFV平台的定位是构建通用、灵活的平台能力,降低业务网元NFV化的门槛和成本,实现了复杂业务网元超高的灵活性和弹性。

云网络架构

阿里云操作系统叫飞天,云网络平台称为洛神。作为飞天系统的核心组件,洛神平台支撑了超大规模租户、超大规模虚拟机的高性能云网络。

洛神平台由很多网络设备组成,在架构上主要可以分为两类:虚拟交换机AVS和各种网关设备。AVS负责ECS的虚拟网络接入,网关设备提供了丰富的网络功能和服务。

1.png

早期的洛神平台中,AVS和网关设备都是在x86物理机上基于kernel架构实现的,转发性能不高。随着DPDK技术的成熟,在洛神1.0架构中,AVS和网关设备基于DPDK进行了重构,使转发性能有显著提升,网关设备单物理机能提供100G+的转发能力。此外,我们也基于DPDK开发了一套高性能的通用转发平台NetFrame,包含了收发包、协议栈等通用的网络基础特性,屏蔽了DPDK版本和底层硬件差异,并做了大量的算法库优化和性能调优,使各网关产品能更专注于业务功能的快速演进。

2.png

在过去很长一段时间里,这个架构很好的满足了业务需求,并支撑了云网络的快速发展。但近几年,随着搬站和集团上云的推进,网络业务和流量出现了数量级增长,基于x86物理机软转发架构的问题也日益突出:

  • • 单核性能瓶颈,大流量或攻击场景容易打爆
  • • 部分场景业务流量激增,达到数十Tbps,物理机转发性能和业务述求间差了几个数量级
  • • 物理机扩容周期长,弹性不足,无法按需扩缩容
  • • 开放能力不足,无法支持生态部署
  • • ......

软硬件一体化

上述问题中,最关键的两个述求是高性能和高弹性。在这个背景下,洛神平台升级到了2.0架构,通过软硬件一体化,打造了连接全球、超大规模、弹性开放的新一代云网络平台。

硬件是解决性能问题的最佳选择。近几年随着SDN技术的普及,交换芯片和智能网卡都具备了不错的可编程能力,已经能很好的满足云网络基础需求。洛神2.0中,AVS和基础网关设备实现了硬件加速,使转发性能显著提升,单核问题和水位问题也都不复存在。

硬件性能很好,但可编程能力和资源都比较有限。对于路由、转发,硬件很擅长;但对于NAT、SLB这些有状态的复杂业务,硬件就有点力不从心了。除了硬件加速,洛神2.0还构建了新一代NFV平台,拥抱云原生,将网元逻辑部署在通用ECS上,提供弹性和开放能力,很好的弥补了硬件灵活性不足的问题。

3.png

通过软硬件一体化,基础网元通过硬件实现了超高的转发性能,复杂的业务网元则基于NFV平台实现了超高的灵活性和弹性。

4.png

云网络NFV平台

NFV的关键技术是构建平台能力,包括虚拟网络的调度能力和NFV资源池的抽象管理能力。基于平台能力,加上在ECS内实现的网络功能,就可以包装出各种网元产品了。

洛神2.0 NFV平台的定位就是构建通用、灵活的平台能力,降低业务网元NFV化的门槛和成本,提高产品能效。整个平台由NFV转发和NFV管控两部分组成,在实现上主要有以下特点:

  • • 基于ECS构建资源池,提供分钟级交付和弹性伸缩能力
  • • 支持多租户模式,提供通用的负载均衡、弹性扩缩容、故障隔离等基础能力
  • • 支持网络功能的服务链编排,将网络产品和安全产品串接成解决方案
  • • 支持第三方生态接入

5.png

NFV转发平台采用了分层设计,通过抽象转发层和业务逻辑层,实现了转发的快慢速分离。受益于洛神1.0中对于DPDK和NetFrame的积累,业务网元从物理机迁移到ECS后仍具备了很高的转发性能,结合ECS的弹性和NFV架构的水平伸缩能力,能分钟级交付单客户100G+的转发能力。

NFV管控平台通过服务化形式,为各业务网元管控提供了通用的资源池化、弹性扩缩容、故障隔离、服务链编排等通用管控能力。通过NFV管控的抽象层,底层转发资源、水位、调度、隔离对业务网元管控透明,业务网元管控可以更加专注于自身业务逻辑的快速演进。

丰富的NFV网元

作为洛神2.0的重要一部分,目前PrivateLink、NAT、SLB等网元产品已经演进到了新一代的NFV架构,并通过新架构获得了很好的弹性和灵活性,后续也会有多的产品基于NFV架构进行构建和演进。

此外,通过NFV平台,第三方厂商可以将其应用移到阿里云,和阿里云自建网元一样获取弹性和调度能力,并在云市场里对云上的客户进行售卖和提供服务,形成一个非常好的生态系统,丰富云上客户的选择。
6.png

相关实践学习
一小时快速掌握 SQL 语法
本实验带您学习SQL的基础语法,快速入门SQL。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
1月前
|
机器学习/深度学习 人工智能 算法
【AAAI 2024】再创佳绩!阿里云人工智能平台PAI多篇论文入选
阿里云人工智能平台PAI发表的多篇论文在AAAI-2024上正式亮相发表。AAAI是由国际人工智能促进协会主办的年会,是人工智能领域中历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议。论文成果是阿里云与浙江大学、华南理工大学联合培养项目等共同研发,深耕以通用人工智能(AGI)为目标的一系列基础科学与工程问题,包括多模态理解模型、小样本类增量学习、深度表格学习和文档版面此次入选意味着阿里云人工智能平台PAI自研的深度学习算法达到了全球业界先进水平,获得了国际学者的认可,展现了阿里云人工智能技术创新在国际上的竞争力。
|
2月前
|
人工智能 运维 Cloud Native
阿里云祝顺民:云网络领域关键技术创新
2023年10月31日,云栖大会,阿里云技术主论坛带来了一场关于阿里云主力产品与技术创新的深度解读,阿里云网络产品线负责人祝顺民带来《云智创新,网络随行》的主题发言,针对阿里云飞天洛神云网络(下文简称洛神网络)领域产品服务创新以及背后的技术积累进行了深度解读,不少背后的创新技术系首次重磅披露。
215 2
|
3月前
|
机器学习/深度学习 PyTorch 算法框架/工具
在阿里云机器学习平台上布置一个PyTorch模型
在阿里云机器学习平台上布置一个PyTorch模型【1月更文挑战第21天】【1月更文挑战第105篇】
162 1
|
1月前
|
弹性计算 安全 定位技术
幻兽帕鲁服务器搭建攻略:【阿里云平台快速上手指南】
2024年,火爆畅销的《幻兽帕鲁》游戏让无数玩家着迷不已!那么,您是否急切想要拥有一个能与伙伴们一起畅快玩耍的游戏服务器呢?现在就跟随若城的脚步,一起动手搭建一个属于自己的《幻兽帕鲁》服务器吧!让这个新年有心意
|
2月前
|
弹性计算 Linux 数据安全/隐私保护
幻兽帕鲁服务器搭建攻略:阿里云平台快速上手指南
2024年,火爆畅销的《幻兽帕鲁》游戏让无数玩家着迷不已!那么,您是否急切想要拥有一个能与伙伴们一起畅快玩耍的游戏服务器呢?现在就跟随若城的脚步,一起动手搭建一个属于自己的《幻兽帕鲁》服务器吧!让这个新年有心意, 让这个寒假更有趣
75092 10
|
16天前
|
消息中间件 Cloud Native Serverless
飞天发布时刻丨阿里云 ApsaraMQ 全面升级,携手 Confluent 发布全新产品
阿里云在3月29日的飞天发布时刻宣布ApsaraMQ全面升级,实现全系产品Serverless化,与Confluent合作推出新产品,强化云原生消息队列服务。
|
1月前
|
缓存 运维 监控
应用研发平台EMAS 常见问题之用华为的推送界面阿里云收不到如何解决
应用研发平台EMAS(Enterprise Mobile Application Service)是阿里云提供的一个全栈移动应用开发平台,集成了应用开发、测试、部署、监控和运营服务;本合集旨在总结EMAS产品在应用开发和运维过程中的常见问题及解决方案,助力开发者和企业高效解决技术难题,加速移动应用的上线和稳定运行。
382 2
|
1月前
|
存储 数据采集 Apache
众安保险 CDP 平台:借助阿里云数据库 SelectDB 版内核 Apache Doris 打破数据孤岛,人群圈选提速4倍
随着业务在金融、保险和商城领域的不断扩展,众安保险建设 CDP 平台以提供自动化营销数据支持。早期 CDP 平台依赖于 Spark + Impala + Hbase + Nebula 复杂的技术组合,这不仅导致数据分析形成数据孤岛,还带来高昂的管理及维护成本。为解决该问题,众安保险引入 Apache Doris,替换了早期复杂的技术组合,不仅降低了系统的复杂性,打破了数据孤岛,更提升了数据处理的效率。
众安保险 CDP 平台:借助阿里云数据库 SelectDB 版内核 Apache Doris 打破数据孤岛,人群圈选提速4倍
|
2月前
|
网络协议 物联网 Linux
WireGuard 系列文章(五):Netmaker 简介 - 创建和管理 WireGuard 网络的平台
WireGuard 系列文章(五):Netmaker 简介 - 创建和管理 WireGuard 网络的平台
|
2月前
|
人工智能 运维 Cloud Native
重磅解读阿里云云网络领域关键技术创新
2023年10月31日,杭州·云栖大会,阿里云技术主论坛带来了一场关于阿里云主力产品与技术创新的深度解读,阿里云网络产品线负责人祝顺民带来《云智创新,网络随行》的主题发言,针对阿里云飞天洛神云网络(下文简称洛神网络)领域产品服务创新以及背后的技术积累进行了深度解读,不少背后的创新技术系首次重磅披露。
127895 3