阿里云飞天洛神2.0:开放弹性的云网络NFV平台

本文涉及的产品
应用型负载均衡 ALB,每月750个小时 15LCU
公网NAT网关,每月750个小时 15CU
全球加速 GA,每月750个小时 15CU
简介: 作为飞天系统的核心组件,洛神平台支撑了超大规模租户、超大规模虚拟机的高性能云网络。其中洛神2.0 NFV平台的定位是构建通用、灵活的平台能力,降低业务网元NFV化的门槛和成本,实现了复杂业务网元超高的灵活性和弹性。

云网络架构

阿里云操作系统叫飞天,云网络平台称为洛神。作为飞天系统的核心组件,洛神平台支撑了超大规模租户、超大规模虚拟机的高性能云网络。

洛神平台由很多网络设备组成,在架构上主要可以分为两类:虚拟交换机AVS和各种网关设备。AVS负责ECS的虚拟网络接入,网关设备提供了丰富的网络功能和服务。

1.png

早期的洛神平台中,AVS和网关设备都是在x86物理机上基于kernel架构实现的,转发性能不高。随着DPDK技术的成熟,在洛神1.0架构中,AVS和网关设备基于DPDK进行了重构,使转发性能有显著提升,网关设备单物理机能提供100G+的转发能力。此外,我们也基于DPDK开发了一套高性能的通用转发平台NetFrame,包含了收发包、协议栈等通用的网络基础特性,屏蔽了DPDK版本和底层硬件差异,并做了大量的算法库优化和性能调优,使各网关产品能更专注于业务功能的快速演进。

2.png

在过去很长一段时间里,这个架构很好的满足了业务需求,并支撑了云网络的快速发展。但近几年,随着搬站和集团上云的推进,网络业务和流量出现了数量级增长,基于x86物理机软转发架构的问题也日益突出:

  • • 单核性能瓶颈,大流量或攻击场景容易打爆
  • • 部分场景业务流量激增,达到数十Tbps,物理机转发性能和业务述求间差了几个数量级
  • • 物理机扩容周期长,弹性不足,无法按需扩缩容
  • • 开放能力不足,无法支持生态部署
  • • ......

软硬件一体化

上述问题中,最关键的两个述求是高性能和高弹性。在这个背景下,洛神平台升级到了2.0架构,通过软硬件一体化,打造了连接全球、超大规模、弹性开放的新一代云网络平台。

硬件是解决性能问题的最佳选择。近几年随着SDN技术的普及,交换芯片和智能网卡都具备了不错的可编程能力,已经能很好的满足云网络基础需求。洛神2.0中,AVS和基础网关设备实现了硬件加速,使转发性能显著提升,单核问题和水位问题也都不复存在。

硬件性能很好,但可编程能力和资源都比较有限。对于路由、转发,硬件很擅长;但对于NAT、SLB这些有状态的复杂业务,硬件就有点力不从心了。除了硬件加速,洛神2.0还构建了新一代NFV平台,拥抱云原生,将网元逻辑部署在通用ECS上,提供弹性和开放能力,很好的弥补了硬件灵活性不足的问题。

3.png

通过软硬件一体化,基础网元通过硬件实现了超高的转发性能,复杂的业务网元则基于NFV平台实现了超高的灵活性和弹性。

4.png

云网络NFV平台

NFV的关键技术是构建平台能力,包括虚拟网络的调度能力和NFV资源池的抽象管理能力。基于平台能力,加上在ECS内实现的网络功能,就可以包装出各种网元产品了。

洛神2.0 NFV平台的定位就是构建通用、灵活的平台能力,降低业务网元NFV化的门槛和成本,提高产品能效。整个平台由NFV转发和NFV管控两部分组成,在实现上主要有以下特点:

  • • 基于ECS构建资源池,提供分钟级交付和弹性伸缩能力
  • • 支持多租户模式,提供通用的负载均衡、弹性扩缩容、故障隔离等基础能力
  • • 支持网络功能的服务链编排,将网络产品和安全产品串接成解决方案
  • • 支持第三方生态接入

5.png

NFV转发平台采用了分层设计,通过抽象转发层和业务逻辑层,实现了转发的快慢速分离。受益于洛神1.0中对于DPDK和NetFrame的积累,业务网元从物理机迁移到ECS后仍具备了很高的转发性能,结合ECS的弹性和NFV架构的水平伸缩能力,能分钟级交付单客户100G+的转发能力。

NFV管控平台通过服务化形式,为各业务网元管控提供了通用的资源池化、弹性扩缩容、故障隔离、服务链编排等通用管控能力。通过NFV管控的抽象层,底层转发资源、水位、调度、隔离对业务网元管控透明,业务网元管控可以更加专注于自身业务逻辑的快速演进。

丰富的NFV网元

作为洛神2.0的重要一部分,目前PrivateLink、NAT、SLB等网元产品已经演进到了新一代的NFV架构,并通过新架构获得了很好的弹性和灵活性,后续也会有多的产品基于NFV架构进行构建和演进。

此外,通过NFV平台,第三方厂商可以将其应用移到阿里云,和阿里云自建网元一样获取弹性和调度能力,并在云市场里对云上的客户进行售卖和提供服务,形成一个非常好的生态系统,丰富云上客户的选择。
6.png

相关实践学习
2分钟自动化部署人生模拟器
本场景将带你借助云效流水线Flow实现人生模拟器小游戏的自动化部署
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
7天前
|
存储 监控 安全
网络安全视角:从地域到账号的阿里云日志审计实践
日志审计的必要性在于其能够帮助企业和组织落实法律要求,打破信息孤岛和应对安全威胁。选择 SLS 下日志审计应用,一方面是选择国家网络安全专用认证的日志分析产品,另一方面可以快速帮助大型公司统一管理多组地域、多个账号的日志数据。除了在日志服务中存储、查看和分析日志外,还可通过报表分析和告警配置,主动发现潜在的安全威胁,增强云上资产安全。
|
1天前
|
人工智能 网络协议 数据中心
阿里云基础设施网络2024年创新总结
本文将盘点阿里云基础设施网络团队2024年在AI时代可预期网络的技术突破、学术成果、开源生态共建与重要会议技术布道等,与业界同仁一同探讨和展望AI时代的网络技术发展热点和趋势。
阿里云基础设施网络2024年创新总结
|
5天前
|
负载均衡 芯片 异构计算
NSDI'24 | 阿里云飞天洛神云网络论文解读——《LuoShen》揭秘新型融合网关 洛神云网关
NSDI‘24于4月16-18日在美国圣塔克拉拉市举办,阿里云飞天洛神云网络首次中稿NSDI,两篇论文入选。其中《LuoShen: A Hyper-Converged Programmable Gateway for Multi-Tenant Multi-Service Edge Clouds》提出超融合网关LuoShen,基于Tofino、FPGA和CPU的新型硬件形态,将公有云VPC设施部署到边缘机柜中,实现小型化、低成本和高性能。该方案使成本降低75%,空间占用减少87%,并提供1.2Tbps吞吐量,展示了强大的技术竞争力。
|
7天前
|
Web App开发 监控 网络协议
网络分析与监控:阿里云拨测方案解密
阿里云网络拨测业务提供了全球、多种协议、多种网络态势的用户网络性能和用户体验监控场景的全面可观测方案。该文章从拨测场景下,介绍了用户如何快速的构建一套全球用户视角的服务可用性大盘,为客户的业务保驾护航。
|
5天前
|
SQL Cloud Native API
NSDI'24 | 阿里云飞天洛神云网络论文解读——《Poseidon》揭秘新型超高性能云网络控制器
NSDI‘24于4月16-18日在美国加州圣塔克拉拉市举办,汇聚全球网络系统领域的专家。阿里云飞天洛神云网络的两篇论文入选,标志着其创新能力获广泛认可。其中,《Poseidon: A Consolidated Virtual Network Controller that Manages Millions of Tenants via Config Tree》介绍了波塞冬平台,该平台通过统一控制器架构、高性能配置计算引擎等技术,实现了对超大规模租户和设备的高效管理,显著提升了云网络性能与弹性。实验结果显示,波塞冬在启用EIP时的完成时间比Top 5厂商分别快1.8至55倍和2.6至4.8倍。
|
1月前
|
SQL 安全 网络安全
网络安全与信息安全:知识分享####
【10月更文挑战第21天】 随着数字化时代的快速发展,网络安全和信息安全已成为个人和企业不可忽视的关键问题。本文将探讨网络安全漏洞、加密技术以及安全意识的重要性,并提供一些实用的建议,帮助读者提高自身的网络安全防护能力。 ####
73 17
|
1月前
|
存储 SQL 安全
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
随着互联网的普及,网络安全问题日益突出。本文将介绍网络安全的重要性,分析常见的网络安全漏洞及其危害,探讨加密技术在保障网络安全中的作用,并强调提高安全意识的必要性。通过本文的学习,读者将了解网络安全的基本概念和应对策略,提升个人和组织的网络安全防护能力。
|
1月前
|
SQL 安全 网络安全
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
随着互联网的普及,网络安全问题日益突出。本文将从网络安全漏洞、加密技术和安全意识三个方面进行探讨,旨在提高读者对网络安全的认识和防范能力。通过分析常见的网络安全漏洞,介绍加密技术的基本原理和应用,以及强调安全意识的重要性,帮助读者更好地保护自己的网络信息安全。
59 10
|
1月前
|
SQL 安全 网络安全
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
在数字化时代,网络安全和信息安全已成为我们生活中不可或缺的一部分。本文将介绍网络安全漏洞、加密技术和安全意识等方面的内容,并提供一些实用的代码示例。通过阅读本文,您将了解到如何保护自己的网络安全,以及如何提高自己的信息安全意识。
66 10
|
1月前
|
存储 监控 安全
云计算与网络安全:云服务、网络安全、信息安全等技术领域的融合与挑战
本文将探讨云计算与网络安全之间的关系,以及它们在云服务、网络安全和信息安全等技术领域中的融合与挑战。我们将分析云计算的优势和风险,以及如何通过网络安全措施来保护数据和应用程序。我们还将讨论如何确保云服务的可用性和可靠性,以及如何处理网络攻击和数据泄露等问题。最后,我们将提供一些关于如何在云计算环境中实现网络安全的建议和最佳实践。