技术性能领先,阿里云网络产品全面升级为企业级

本文涉及的产品
网络型负载均衡 NLB,每月750个小时 15LCU
应用型负载均衡 ALB,每月750个小时 15LCU
公网NAT网关,每月750个小时 15CU
简介: 在12月13日的阿里云网络产品发布会上,阿里云将详细介绍其网络产品家族重大更新,阿里云网络产品已经全面升级为企业级。届时,云栖社区将会对发布会进行直播,欢迎预约https://yq.aliyun.com/promotion/434。

在12月13日的阿里云网络产品发布会上,阿里云将详细介绍其网络产品家族重大更新,阿里云网络产品已经全面升级为企业级。届时,云栖社区将会对发布会进行直播,欢迎预约https://yq.aliyun.com/promotion/434

那么,如何理解升级为企业级呢?我们认为企业级需求主要有产品丰富度、性能、稳定、安全几个方面。

首先,丰富的产品家族满足企业级多样需求。

随着云骨干网的发布,阿里云已经有涵盖5大场景的11款网络产品(还不包括DNS),是Top云计算公司中网络产品最多的。

3

尤其是云骨干网的发布,标志着阿里云网络产品进一步向企业级用户演进、向智能网络演进。

其次,企业级需求的一个重要特点是高性能。对网络来说,主要是ECS网络性能,负载均衡性能,NAT网关性能,以及VPC相关的容量。经过多年的自主研发,目前网络相关的性能已经完全满足各种规模的企业级用户的需求。特别值得一提的是,阿里云网络产品系列在今年的双11中经受了实战考验。具体实战性能如下表所示

4

注:部分双11指标超过核心指标是针对实例级别的单独调整。

ECS网络性能方面, 随着物理网络升级到25G,第二代Apsara vSwitch全面上线,单实例PPS性能已经达到450万,Latency降低了66%,实现了媲美物理机的性能。有兴趣的同学可以参考技术揭秘https://yq.aliyun.com/articles/215982

负载均衡性能方面,业内首创的性能保障型实例在所有地域陆续上线,确保用户获得需要的性能,而不需要预热等机制。在具体的性能指标上,单实例可支持100万并发连接,10万新建连接,5万QPS,并且有单实例更高性能需求的用户还可以申请开通更高性能的实例。这些性能指标的背后是负载均衡产品软件,硬件,OS等多个层面的深度优化。有兴趣的同学可以参考技术揭秘https://yq.aliyun.com/articles/218895

NAT网关产品,主要是SNAT最大连接数指标,目前线上公有云是100万,随着NAT网关技术升级,NAT网关的最大连接数和新建连接数指标即将“无限”,成为更强的企业级公网网关产品。

VPC容量方面,单VPC可支撑10万台ECS,单个Region支持100万VPC,双11的场景下,单VPC已经支持超过2万ECS和5万容器了。

再次,稳定是企业级需求中压倒一切的根本。主动维护时99%的场景下能热升级,不影响用户使用。集群中的机器出现异常时能自动处理不影响用户。整个可用区故障时,系统能自动切换,尽可能短的影响用户。经过长时间的研发,目前网络产品在以下方面取得了不错的进展。

第一是全局配置同步,支持可用区级别的容灾。即一个实例的配置在Region内所有可用区都是存储的,比如华东1Region的一个EIP,这个EIP的配置会在华东1下所有的可用区存在,这是出现问题时能够快速恢复的前提。在这个基础上网络相关产品,如EIP,负载均衡,NAT网关等都实现了可用区级别的容灾,即如果一个可用区出现故障,系统能在20秒内自动切换到另一个可用区继续服务,从而提升了用户系统的稳定性。

第二是热升级,升级时99%的情况下0中断。云产品需要快速迭代,这就意味着需要经常对系统进行升级。此外,随着集群规模的不断扩大,机器故障也变成了常态,这就需要系统支持热升级,尽量减少用户系统的闪断。特别是对于有状态的负载均衡来说,这一点尤其重要。负载均衡采用集群部署模式,避免了单点性能瓶颈和单点故障,但是,集群中的多台机器如果有一台出现故障,其它机器如何接管这台机器的会话从而不中断故障机器上的会话呢?负载均衡采用了Session同步机制来解决这个问题,可以参考https://yq.aliyun.com/articles/191149

5

除了这些产品方面的稳定性功能外,在数据中心IDC的风火水电网等基础设施方面,阿里云IDC采用双向独立市电引入,机架服务器AB路供电,并且具有电池后备电源,可无缝接管25分钟,IDC具有业界顶尖的N+1冗余柴油发电机,可分钟级切换。同时IDC具有高可用的骨干网络,AZ间低延迟、AZ内双冗余、三路由出口光纤冗余,3+N超多线冗余BGP,平均延迟小于40ms,平均丢包率小于1%。诸多的基础设施保障稳定性。

最后,企业级需求必须要保障的一点是安全。安全涉及的面比较广,本文不讨论诸如DDoS攻击,WAF,加密审计等方面的安全,仅仅从网络产品的角度谈谈网络安全。对网络产品来说,最关键的安全就是VPC。VPC基于数据链路层,使用隧道技术进行租户隔离,比经典网络的三层隔离更安全。
如下图所示,VM1和VM3使用隧道ID 100,VM2和VM4使用隧道ID 200,这2个隧道ID就对应两个不同的用户,虽然都在一张网络中通信,但由于隧道ID不同,彼此是无法通信的,这确保了租户的安全隔离。

6

除了VPC外,还有一系列的安全机制,比如安全组在VPC内也可以正常使用,还有负载均衡白名单以及即将上线的黑名单功能,后续公网相关产品会统一支持类似黑白名单的机制。另外,网络ACL功能也在研发中,上线后能进一步增加网络安全性。

未来,网络产品会继续关注企业级用户的需求,提供更多的企业级功能和特性。

相关实践学习
快速体验PolarDB开源数据库
本实验环境已内置PostgreSQL数据库以及PolarDB开源数据库:PolarDB PostgreSQL版和PolarDB分布式版,支持一键拉起使用,方便各位开发者学习使用。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
18天前
|
边缘计算 人工智能 5G
5G引领家庭网络升级:速度、稳定性与智能化的新时代
5G引领家庭网络升级:速度、稳定性与智能化的新时代
134 68
|
1月前
|
供应链 安全 网络协议
|
7天前
|
人工智能 算法 异构计算
阿里云基础网络技术5篇论文入选全球网络顶会NSDI
近日,阿里云基础网络技术5篇论文被NSDI 2025主会录用。研究涵盖大模型训练网络故障诊断、仿真、容器网络性能诊断、CDN流控算法智能选择及GPU解耦推理优化等领域。其中,《Evolution of Aegis》提出增强现有体系+训练过程感知的两阶段演进路线,显著降低故障诊断耗时;《SimAI》实现高精度大模型集群训练模拟;《Learning Production-Optimized Congestion Control Selection》通过AliCCS优化CDN拥塞控制;《Prism》设计全新GPU解耦推理方案;《ScalaCN》解决容器化RDMA场景性能问题。
41 7
阿里云基础网络技术5篇论文入选全球网络顶会NSDI
|
21天前
|
机器学习/深度学习 算法 PyTorch
Perforated Backpropagation:神经网络优化的创新技术及PyTorch使用指南
深度学习近年来在多个领域取得了显著进展,但其核心组件——人工神经元和反向传播算法自提出以来鲜有根本性突破。穿孔反向传播(Perforated Backpropagation)技术通过引入“树突”机制,模仿生物神经元的计算能力,实现了对传统神经元的增强。该技术利用基于协方差的损失函数训练树突节点,使其能够识别神经元分类中的异常模式,从而提升整体网络性能。实验表明,该方法不仅可提高模型精度(如BERT模型准确率提升3%-17%),还能实现高效模型压缩(参数减少44%而无性能损失)。这一革新为深度学习的基础构建模块带来了新的可能性,尤其适用于边缘设备和大规模模型优化场景。
58 16
Perforated Backpropagation:神经网络优化的创新技术及PyTorch使用指南
|
16天前
|
存储 消息中间件 弹性计算
阿里云服务器ECS计算型c7和通用算力型u1在适用场景、计算性能、网络与存储性能等方面的对比
阿里云ECS服务器u1和c7实例在适用场景、性能、处理器特性等方面存在显著差异。u1为通用算力型,性价比高,适合中小企业及对性能要求不高的场景;c7为企业级计算型,采用最新Intel处理器,性能稳定且强大,适用于高性能计算需求。u1支持多种CPU内存配比,但性能一致性可能受底层平台影响;c7固定调度模式,确保高性能与稳定性。选择时可根据预算与性能需求决定。
75 23
|
1天前
|
监控 算法 JavaScript
基于 JavaScript 图算法的局域网网络访问控制模型构建及局域网禁止上网软件的技术实现路径研究
本文探讨局域网网络访问控制软件的技术框架,将其核心功能映射为图论模型,通过节点与边表示终端设备及访问关系。以JavaScript实现DFS算法,模拟访问权限判断,优化动态策略更新与多层级访问控制。结合流量监控数据,提升网络安全响应能力,为企业自主研发提供理论支持,推动智能化演进,助力数字化管理。
16 4
|
1月前
|
存储 双11 数据中心
数据中心网络关键技术,技术发明一等奖!
近日,阿里云联合清华大学与中国移动申报的“性能可预期的大规模数据中心网络关键技术与应用”项目荣获中国电子学会技术发明一等奖。该项目通过端网融合架构,实现数据中心网络性能的可预期性,在带宽保障、时延控制和故障恢复速度上取得重大突破,显著提升服务质量。成果已应用于阿里云多项产品及重大社会活动中,如巴黎奥运会直播、“双十一”购物节等,展现出国际领先水平。
|
25天前
|
人工智能 运维 监控
阿里云携手神州灵云打造云内网络性能监测标杆 斩获中国信通院高质量数字化转型十大案例——金保信“云内网络可观测”方案树立云原生运维新范式
2025年,金保信社保卡有限公司联合阿里云与神州灵云申报的《云内网络性能可观测解决方案》入选高质量数字化转型典型案例。该方案基于阿里云飞天企业版,融合云原生引流技术和流量“染色”专利,解决云内运维难题,实现主动预警和精准观测,将故障排查时间从数小时缩短至15分钟,助力企业降本增效,形成可跨行业复制的数字化转型方法论。
|
1月前
|
存储 监控 算法
基于 Python 哈希表算法的局域网网络监控工具:实现高效数据管理的核心技术
在当下数字化办公的环境中,局域网网络监控工具已成为保障企业网络安全、确保其高效运行的核心手段。此类工具通过对网络数据的收集、分析与管理,赋予企业实时洞察网络活动的能力。而在其运行机制背后,数据结构与算法发挥着关键作用。本文聚焦于 PHP 语言中的哈希表算法,深入探究其在局域网网络监控工具中的应用方式及所具备的优势。
80 7
|
16天前
|
canal 负载均衡 智能网卡
阿里云洛神云网络论文入选SIGCOMM'25主会,相关实习生岗位火热招聘中
阿里云飞天洛神云网络的两项核心技术Nezha和Hermes被SIGCOMM 2025主会录用。Nezha通过计算网络解耦实现vSwitch池化架构,大幅提升网络性能;Hermes则提出用户态引导I/O事件通知框架,优化L7负载均衡。这两项技术突破解决了云网络中的关键问题,展现了阿里云在网络领域的领先实力。
166 0