数据中心网络性能:新应用下的新需求

简介:

随着机器学习,大数据,云计算和NFV不断完善,数据中心网络性能也随之发展。亚马逊,谷歌,百度和腾讯等大型云服务提供商已更新提供IT服务的方式,使之功能更强大,速度更敏捷,灵活性更高。这敲响了传统运营商的警钟,AT&T技术与运营首席策略官John Donovan 表示,AT&T致力于成为“世界上最具侵略性的IT公司”。OTT产品在业界的应用已变得普遍,应用和服务开发都需要创新完善。

数据中心网络性能:新应用下的新需求

他表示:“厂商正在逐渐成为竞争对手,过去的竞争对手变为开源开发等领域的合作伙伴。整个行业的工作方式正在发生变化。我们在标准机构这个平台上共同管理,交流意见解决问题、制作产品。每个参与者都要在规则内,在竞争中合作。”

基于了未来发展和竞争现状,诸如AT&T这样的运营商已经拥抱NFV和分布式计算,以支持应用交付、机器学习和大数据分析来管理基础设施。这些演变需要在数据中心不断发展的前提下实现,以确保大型数据集和IO密集型工作负载的性能。

普通于云计算的企业工作负载是计算密集型的,但不一定是IO密集型。因此,使用NFV和云计算的通信应用程序需要更高要求的网络结构。运用NFV的运营商,需要收集大量在网络的虚拟和物理层的实时数据。

Global Data首席分析师Peter Jarich解释说:“我们致力于实现可以查找任何字节,操作,捕获,重写;通过网络端到端的每个数据包进行时间戳,对交换机中的缓冲进行连续的实时监控。”

性能杠杆:带宽速度

随着对海量数据传输和网络瞬间数据传输的研究逐渐深入,我们发现影响系统性能的原因有两个:原始吞吐量和延迟。

为了解决原始吞吐量的问题,大容量服务器正在重新定义数据中心内的架构和经济模型。我们对提高服务器速度进行投资,使之从10Gb / s提高到25Gb / s以上,提高组织带宽和消息速率升。跟10Gb / s的相比25Gb / s的带宽提高2.5倍,成本在1.3X到1.5X之间。

Gartner数据中心融合和数据中心实践副总裁兼分析师Joe Skorupa表示“从经济角度来看,此举意义重大,现行的25 Gb / s和50 Gb / s服务架构将转换为50 Gb / s和100 Gb / s的网络连接,与此同时光网络成本也在下降 。40Gb / s连接需要四条10 Gb / s的通道,今天的50Gb / s连接由25b / s链路即可,速度的提升意味着价格下降,因为交换机端口和光纤成本都会下降。“

在数据中心互连方面,容量是影响性能的重要因素。例如,移动边缘计算正在成为趋势,因为运营商希望使用机器学习和人工智能来管理具有更多分布式节点的网络。

Jarich指出:“过去,每两百个基站都有一个EPC节点,所以在美国传统的分组核心中将有十几个站点。现在,您可能有成千上万的站点,因为用户需要更多的带宽将其链接到核心。如果我们要在数据中心的网络边缘实施大量的分析和控制,那么我们必须快速提升分析速度和控制的灵活度。”

降低延迟的架构

考虑到延迟的因素,内部数据中心拓扑也在变化,老式的三层设计被leaf-spine的设计所取代,这种设计方式专门用于大数据行业,如不断发展的电信数据中心。传统的三层模式由核心路由器,聚合路由器和接入交换机组成,通过冗余路径互连。但一般只有一个主要路由,只有在主要路由中断的情况下才启动备份路径。

下一代配置中设有两层leaf-spine。leaf层由连接到服务器,防火墙,负载平衡器和边缘路由器等设备的接入交换机组成。spine层由执行路由的骨干交换机组成。每个leaf交换机与每个spine交换机互连,构成网格拓扑,这意味着所有设备的距离包含了信息传播所需的可预测的延迟量。动态路由根据网络变化确定和调整最佳路径。

Skorupa说:“此举显着降低成本的同时提供了大量的横截面带宽,传输大量数据不成问题。我们相信很快也可以50 Gb / s服务器中得到应用。”

即使是在传输少量数据时,高速连接也十分重要。Skorupa解释说:“当您的工作负载传递少量延迟敏感的数据时,从10 Gb / s转为25 Gb / s就有了用武之地。 网络延迟可能只占用了百分之五的时间,但是在10Gb / s连接线缆需要2.5%乃至更长的时间,转换为25 Gb / s意味着从一个节点到另一个节点的所需时间的缩短。所有的这些都使得这些新应用程序更加易于运转。”

从vSwitch卸载(offload)

影响分布式和虚拟化应用程序延迟的另一个问题是虚拟交换机(vSwitch)的性能不足。

Skorupa表示:“当您查看广域网优化和虚拟防火墙等服务时,推出了大量的开放源代码,这是vSwitch的一个性能问题。我们可以通过将一些交换功能迁移到网卡(NIC)中,或者购买更多的服务器,但这会对NFV的投资回报率产生负面影响。

offload的策略减轻了CPU的工作量。通过移动到支持高级内核旁路技术的技术栈实现最低延迟并显着提高数据传输速率。

消息加速软件等辅助技术有助于实现这一点,它可以降低总体延迟并最小化CPU工作负载来提高应用程序的性能。此外,数据平面开发套件(DPDK)提供了一个可编程架构,能够优化应用程序与NIC通信的数据路径。与此同时,它能够更快地处理数据包,这对处理大量以太网数据包处理或高消息速率的应用程序(如虚拟化网络功能)尤为有益。

Jarich表示:“运营商越来越乐于拥抱云计算,尤其是当他们搭建5G网络并具有较大工作量时。移动分布式计算的可带来更低的延迟,回程节省,更高的可管理性,因此深受运营商青睐。”


本文作者:佚名          

来源:51CTO

目录
相关文章
|
6天前
|
容灾 网络协议 数据库
云卓越架构:云上网络稳定性建设和应用稳定性治理最佳实践
本文介绍了云上网络稳定性体系建设的关键内容,包括面向失败的架构设计、可观测性与应急恢复、客户案例及阿里巴巴的核心电商架构演进。首先强调了网络稳定性的挑战及其应对策略,如责任共担模型和冗余设计。接着详细探讨了多可用区部署、弹性架构规划及跨地域容灾设计的最佳实践,特别是阿里云的产品和技术如何助力实现高可用性和快速故障恢复。最后通过具体案例展示了秒级故障转移的效果,以及同城多活架构下的实际应用。这些措施共同确保了业务在面对网络故障时的持续稳定运行。
|
29天前
|
Kubernetes 安全 Devops
有效抵御网络应用及API威胁,聊聊F5 BIG-IP Next Web应用防火墙
有效抵御网络应用及API威胁,聊聊F5 BIG-IP Next Web应用防火墙
63 10
有效抵御网络应用及API威胁,聊聊F5 BIG-IP Next Web应用防火墙
|
7天前
|
负载均衡 容灾 Cloud Native
云原生应用网关进阶:阿里云网络ALB Ingress 全能增强
在过去半年,ALB Ingress Controller推出了多项高级特性,包括支持AScript自定义脚本、慢启动、连接优雅中断等功能,增强了产品的灵活性和用户体验。此外,还推出了ingress2Albconfig工具,方便用户从Nginx Ingress迁移到ALB Ingress,以及通过Webhook服务实现更智能的配置校验,减少错误配置带来的影响。在容灾部署方面,支持了多集群网关,提高了系统的高可用性和容灾能力。这些改进旨在为用户提供更强大、更安全的云原生网关解决方案。
114 8
|
9天前
|
数据采集 JavaScript 前端开发
异步请求在TypeScript网络爬虫中的应用
异步请求在TypeScript网络爬虫中的应用
|
10天前
|
数据采集 网络协议 JavaScript
网络爬虫性能提升:requests.Session的会话持久化策略
网络爬虫性能提升:requests.Session的会话持久化策略
|
1月前
|
运维 监控 持续交付
自动化运维在现代数据中心的应用与实践####
本文探讨了自动化运维技术在现代数据中心中的应用现状与实践案例,分析了其如何提升运维效率、降低成本并增强系统稳定性。通过具体实例,展示了自动化工具如Ansible、Puppet及Docker在环境配置、软件部署、故障恢复等方面的实际应用效果,为读者提供了一套可参考的实施框架。 ####
|
1月前
|
存储 安全 网络安全
网络安全的盾与剑:漏洞防御与加密技术的实战应用
在数字化浪潮中,网络安全成为保护信息资产的重中之重。本文将深入探讨网络安全的两个关键领域——安全漏洞的防御策略和加密技术的应用,通过具体案例分析常见的安全威胁,并提供实用的防护措施。同时,我们将展示如何利用Python编程语言实现简单的加密算法,增强读者的安全意识和技术能力。文章旨在为非专业读者提供一扇了解网络安全复杂世界的窗口,以及为专业人士提供可立即投入使用的技术参考。
|
1月前
|
存储 缓存 监控
Docker容器性能调优的关键技巧,涵盖CPU、内存、网络及磁盘I/O的优化策略,结合实战案例,旨在帮助读者有效提升Docker容器的性能与稳定性。
本文介绍了Docker容器性能调优的关键技巧,涵盖CPU、内存、网络及磁盘I/O的优化策略,结合实战案例,旨在帮助读者有效提升Docker容器的性能与稳定性。
126 7
|
1月前
|
机器学习/深度学习 人工智能 运维
智能化运维在现代数据中心的应用与挑战####
本文深入探讨了智能化运维(AIOps)技术在现代数据中心管理中的实际应用,分析了其带来的效率提升、成本节约及潜在风险。通过具体案例,阐述了智能监控、自动化故障排查、容量规划等关键功能如何助力企业实现高效稳定的IT环境。同时,文章也指出了实施过程中面临的数据隐私、技术整合及人才短缺等挑战,并提出了相应的解决策略。 --- ####
52 1
|
1月前
|
机器学习/深度学习 数据采集 人工智能
智能化运维在现代数据中心的应用与挑战####
本文深入探讨了智能化运维(AIOps)技术如何革新现代数据中心的运维管理,通过集成人工智能、大数据分析及自动化工具,显著提升系统稳定性、效率和响应速度。文章首先概述了AIOps的核心概念与技术框架,随后详细分析了其在故障预测、异常检测、容量规划及事件响应等方面的应用实例,最后探讨了实施过程中面临的数据质量、技能匹配及安全性等挑战,并提出了相应的应对策略。本研究旨在为数据中心管理者提供关于采纳和优化AIOps实践的洞见,以期推动行业向更高效、智能的运维模式转型。 ####