数据中心网络带宽线速有门道

本文涉及的产品
多模态交互后付费免费试用,全链路、全Agent
简介:

线速是体现网络设备转发性能的一项重要指标,很多数据中心在采购网络设备时,都会要求设备具备线速能力,或者是部分线速能力。在RFC 1242中对线速做了定义:在不丢失任何一个帧的情况下最大转发速率,以太网吞吐量最大理论值称为线速,若是千兆设备就要达到千兆的线速,若是万兆设备就要达到万兆的线速。理论归理论,实际中毕竟要考虑很多外界的干扰因素,因此很多时候的网络都是“伪线速”,线速是要在特定情况下,实验室环境中才能测试出来的。在选型设备时,不必一味强调满足各种情况下的线速,实际中除了广播风暴,也不会设备所有端口都做线速转发,那一定是一个异常的网络状态,一般端口速率超过80%时,数据中心都会开始网络扩容了,根本不会等到端口线速转发时才去扩容。线速是理想化的东西,在选择设备的时候千万不要看重这个,否则会被欺骗的。就像我们购买的小汽车,最大行驶速度都可以达到200多公里∕小时,而很多人一辈子都不会将汽车开到那么高的速度,小汽车设计的理论速度的确可以达到,但会有各种条件限制。所以对网络设备线速的事儿,且不可钻牛角尖。下面,就来详细说一说网络设备为满足线速性能里的门道。

网络设备有的只有1U高,有的却有20U高,对外端口有千兆、万兆、40G、100G甚至更高,尤其是在框式设备上,不同端口速率的板卡插在同一个机框里,要全部满足所有板卡都线速,是很难做到的。因为低速端口板卡内部需要的连接器只要是低速的就可以,而高速端口板卡内存需要高速连接器,在一个机框里很难全部满足,或者在某些板卡组合的情况下,部分端口就无法达到线速。这种情况在早期的网络设备中表现更为明显,那时内部连接器速率都比较低,内部还不是信元转发,按照报文HASH转发,内部很容易出现拥塞导致业务丢包。在这种情况下,如果数据中心要验证采购设备的线速性能,往往设备商会将能线速部分展现出来,而小部分无法线速的部分尽量在测试中避免。还有随着测试报文数量越大(或数据帧越短),网络设备需要处理和校验的负担就会越重,出口转发速度必然要下降的,但是越接近线性关系。很多网络设备在大包数据的处理上是可以达到线速的,而报文长度越小,达到线速的难度越大,若报文只有64字节,对设备的性能考验是最大的。在这种情况下,网络设备可能达不到线速。其实,我们知道实际的网络中,是不可能只有一种64字节长度的报文,肯定是各种长度的报文混杂在一起,这时对设备的压力还不算最大。

线速的概念主要指的是交换机网络设备,这种设备靠硬件芯片转发,可以具备线速能力,而这些设备的CPU处理能力是比较弱的,所以CPU处理的报文是远远达不到线速的。交换机的CPU不会处理转发数据报文,除非硬件芯片里没有了转发表项的情况下才会考虑通过CPU转发,交换机的CPU主要是协议报文的处理和设备管理,处理报文的能力相对很弱,没有线速的概念。就算是硬件芯片也不是什么情况下都能满足所有端口线速,有的芯片受工艺水平所限,芯片整理的转发带宽就有瓶颈,当所有外部端口都线速转发时,芯片就会有丢包,芯片只能保证部分端口线速情况下无丢包。我们知道,在很多选型测试中,经常使用蛇形测试,即将面板所有外部端口都收尾相连,打入线速流量,看是否有丢包,很多设备在这种情况下无法测试通过,就是芯片本身存在端口线速的数量限制。还有路由器,它是靠CPU转发数据的。路由器虽然CPU能力很强,但是要满足线速还是很困难,一般路由器会考虑用NP芯片来完成数据转发,或者也植入硬件芯片来完成,靠硬件的处理速度来满足线速的转发,这种设计理念使得路由器和交换机的界限越来越模糊。在很多时候,有人拿路由器当交换机用,有人拿交换机当路由器用,让两者技术实现上不断融合。

线速的测试其实是有标准的,RFC2544就是线速测试的标准。RFC2544明确建议40、64、128、256、512、1024、1280 和 1500字节这些数据帧是需要测试的。在线速的流量情况下,测试网络设备的丢包、时延、抖动、吞吐量、背靠背,这些概念在网络上都可以找到在此不再细说。这里要注意的是,以太网报文有能看到的部分,也有看不到的部分。在以太网报文之前,还有96bits的空闲帧。空闲帧是根据以太网的CSMA/CD原理,用来侦听链路是否空闲,如果空闲,就可以发送报文。接着会有七个字节的前导码AA(01010101)用于与接收端同步,因为电平一高一低,很容易同步。最后还有一个字节的AB,作为帧界定使用,表示后面开始真正的以太帧,这20个字节在日常的网络抓包中是不可见的,是以太网物理层封装的东西。这部分长度并不一定是固定的,而是可调的,有的设备为何提升转发效率,将这部分调小,这样单位时间内转发的报文数量就多,转发效率提升。不过,这样做也会带来困扰,就是与其它设备对接时,其端口转发速率要比对方高,可能会出现超线速的情况,对其它设备有影响。线速是要求设备提供的帧间隙和前导码按照标准默认的来,有的网络设备小包达不到线速时,往往将这部分长度调小,还提升线速能力,这样就与线速的标准背道而驰。

线速一般是网络产品在实验室里的理论值,是理想化的东西,在实际应用中也要达到线速是比较困难的,所以在选购网络设备时,不要过于依赖这一性能指标,还是要看网络设备的综合处理能力。

本文转自d1net(原创)

目录
打赏
0
0
0
0
16489
分享
相关文章
|
3月前
|
Arista CloudVision 2025.1 - 多云和数据中心网络自动化、监控和分析
Arista CloudVision 2025.1 - 多云和数据中心网络自动化、监控和分析
104 2
Arista CloudVision 2025.1 - 多云和数据中心网络自动化、监控和分析
Arista vEOS 4.30.10M - 虚拟化的数据中心和云网络可扩展操作系统
Arista vEOS 4.30.10M - 虚拟化的数据中心和云网络可扩展操作系统
83 2
Arista vEOS 4.30.10M - 虚拟化的数据中心和云网络可扩展操作系统
Arista EOS 4.34.0F - 适用于下一代数据中心和云网络的可扩展操作系统
Arista EOS 4.34.0F - 适用于下一代数据中心和云网络的可扩展操作系统
93 0
Arista EOS 4.34.0F - 适用于下一代数据中心和云网络的可扩展操作系统
数据中心网络关键技术,技术发明一等奖!
近日,阿里云联合清华大学与中国移动申报的“性能可预期的大规模数据中心网络关键技术与应用”项目荣获中国电子学会技术发明一等奖。该项目通过端网融合架构,实现数据中心网络性能的可预期性,在带宽保障、时延控制和故障恢复速度上取得重大突破,显著提升服务质量。成果已应用于阿里云多项产品及重大社会活动中,如巴黎奥运会直播、“双十一”购物节等,展现出国际领先水平。
Cisco NX-OS Software Release 9.3(15) - 数据中心网络操作系统
Cisco NX-OS Software Release 9.3(15) - 数据中心网络操作系统
91 5
Cisco NX-OS Software Release 9.3(15) - 数据中心网络操作系统
数据结构之数据中心网络路由(BFS)
本文介绍了数据中心网络路由中使用广度优先搜索(BFS)算法的重要性及其应用。随着数据中心从集中式大型机系统发展到分布式架构,高效的数据路由成为确保低延迟、高吞吐量和网络可靠性的关键。BFS通过系统地探索网络层次,从源节点开始向外遍历,确保发现最短路径,特别适合于数据中心网络环境。文中还提供了BFS算法的具体实现代码,展示了如何在数据中心网络中应用该算法来查找节点间的最短路径,并讨论了BFS的优缺点。
156 0
数据结构之数据中心网络路由(BFS)
Mininet多数据中心网络拓扑流量带宽实验
Mininet多数据中心网络拓扑流量带宽实验
249 0
边缘计算问题之数据中心内部和外部网络如何解决
边缘计算问题之数据中心内部和外部网络如何解决
98 1
深度解析 | 什么是超融合数据中心网络?
深度解析 | 什么是超融合数据中心网络?
5701 1
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问