结合部属集策略实现更低的eRDMA时延

本文涉及的产品
云服务器 ECS,每月免费额度280元 3个月
云服务器ECS,u1 2核4GB 1个月
简介: 弹性RDMA(eRDMA)是阿里云ECS提供的RDMA加速功能。为了取得更低的延迟效果,我们可以结合上ECS的部属集策略,使eRDMA尽可能获取到更低的时延。

阿里云ECS提供的部属集策略[1],可以控制ECS的物理分布。部属集支持多种策略:

  • 高可用策略。将部署集内所有ECS实例在指定地域内严格地分散在不同的物理服务器上,进而保证ECS实例上业务的高可用性和ECS实例的底层物理服务器容灾能力;
  • 低延迟策略。这种模式下会将部署集内所有ECS实例尽可能地集中部署到所在可用区内同一个网络拓扑范围内,以降低网络互通的时延。

我们知道,RDMA本身具有低延迟、高吞吐的特点。实际使用的时候,也会受到实际的物理网络距离的影响:距离越远,节点之间的的延迟就会增大。在阿里云当中,我们可以结合上部属集策略,使ECS提供弹性RDMA加速功能[2]尽可能获取到更低的时延。

我们接下来通过实际的实验,看一下部属集所能带来的效果。

1. 创建部属集

首先,进入云服务器ECS的控制台,在左侧的导航栏中,找到“部属与弹性”一节。如果部属集没有显示在这一节中,那么就可以在“更多”按钮的部分找到。

在部属集的页面,点击“创建部属集”,给部属集命名,并选择“网络低延迟策略”,然后点击确认,等待部属集创建完成。

2. 购买ECS实例,并添加到部属集当中

在这一步当中,我们可以直接在部属集页面,找到刚才创建的部属集,点击“创建实例”,就会直接跳转到ECS的购买界面。

在ECS购买界面,我们购买ecs.g8ae.xlarge规格,安装Alibaba Cloud Linux 3系统,并且允许系统自动安装eRDMA驱动程序。

同时,我们在弹性网卡部分,勾选“弹性RDMA接口”。

因为我们是通过部属集页面点击“创建实例”跳转的ECS购买界面,所以在ECS购买界面当中的高级选项中已经默认为我们勾选了部属集。如果没有的话,需要手动选择刚才创建的部属集。

3. 对比测试

创建完实例之后,等待OS初始化完之后,安装perftest(一款可以测试RDMA功能的基准测试程序)。在alinux3当中,可以通过yum直接安装:

yum install -y perftest

以RDMA Write的时延测试为例。我们将刚才分别购买的两个实例分别充当server节点和client节点。

  1. 在server节点运行:
    ib_write_lat -R -a -F
    
  2. 在client节点运行:
    ib_write_lat -R -a -F <server_ip>
    

测试结果如下图所示。

我们可以看到小消息的时延<10us。

我们再次购买两台相同规格的实例,除了不选择部属集,其他的配置均一样。我们再次测试ib_write_lat,可以看到这次平均时延在12.5us附近。说明这次购买的实例分布在相距较远的两个物理机上。

4. 总结

为了达到更低的延迟结果,在购买实例时,尽量选择“网络低延迟”部属集策略。此外,部属集可以尽力保证购买的实例在物理分布上尽可能靠近,但是也会受到实际库存的影响。
[1] https://help.aliyun.com/zh/ecs/user-guide/overview-43
[2] https://help.aliyun.com/zh/ecs/user-guide/erdma-overview

相关实践学习
一小时快速掌握 SQL 语法
本实验带您学习SQL的基础语法,快速入门SQL。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情:&nbsp;https://www.aliyun.com/product/ecs
相关文章
|
5天前
|
存储 网络协议 数据中心
|
2月前
|
弹性计算 人工智能 调度
秒级弹性!探索弹性调度与虚拟节点如何迅速响应瞬时算力需求?
秒级弹性!探索弹性调度与虚拟节点如何迅速响应瞬时算力需求?
49309 1
|
2月前
|
网络协议 网络安全 区块链
常见网络延迟测量方法
常见网络延迟测量方法
179 0
|
6月前
|
负载均衡 算法 云计算
深入理解负载均衡:优化你的网络性能
在今天的数字时代,网络性能和可用性对于任何企业或组织都至关重要。负载均衡是一个关键的网络架构组件,可以帮助分散流量、提高可靠性和确保系统的高可用性。本文将深入探讨负载均衡的概念、工作原理以及在现代网络中的应用。
|
8月前
|
算法 物联网
m基于matlab的无线自组网性能仿真,包括端到端时延,吞吐量,初入网时间,迟入网时间,网络建立时间
m基于matlab的无线自组网性能仿真,包括端到端时延,吞吐量,初入网时间,迟入网时间,网络建立时间
172 0
|
9月前
|
块存储
阿里云最新产品手册——阿里云核心产品——块存储——性能指标——吞吐量、访问时延
阿里云最新产品手册——阿里云核心产品——块存储——性能指标——吞吐量、访问时延自制脑图
89 0
|
10月前
|
运维 监控 前端开发
链路,设备,带宽冗余技术
链路,设备,带宽冗余技术
142 0
|
11月前
网络基础 计算机网络速率,带宽,吞吐量概念
网络基础 计算机网络速率,带宽,吞吐量概念
290 0
|
网络架构
关于网络,带宽,网速,延迟的一些知识
关于网络,带宽,网速,延迟的一些知识
177 0
|
存储 运维 监控
性能透明提升 50%!SMC + ERDMA 云上超大规模高性能网络协议栈
新的协议栈是不是重新发明轮子?一个协议栈能否解决所有问题?适配所有场景?
性能透明提升 50%!SMC + ERDMA 云上超大规模高性能网络协议栈

相关产品

  • 云服务器 ECS
  • 轻量应用服务器
  • 弹性容器实例