高性能网络SIG月度动态:自研 IPPROTO_SMC 贡献 Linux 社区,virtio 增加多项优化

简介: 龙蜥社区高性能网络SIG项目进展一览。

高性能网络 SIG(Special Interest Group)在这个万物互联的时代,云上的网络通信效率对各种服务至关重要,高性能网络兴趣组致力于利用 XDP、RDMA、VIRTIO 等新高效通信技术,结合软硬件一体化的思想,打造高性能网络协议栈,提升云计算时代数据中心应用的网络性能。

一、整体进展

本月高性能网络 SIG 的主要工作聚焦在 ANCK virtio 以及 SMC 上。

本月关键进展

1. ANCK 5.10 内核 virtio-net 新增支持设备状态统计、control vq timeout 和队列重置能力,并优化了控制通道性能。

2. SIG 将自研的 IPPROTO_SMC 方案贡献给上游社区,目前已经获取 Linux 社区认可。

二、ANCK 通用内核网络协议栈

修复

ANCK 5.10 修复 inet_diag() 中潜在数据竞争的问题 (RP3173),预计随着 017 版本发布。

三、SMC

本月 SIG 在 SMC 上的工作主要聚焦于推动 IPPROTO_SMC 方案进入上游主线以及缺陷修复。

IPPROTO_SMC

IPPROTO_SMC[1] 是 SIG 为 IP 协议族新增的一个协议类型。当用户创建 socket 时,IPPROTO_SMC 用来指示底层网络通信应该使用 SMC 协议,其和 IPPROTO_TCP/IPPROTO_UDP 同级。引入 IPPROTO_SMC 旨在提高 SMC 和 TCP 在功能上的一致性,使 SMC 回退到 TCP 协议后在功能路径上与 TCP 仍然保持一致。基于 IPPROTO_SMC,SMC 能够应用几乎所有为 INET 路径创建的 ebpf 功能,使得 SMC 可以使用 ebpf 非常细粒度的控制,并灵活地将 TCP 连接切换成 SMC 连接。此外,ANCK 还基于 IPPROTO_SMC 优化了 SMC 的回退性能,使其在回退到 TCP 的场景下性能和直接使用 TCP 的短连性能差距最差情况相差不超过 6%。

缺陷修复

SIG 本月修复了 SMC 引用计数泄漏[2]和 sk_{sndbuf|rcvbuf} [3]相关缺陷。

四、virtio

本月高性能网络 SIG 在 virtio 领域的工作主要聚焦于控制通道性能优化,支持 control vq timeout、设备统计计数和队列重置。SIG 已把这些特性贡献到了 Linux 上游社区,同时本月将这些特性都回合到了 ANCK,这些功能都将随 ANCK-017 发布。

控制通道性能优化

virtio-net 的 control vq 目前只能同时处理一个请求,这在很大程度上限制了控制通道的效率和灵活性。例如,NetDIM(网络中断调节)是一个现代网卡广泛支持的特性,其通过发送队列级的配置请求来提升性能。随着队列数量的增加,需要发送的配置请求数量也会相应增加。因此,请求发送的效率直接影响了 netdim 为 virtio-net 带来的性能提升,这对 virtio-net 控制通道提出了更高的性能要求。为了解决此问题,SIG 使用了更轻量的锁替换 control vq 曾使用的全局 netlink 锁,并引入了异步提交请求的机制,这些改进允许 control vq 同时处理多个请求,显著提升了 virtio-net 控制通道处理并发请求的性能,还帮助 virtio-net 基于 netdim 实现更佳的性能表现。

control vq timeout

虚拟机使用 virtio-net 网卡时,通常借助 control vq 来提交设备配置的请求。为了获取请求的处理结果,虚拟机需要轮询检查 control vq,直到接收到响应。然而,若设备一直未及时回应这些请求,虚拟机的 CPU 便会持续在高负荷下轮询,这种情况甚至可能导致整机完全 Hang 住。为了解决此问题,SIG 引入了 control vq timeout 机制:自驱动发送命令开始计时,如果在 timeout 超时时间内,设备仍未返回任何响应结果,驱动则认为该设备可能已经出现故障,进而标记驱动不应发送更多请求。该 timeout 值以 ANCK 内核模块参数的形式提供,默认值为 7 天。

设备统计计数

virtio-net 设备曾经无法获取后端设备的统计信息,这些信息对于用户来说,在分析和解决网络问题时至关重要,而用户只能通过云厂商自定义接口来获取某些信息。为了解决此问题,SIG 此前在 virtio 社区成功完成了 virtio-net 对device stats的支持。本月,SIG 也为 ANCK 正式支持了这项功能。这意味着用户现在可以通过用户空间 ethtool 命令直接获取 virtio-net 设备上的统计信息,为分析网络环境提供更多有价值的信息。

队列重置

队列重置功能允许虚拟机停止特定队列,回收并重新分配其内存资源,然后重新启用该队列。这一能力使得用户能够根据特定场景的需求,使用用户态 ethtool 工具调整虚拟机的队列尺寸 ,以优化时延性能表现。此外,在加载 XDP 程序时,驱动程序可以利用队列重置功能,清除所有接收队列中的旧缓冲区,以减少因预填充缓冲区格式不匹配导致的少量数据包丢失,确保数据传输的连续性和完整性。


相关链接:

[1]https://lore.kernel.org/netdev/1717592180-66181-1-git-send-email-alibuda@linux.alibaba.com/

[2]https://lore.kernel.org/netdev/20240507125331.2808-1-guwen@linux.alibaba.com/

[3]https://lore.kernel.org/netdev/20240531085417.43104-1-guwen@linux.alibaba.com/


高性能网络 SIG 主页:

https://openanolis.cn/sig/high-perf-network


注:更多龙蜥 SIG 月度动态可点击这里查看。

相关文章
|
4天前
|
Shell Linux C语言
|
2天前
|
网络协议 Ubuntu Linux
|
9天前
|
Linux
linux网络统计信息和端口占用情况基本语法
linux网络统计信息和端口占用情况基本语法
|
10天前
|
机器学习/深度学习 数据采集 监控
算法金 | DL 骚操作扫盲,神经网络设计与选择、参数初始化与优化、学习率调整与正则化、Loss Function、Bad Gradient
**神经网络与AI学习概览** - 探讨神经网络设计,包括MLP、RNN、CNN,激活函数如ReLU,以及隐藏层设计,强调网络结构与任务匹配。 - 参数初始化与优化涉及Xavier/He初始化,权重和偏置初始化,优化算法如SGD、Adam,针对不同场景选择。 - 学习率调整与正则化,如动态学习率、L1/L2正则化、早停法和Dropout,以改善训练和泛化。
9 0
算法金 | DL 骚操作扫盲,神经网络设计与选择、参数初始化与优化、学习率调整与正则化、Loss Function、Bad Gradient
|
14天前
|
前端开发 Java 数据处理
使用Netty构建高性能的网络应用
使用Netty构建高性能的网络应用
|
13天前
|
机器学习/深度学习 编解码 人工智能
一种基于YOLOv8改进的高精度表面缺陷检测网络, NEU-DET和GC10-DET涨点明显(原创自研)
【7月更文挑战第3天】一种基于YOLOv8改进的高精度表面缺陷检测, 在NEU-DET和GC10-DET任务中涨点明显;
35 1
|
17天前
|
网络协议 安全 Ubuntu
7 个有用的免费 Linux 网络隧道
【7月更文挑战第4天】
58 0
7 个有用的免费 Linux 网络隧道
|
18天前
|
传感器 监控 算法
基于虚拟力优化的无线传感器网络覆盖率matlab仿真
**摘要:** 本文探讨了基于虚拟力优化提升无线传感器网络(WSNs)覆盖率的方法。通过在MATLAB2022a中仿真,显示了优化前后网络覆盖率对比及收敛曲线。虚拟力优化算法模拟物理力,以优化传感器节点布局,防止重叠并吸引至目标区域,同时考虑墙壁碰撞。覆盖计算利用平面扫描法评估圆形和正方形传感器的覆盖范围。算法通过迭代优化网络性能,以提高WSNs的监控能力。
|
8天前
|
存储 传感器 算法
基于ACO蚁群优化算法的WSN网络路由优化matlab仿真
摘要(Markdown格式): - 📈 ACO算法应用于WSN路由优化,MATLAB2022a中实现,动态显示迭代过程,输出最短路径。 - 🐜 算法模拟蚂蚁寻找食物,信息素更新与蚂蚁选择策略确定路径。信息素增量Δτ += α*τ*η,节点吸引力P ∝ τ / d^α。 - 🔁 算法流程:初始化→蚂蚁路径选择→信息素更新→判断结束条件→输出最优路由。优化WSN能量消耗,降低传输成本。