高性能网络SIG月度动态:virtio 动态中断调节优化、多项内核网络缺陷修复

简介: 一键查看高性能网络SIG月度动态。

高性能网络 SIG(Special Interest Group)在这个万物互联的时代,云上的网络通信效率对各种服务至关重要,高性能网络兴趣组致力于利用 XDP、RDMA、VIRTIO 等新高效通信技术,结合软硬件一体化的思想,打造高性能网络协议栈,提升云计算时代数据中心应用的网络性能。

01 整体进展

本月高性能网络 SIG 的主要工作聚焦在内核缺陷修复、SMC 和 virtio 上。

本月关键进展:

1. SIG 正在推进 virtio 动态中断调节的优化,包括动态配置参数列表和 ctrlq 异步化。

2. SIG 持续推进 loopback-ism 的标准化,更新并修复了多项内容。

02 ANCK 内核网络

修复

ANCK 5.10 本月修复若干异常问题,随 ANCK 5.10.134-16.3 版本发布,主要问题包括:

  • 修复 inet_recv_error() 中可能产生警告信息的问题。
  • 修复 nft_byteorder_eval() 中可能出现的数据溢出问题。
  • 修复 inet6_rtm_getaddr() 中潜在的内存泄漏问题。
  • 修复 tcp 中特定场景下可能未初始化 accept 队列产生的警告问题。
  • 修复 skb_segment() 中 mss 计算错误的问题。
  • 修复在 TCP 零拷贝接收场景下潜在的 panic 问题。
  • 修复在弱内存模型 CPU 下,tcp_push 对 sk 变量执行的读取和更新被重排后,导致的数据异常延迟问题。
  • 修复 ip_setup_cork() 中潜在的内存泄漏问题。

安全

ANCK 5.10 和 ANCK 4.19 分别修复了 2 个 CVE,已随 ANCK 5.10.134-16.3 和 ANCK 4.19.91-27 版本发布:

  • CVE-2022-3643,CVE-2024-0607

03 SMC

本月高性能网络 SIG 在 SMC 领域的工作主要聚焦于上游 loopback-ism 的版本迭代。

loopback-ism

本月 loopback-ism 在上游推进迭代了 4 个版本,目前更新到 V5[1],更新内容包括:

  • 移除旧版本中 sysfs knobs,默认使用物理连续内存,默认将 sndbuf 与 DMB 合并。
  • loopback-ism 接收处理使用 tasklet 触发。
  • 修复 lockdep warning,优化注释、函数名及 commit log。

[1]https://lore.kernel.org/netdev/20240324135522.108564-1-guwen@linux.alibaba.com/

04 virtio

本月高性能网络 SIG 在 virtio 领域的工作,主要聚焦于 virtio-net 动态中断调节的优化。

配置 DIM 参数列表

动态中断调节(DIM, Dynamic Interrupt Moderation)是一种在 Linux 内核中实现的技术,以 NetDIM 库的形式提供,旨在优化和调整中断频率,以提升网络设备的性能和效率,其被广泛应用于各现代网卡中。

然而,不同的网卡具有多样化的候选中断参数列表需求,尤其是 virtio 网卡的后端可能由不同软件设备或硬件设备实现,所以 DIM 在 virtio-net 上的性能并未符合预期,这在一定程度上正是不当的中断配置列表造成的。同时,其他的现代网卡例如 ICE、IDPF 等也对其 DIM 参数列表进行了自定义配置。

基于此,高性能网络小组正在推动基于用户态工具 ethtool 配置中断列表的方法[2],以允许用户针对各自设备的特定需求,灵活地调节 DIM,从而实现最佳的网络吞吐和时延。

[2]https://lore.kernel.org/all/1712059988-7705-1-git-send-email-hengqi@linux.alibaba.com/

控制队列异步化

Virtio 控制队列(ctrlq)以同步的方式发送驱动程序配置设备的请求。当驱动程序或用户发送配置请求给设备时,如果设备没有及时处理这些请求,ctrlq 就会持续等待设备的响应。这种等待机制严重限制了动态中断调节(DIM)在需要频繁下发配置请求时的性能表现。

为了解决这一问题,高性能网络小组正在积极推进 ctrlq 异步化配置设备的方法[3]。通过这种方式,DIM 能够保持高效运作,充分发挥其动态中断调节带来的性能优势。

[3]https://lore.kernel.org/all/1712059988-7705-1-git-send-email-hengqi@linux.alibaba.com/


相关链接:

高性能网络 SIG 主页:

https://openanolis.cn/sig/high-perf-network

注:更多龙蜥 SIG 月度动态可点击这里查看。

—— 完 ——

相关文章
|
5月前
|
存储 网络协议 Java
深入理解Linux网络——内核与用户进程协作之同步阻塞方案(BIO)
在上一部分中讲述了网络包是如何从网卡送到协议栈的(详见深入理解Linux网络——内核是如何接收到网络包的),接下来内核还有一项重要的工作,就是在协议栈接收处理完输入包后要通知到用户进程,如何用户进程接收到并处理这些数据。
|
5月前
|
存储 缓存 网络协议
深入理解Linux网络——内核是如何发送网络包的
一、相关实际问题 1. 查看内核发送数据消耗的CPU时应该看sy还是si 2. 在服务器上查看/proc/softirqs,为什么NET_RX要比NET_TX大得多 3. 发送网络数据的时候都涉及那些内存拷贝操作 4. 零拷贝到底是怎么回事 5. 为什么Kafka的网络性能很突出
|
3月前
|
机器学习/深度学习 计算机视觉 Python
【SKConv】即插即用!来自CVPR 2019的选择性内核网络帮你论文涨点
【SKConv】即插即用!来自CVPR 2019的选择性内核网络帮你论文涨点
59 0
【SKConv】即插即用!来自CVPR 2019的选择性内核网络帮你论文涨点
|
5月前
|
存储 网络协议 NoSQL
深入理解Linux网络——内核与用户进程协作之多路复用方案(epoll)
在上一部分的阻塞模式中(详见深入理解Linux内核网络——内核与用户进程协作之同步阻塞方案(BIO)),用户进程为了等待一个socket就得被阻塞掉,如果想要同时为多个用户提供服务要么就得创建对应数量的进程处理,要么就使用非阻塞的方式。进程不说创建,单论上下文切换就需要很大的耗时,而如果非阻塞的模式,就得轮询遍历,会导致CPU空转,并且每次轮询都需要进行一次系统调用,所以Linux提供了多路复用的机制来实现一个进程同时高效地处理多个连接。
|
5月前
|
存储 缓存 网络协议
深入理解Linux网络——内核是如何接收到网络包的
一、相关实际问题 RingBuffer是什么,为什么会丢包 网络相关的硬中断、软中断是什么 Linux里的ksoftirqd内核线程是干什么的 为什么网卡开启多队列能提升网络性能 tcpdump是如何工作的 iptable/netfilter是在哪一层实现的 tcpdump能否抓到被iptable封禁的包 网络接收过程中如何查看CPU开销 DPDK是什么
|
6月前
|
缓存 Linux API
冲破内核限制:使用DPDK提高网络应用程序的性能(上)
冲破内核限制:使用DPDK提高网络应用程序的性能
|
6月前
|
安全 网络协议 Linux

热门文章

最新文章