高性能网络SIG月度动态:virtio-net 支持动态中断调节,SMC v2 协议增加新扩展

简介: 高性能网络 SIG 在 3 月都有哪些项目进展?

高性能网络 SIG(Special Interest Group) :在云计算时代,软硬件高速发展,云原生、微服务等新的应用形态兴起,让更多的数据在进程之间流动,而网络则成为了这些数据流的载体,在整个云时代扮演者前所未有的重要角色。在这个万物互联的时代,云上的网络通信效率对各种服务至关重要,高性能网络兴趣组致力于利用 XDP、RDMA、VIRTIO 等新高效通信技术,结合软硬件一体化的思想,打造高性能网络协议栈,提升云计算时代数据中心应用的网络的性能.

01 本月 SIG 整体进展

本月高性能网络 SIG 的主要工作聚焦在 SMC,virtio 和 Anolis OS 通用内核网络上。


本月关键进展:

本月 SIG 小组和 IBM SMC 开发团队在 SMC v2 的协议扩展上达成了一致,至此 SIG 推进的几个关键协议扩展内容(单连接特性支持,LGR 最大连接数可协商支持,RDMA write with immediate 支持,以及可扩展的选项等)在 SMC 开发者例会上基本讨论完毕。

SIG 小组提出并推进的 virtio-net: support the virtqueue coalescing moderation 提案在 virtio 社区投票通过,该提案可以让 virtio-net 支持动态中断调节,提升 virtio-net 的性能。

02 Anolis OS

修复

Anolis OS ANCK 5.10 新增以下修复:


本月网络方向共计修复 17 个 CVE,覆盖 ulp/wifi/sched/ipv6/sctp/mpls/usb/nfc/netfilter/bluetooth 等模块,CVE 列表:CVE-2022-4129,CVE-2023-0461, CVE-2023-23455,CVE-2023-23559,CVE-2022-47929,CVE-2023-0394,CVE-2023-1074,CVE-2023-26545,CVE-2022-2964,CVE-2023-23454,CVE-2023-1281,CVE-2020-25672,CVE-2023-0590,CVE-2020-25670,CVE-2023-1095,CVE-2022-20566,CVE-2020-25671。

03 高性能网络协议栈 SMC

本月,龙蜥社区高性能网络 SIG 在 SMC 领域的工作,主要聚焦在标准化协议的扩展、本机高性能通信方案和 eBPF 策略替换能力。

本机高性能通信方案

本机的 loopback 和容器间(跨 netns)通信已经是一种常见的数据路径,在数据处理和云原生场景有着非常广泛的使用。例如云原生场景下,service mesh 通过 proxy 进程与业务进程、sidecar 进行通信。SMC 提供了本机(loopback 和 容器间)的高性能通信方案,对比传统的用户态 IPC、以及内核的 TCP loopback 或者 UNIX domain socket 等方案,除了性能具有非常大的优势之外(详细数据可参考 LWN 链接),同时对于应用透明无侵入、无修改。本月我们继续完善已经推送到 Linux 社区的 RFC 提案,并发送出 v4 版本(LWN 链接)。从当前反馈来看,Linux 社区对于方案的适用场景、可行性已经达成一致。目前聚焦在 SMC 协议如何确保唯一识别到本机的 loopback 设备。当前的方案是通过多重 ID 来区分不同的 loopback 设备,冲突的概率在 1/2^(64*3)。关于 SMC loopback 的更进一步的议题,我们将在 SMC 开发者例会上与 Linux 社区的 Maintainer 进一步沟通。

协议扩展

SMC 协议定义在 IETF RFC 7609 和 IBM SMC PDF 手册之中,协议规定了双方如何握手直至建立连接并正常通信。当前协议存在一些问题,例如 SMC v2 协议尚未标准化,以及尚无针对协议设定预期场景之外的拓展。本月龙蜥社区与 Linux 社区在协议扩展上达成了一致,至此我们推进的几个关键协议扩展内容在 SMC 开发者例会上讨论基本完毕,并在经过一系列 review 和 comment 之后,进入正式的协议更新和发布流程。本次达成一致的协议扩展主要包括:单连接的特性的支持,LGR 最大连接数可协商的支持,RDMA write with immediate 的支持,以及可扩展的选项等。

eBPF 策略替换

SMC 提供了动态回退 TCP 的能力,当前的回退策略的决策因素主要是由 RDMA / ISM 连接建立是否成功。由于 SMC 短链接性能不如 TCP,为了让 SMC 更加通用,因此计划给 SMC 增加基于策略的回退 TCP 的能力,帮助 SMC 更好地适配不同应用模型和场景。基于上面的背景,我们向 Linux 的 BPF 社区推送了基于 eBPF struct ops 特性的 SMC 策略回退的补丁,并于 BPF 的 maintainer 和 struct ops 的作者讨论实现细节。基于讨论的细节,我们发送了更新版本的补丁。如果 eBPF 策略替换方案被社区接受后,我们将 eBPF 策略替换的用户态实现提交到 SMC 工具(smc-tools)之中,简化用户使用,同时 SMC ULP 方案也将会被废弃。

04 virtio

virtio specification 支持 virtqueue notification coalescing

背景:Net DIM (Generic Network Dynamic Interrupt Moderation) 算法通过统计当前网络中单个队列的流量信息和中断次数,自适应计算中断调整方向和步长,并将结果配置下发到设备,以达到提升网络吞吐量的目的。由于目前的 virtio specification 不支持对单个队列进行中断参数下发,所以还无法支持 netdim。

高性能网络组推进的 virtio-net: support the virtqueue coalescing moderation 的提案,可以让 virtio-net 支持动态中断调节,并对逐个队列下发中断调节参数,目前该工作已经被 virtio 社区投票通过

virtio-net inner header hash

为了支持 VXLAN、GENEVE、GRE 等隧道协议基于内头部计算哈希,提升 RSS 以及监控场景的收包性能,高性能网络 SIG 小组发起了 virtio_net: support inner header hash 的提案。


本月 v9->v12 的讨论主要集中在 inner header hash 如何更好的支持对称哈希的主题上:

legacy GRE 等隧道协议基于 IP 头进行传输,其既没有外部端口号,也没有可以用于识别 flow-specific 的字段,所以基于内头部计算哈希是十分必要的。另外,VXLAN、GENEVE 等现代隧道协议虽然都可基于 transport header 进行传输,即可以通过外部端口号来提高熵,但是在某些监控场景下,它们可能需要同一流的数据包被散列到同一个接收队列,但是同一条流可能会经过不同隧道封装,因此,必须使用内头部计算对称哈希才能到达此目的。


目前针对如何找出一个 key 或者 hash 算法可以同时对称散列 ipv4/ipv6 数据包的问题还没有达成一致,我们会和社区进一步沟通以让 inner header hash 更加通用。

virtio-net 支持 AF_XDP zerocopy

背景:AF_XDP 是一个 bypass 内核的新的收发包框架。它可以把驱动的收包直接传递到用户态,用户态可以直接把包从用户态传递到驱动直接发送出去。它的性能相比于内核的 UDP PPS 可以提升 3-7 倍。但是它要驱动进行 zerocopy 的支持。

目前这个系列的 patch set 由于数量太多,计划分成两个部分:

  • virtio core 支持 DMA premapped。这个部分是让 virtio core 框架支持提交 DMA address 操作, 目前的实现里面,所有的 DMA 操作都在 virito core 里面完成的,我们要让 virtio core 支持传递 DMA address 给 virtio core。因为 AF_XDP 会提前完成所有的地址的 DMA 操作,以及一些 virtqueue reset 的相关操作。
  • 这部分已经基本在社区的 review 通过。
  • virtio-net 支持 AF_XDP。后续的工作在前面一个 patch set 的基础上,会提交到 net-next 分支上。
  • 这部分的 patch 也进行了拆分,目前在推进对于 virtio-net 的 xdp 进行代码重构。这一实现已经和社区基本达成了一致。
  • 后续的 patch 会在下一个版本发布之后,net 部分包含了 virtio core 的代码更新之后再提交。


以上为 3 月高性能网络 SIG 月度动态,欢迎大家加入共建(入群方式见文末)。更多 SIG 动态前往龙蜥官网获取:

龙蜥 SIG 主页链接:https://openanolis.cn/sig

高性能网络 SIG 主页:https://openanolis.cn/sig/high-perf-network

—— 完 ——

加入龙蜥社群

加入微信群:添加社区助理-龙蜥社区小龙(微信:openanolis_assis),备注【龙蜥】与你同在;加入钉钉群:扫描下方钉钉群二维码。

1 (2).png

相关文章
|
3月前
|
XML JSON API
ServiceStack:不仅仅是一个高性能Web API和微服务框架,更是一站式解决方案——深入解析其多协议支持及简便开发流程,带您体验前所未有的.NET开发效率革命
【10月更文挑战第9天】ServiceStack 是一个高性能的 Web API 和微服务框架,支持 JSON、XML、CSV 等多种数据格式。它简化了 .NET 应用的开发流程,提供了直观的 RESTful 服务构建方式。ServiceStack 支持高并发请求和复杂业务逻辑,安装简单,通过 NuGet 包管理器即可快速集成。示例代码展示了如何创建一个返回当前日期的简单服务,包括定义请求和响应 DTO、实现服务逻辑、配置路由和宿主。ServiceStack 还支持 WebSocket、SignalR 等实时通信协议,具备自动验证、自动过滤器等丰富功能,适合快速搭建高性能、可扩展的服务端应用。
194 3
|
3月前
使用的是.NET Framework 4.0,并且需要使用SMTP协议发送电子邮件
使用的是.NET Framework 4.0,并且需要使用SMTP协议发送电子邮件
63 1
|
26天前
|
机器学习/深度学习 算法 PyTorch
基于图神经网络的大语言模型检索增强生成框架研究:面向知识图谱推理的优化与扩展
本文探讨了图神经网络(GNN)与大型语言模型(LLM)结合在知识图谱问答中的应用。研究首先基于G-Retriever构建了探索性模型,然后深入分析了GNN-RAG架构,通过敏感性研究和架构改进,显著提升了模型的推理能力和答案质量。实验结果表明,改进后的模型在多个评估指标上取得了显著提升,特别是在精确率和召回率方面。最后,文章提出了反思机制和教师网络的概念,进一步增强了模型的推理能力。
53 4
基于图神经网络的大语言模型检索增强生成框架研究:面向知识图谱推理的优化与扩展
|
13天前
|
网络协议 C#
基于.NET WinForm开发的一款硬件及协议通讯工具
基于.NET WinForm开发的一款硬件及协议通讯工具
|
23天前
|
JSON 算法 Java
Nettyの网络聊天室&扩展序列化算法
通过本文的介绍,我们详细讲解了如何使用Netty构建一个简单的网络聊天室,并扩展序列化算法以提高数据传输效率。Netty的高性能和灵活性使其成为实现各种网络应用的理想选择。希望本文能帮助您更好地理解和使用Netty进行网络编程。
39 12
|
2月前
|
缓存 负载均衡 网络协议
|
3月前
|
Java 应用服务中间件
面对海量网络请求,Tomcat线程池如何进行扩展?
【10月更文挑战第4天】本文详细探讨了Tomcat线程池相较于标准Java实用工具包(JUC)线程池的关键改进。首先,Tomcat线程池在启动时即预先创建全部核心线程,以应对启动初期的高并发请求。其次,通过重写阻塞队列的入队逻辑,Tomcat能够在任务数超过当前线程数但未达最大线程数时,及时创建非核心线程,而非等到队列满才行动。此外,Tomcat还引入了在拒绝策略触发后重新尝试入队的机制,以提高吞吐量。这些优化使得Tomcat线程池更适应IO密集型任务,有效提升了性能。
面对海量网络请求,Tomcat线程池如何进行扩展?
|
2月前
|
消息中间件 Linux iOS开发
.NET 高性能异步套接字库,支持多协议、跨平台、高并发
【11月更文挑战第3天】本文介绍了高性能异步套接字库在网络编程中的重要性,特别是在处理大量并发连接的应用中。重点讨论了 .NET 中的 Socket.IO 和 SuperSocket 两个库,它们分别在多协议支持、跨平台特性和高并发处理方面表现出色。Socket.IO 基于 WebSocket 协议,支持多种通信协议和跨平台运行,适用于实时通信应用。SuperSocket 则通过事件驱动的异步编程模型,实现了高效的高并发处理,适用于需要自定义协议的场景。这些库各有特点,可根据具体需求选择合适的库。
|
2月前
|
网络协议 Unix Linux
精选2款C#/.NET开源且功能强大的网络通信框架
精选2款C#/.NET开源且功能强大的网络通信框架
|
3月前
|
监控 安全 API
Docker + .NET API:简化部署和扩展
Docker + .NET API:简化部署和扩展
51 1