RISC-V 基金会 Data Center SIG 第九次会议结束,围绕硬件加速多队列展开讨论

简介: 围绕硬件加速多队列展开讨论

一直以来,龙蜥社区在 RISC-V 生态建设中持续投入,并积极贡献上游社区。为加速 RISC-V 在数据中心场景的能力补齐与规模化落地,RISC-V International Data Center SIG 第九次会议就硬件加速 IOMMU(输入输出内存管理单元)解决方案展开深入交流与讨论。

本次会议由宋卓主席主持,来自 Qualcomm、Betrothed、RISC-V International、阿里巴巴等企业的代表参会。龙蜥社区 RISC-V SIG Maintainer 陈健康作专题汇报,围绕方案设计背景、核心架构思路以及后续推进路径进行了系统介绍。与会成员还就该提案提交至技术指导委员会(TSC,Technical Steering Committee)的流程安排交换了意见,并明确了下一步工作分工。

聚焦 IOMMU 多队列,解决高性能与虚拟化场景挑战

会议中,来自龙蜥社区的陈健康重点介绍了其提出的硬件加速 IOMMU 多队列架构方案。该方案主要面向多核系统扩展性、虚拟化开销优化,以及 AI/HPC(人工智能/高性能计算)等高负载业务场景下对高效、安全 I/O 管理能力的需求。

据介绍,该提案在 RISC-V IOMMU 架构基础上进行了扩展,重点增强了以下能力:

  • 支持多硬件队列,提升系统并发处理能力与可扩展性;
  • 引入面向虚拟化场景的能力设计,实现逻辑命令队列(Logical Command Queue)到物理命令队列的映射;
  • 通过 VF(Virtual Function,虚拟功能)配置机制实现硬件级隔离,增强资源分配与访问控制的安全性。

陈健康表示,目前该方案仍处于提案草案阶段,欢迎团队成员继续提出修改建议和技术意见,以便进一步完善设计内容与论证材料。

从单队列争到硬件虚拟化加速

在深入探讨 RISC-V IOMMU 架构的改进之前,我们需要审视当前行业标准以及现有的技术解决方案。目前,业界主要致力于解决两大核心瓶颈:单命令队列的锁争用问题以及虚拟化环境下的性能开销。传统的 IOMMU 架构通常采用单一命令队列,这在多核高并发场景下容易引发锁争用。为了解决这一问题,业界提出了SMMUv3.3-ECMDQ(增强型命令队列)、NVIDIA Tegra241 (Grace) CMDQV 等改进方案。为了彻底消除传统虚拟化中“陷入-模拟”带来的性能损耗,硬件辅助的虚拟 IOMMU(vIOMMU)已成为行业标准解决方案。其核心思路是为每个客户机提供专用的命令队列资源。

会上,大家一致建议扩展 RISC-V IOMMU 架构,以支持具备虚拟化能力的多个硬件命令队列。物理命令队列(CQ)池被灵活地分配给 vIOMMU 接口(VF)。每个 VF 作为专用于单个虚拟机的分配单元。物理命令队列(CQ)以逻辑命令队列(LCQ)的形式分配给 vIOMMU 接口,并映射到 LCQ 和 vIOMMU 接口。VF 配备了用于管理 GSCID 和 RID 等参数的配置机制。

具体方案细节见下:https://github.com/sbates130272/p2pmem-test/blob/master/src/main.c

结语

本次会议围绕 IOMMU 架构多队列方案进行了富有成效的交流,进一步明确了提案的技术方向和推进路径。随着后续材料完善和 TSC 沟通工作的展开,该方案有望进入更广泛的技术评审阶段,为面向高性能、虚拟化与安全隔离需求的新一代 I/O 管理架构探索提供重要支撑。

相关阅读推荐:RISC-V 基金会 Data Center SIG 第八次会议圆满结束,围绕AIOE和TG推进展开深入探讨

玄铁 C950 发布!龙蜥社区加速 RISC-V 云计算落地

Anolis OS 23.4 发布:全面支持 RVA23 RISC-V 架构,强化安全与云原生生态

—— 完 ——

相关文章
|
25天前
|
数据采集 人工智能 JSON
浏览器自动化:从GUI到OpenCLI
文章讲述放弃不稳定的前端UI自动化操作,采用解析并复现底层API请求的方式,来解决浏览器自动化的效率与稳定性难题。(文章内容基于作者个人技术实践与独立思考,旨在分享经验,仅代表个人观点。)
|
存储
PCIe VPD (Vital Product Data) 介绍
PCIe VPD (Vital Product Data) 介绍
4994 0
PCIe VPD (Vital Product Data) 介绍
|
5月前
|
存储 人工智能 编译器
智驾大模型的「隐形战场」:当GPU堆不动了,行业拼什么?
与参会嘉宾一起探讨了如何通过技术协作加速智能驾驶的进步,分享了各自在自动驾驶技术栈中的前沿实践与生态思考。
|
4天前
|
人工智能 安全 Linux
【安全公告】Linux 内核高危本地提权漏洞 CVE-2026-31431 龙蜥已修复,请及时升级更新
龙蜥社区已发布 Anolis OS 7/8/23 的官方安全修复公告 ANSA-2026:0566、ANSA-2026:0565、ANSA-2026:0564。受影响用户请立即完成修复。
|
4天前
|
缓存 人工智能 运维
SysOM Agent智能运维系列:Pod内存高告警,一次对话30秒定位根因
让内存诊断从"靠经验排查"变成"可解释、可复现、可执行"的工程化流程。
|
4天前
|
人工智能 运维 编译器
|
4天前
|
安全 Cloud Native 数据中心
|
14天前
|
人工智能 Anolis
倒计时 1 天!欢迎解锁 AI Infra MeetUp 直播渠道,明天北京见
AI Infra 产学研用全链路最新技术趋势与产业动态。
|
20天前
|
Anolis
直播预告: CXL 池化内存应用实践解析 | 龙蜥大讲堂
分享龙蜥生态下 CXL 在 Mooncake 框架的落地实践。

热门文章

最新文章