RISC-V 基金会 Data Center SIG 第九次会议结束,围绕硬件加速多队列展开讨论

简介: 围绕硬件加速多队列展开讨论

一直以来,龙蜥社区在 RISC-V 生态建设中持续投入,并积极贡献上游社区。为加速 RISC-V 在数据中心场景的能力补齐与规模化落地,RISC-V International Data Center SIG 第九次会议就硬件加速 IOMMU(输入输出内存管理单元)解决方案展开深入交流与讨论。

本次会议由宋卓主席主持,来自 Qualcomm、Betrothed、RISC-V International、阿里巴巴等企业的代表参会。龙蜥社区 RISC-V SIG Maintainer 陈健康作专题汇报,围绕方案设计背景、核心架构思路以及后续推进路径进行了系统介绍。与会成员还就该提案提交至技术指导委员会(TSC,Technical Steering Committee)的流程安排交换了意见,并明确了下一步工作分工。

聚焦 IOMMU 多队列,解决高性能与虚拟化场景挑战

会议中,来自龙蜥社区的陈健康重点介绍了其提出的硬件加速 IOMMU 多队列架构方案。该方案主要面向多核系统扩展性、虚拟化开销优化,以及 AI/HPC(人工智能/高性能计算)等高负载业务场景下对高效、安全 I/O 管理能力的需求。

据介绍,该提案在 RISC-V IOMMU 架构基础上进行了扩展,重点增强了以下能力:

  • 支持多硬件队列,提升系统并发处理能力与可扩展性;
  • 引入面向虚拟化场景的能力设计,实现逻辑命令队列(Logical Command Queue)到物理命令队列的映射;
  • 通过 VF(Virtual Function,虚拟功能)配置机制实现硬件级隔离,增强资源分配与访问控制的安全性。

陈健康表示,目前该方案仍处于提案草案阶段,欢迎团队成员继续提出修改建议和技术意见,以便进一步完善设计内容与论证材料。

从单队列争到硬件虚拟化加速

在深入探讨 RISC-V IOMMU 架构的改进之前,我们需要审视当前行业标准以及现有的技术解决方案。目前,业界主要致力于解决两大核心瓶颈:单命令队列的锁争用问题以及虚拟化环境下的性能开销。传统的 IOMMU 架构通常采用单一命令队列,这在多核高并发场景下容易引发锁争用。为了解决这一问题,业界提出了SMMUv3.3-ECMDQ(增强型命令队列)、NVIDIA Tegra241 (Grace) CMDQV 等改进方案。为了彻底消除传统虚拟化中“陷入-模拟”带来的性能损耗,硬件辅助的虚拟 IOMMU(vIOMMU)已成为行业标准解决方案。其核心思路是为每个客户机提供专用的命令队列资源。

会上,大家一致建议扩展 RISC-V IOMMU 架构,以支持具备虚拟化能力的多个硬件命令队列。物理命令队列(CQ)池被灵活地分配给 vIOMMU 接口(VF)。每个 VF 作为专用于单个虚拟机的分配单元。物理命令队列(CQ)以逻辑命令队列(LCQ)的形式分配给 vIOMMU 接口,并映射到 LCQ 和 vIOMMU 接口。VF 配备了用于管理 GSCID 和 RID 等参数的配置机制。

具体方案细节见下:https://github.com/sbates130272/p2pmem-test/blob/master/src/main.c

结语

本次会议围绕 IOMMU 架构多队列方案进行了富有成效的交流,进一步明确了提案的技术方向和推进路径。随着后续材料完善和 TSC 沟通工作的展开,该方案有望进入更广泛的技术评审阶段,为面向高性能、虚拟化与安全隔离需求的新一代 I/O 管理架构探索提供重要支撑。

相关阅读推荐:RISC-V 基金会 Data Center SIG 第八次会议圆满结束,围绕AIOE和TG推进展开深入探讨

玄铁 C950 发布!龙蜥社区加速 RISC-V 云计算落地

Anolis OS 23.4 发布:全面支持 RVA23 RISC-V 架构,强化安全与云原生生态

—— 完 ——

相关文章
|
19天前
|
数据采集 人工智能 JSON
浏览器自动化:从GUI到OpenCLI
文章讲述放弃不稳定的前端UI自动化操作,采用解析并复现底层API请求的方式,来解决浏览器自动化的效率与稳定性难题。(文章内容基于作者个人技术实践与独立思考,旨在分享经验,仅代表个人观点。)
|
存储 缓存 弹性计算
阿里巴巴开源 容器镜像加速技术DADI 上手指南
阿里资深技术专家在阿里云开发者社区特别栏目《周二开源日》直播中,介绍刚于3月份开源的容器镜像加速器项目 DADI ,并带大家快速上手使用。本文为直播内容文字整理,看直播回放,请点击文首链接~
阿里巴巴开源 容器镜像加速技术DADI 上手指南
|
5月前
|
存储 人工智能 编译器
智驾大模型的「隐形战场」:当GPU堆不动了,行业拼什么?
与参会嘉宾一起探讨了如何通过技术协作加速智能驾驶的进步,分享了各自在自动驾驶技术栈中的前沿实践与生态思考。
|
1月前
|
人工智能 安全 IDE
2026 年 AI 编码的“渐进式 Spec”实战指南
这次分享的内容来自作者在实际项目中落地 AI 编码的一些实践和思考。希望能给正在尝试或想要尝试 AI 编码的同学一些参考。
|
20天前
|
人工智能 Anolis 异构计算
|
20天前
|
人工智能 运维 架构师
|
4月前
|
存储 人工智能 自然语言处理
拒绝AI“胡言乱语”!手跨度教你深度DeepSeek-R1:立足落地垂直业务全流程
本文详解DeepSeek-R1模型落地全流程,从环境搭建、数据处理到LoRA微调技巧,手把手教你24小时内打造行业专属AI专家,显著提升专业任务准确率,助力企业实现高效定制化AI应用。
114 2
拒绝AI“胡言乱语”!手跨度教你深度DeepSeek-R1:立足落地垂直业务全流程
|
人工智能 网络性能优化 调度
Koordinator v1.6: 支持AI/ML场景的异构资源调度能力
如何高效管理和调度这些资源成为了行业关注的核心问题。在这一背景下,Koordinator积极响应社区诉求,持续深耕异构设备调度能力,并在最新的v1.6版本中推出了一系列创新功能,帮助客户解决异构资源调度难题。
|
存储 运维 监控