直播预告:MantaKV 如何突破 AI 推理性能瓶颈? | 龙蜥大讲堂

简介: 深入剖析 AI 推理场景的核心需求与性能优化痛点。

「龙蜥大讲堂」4 月精彩预告来了,点击下方海报抢先了解。欢迎扫描海报二维码提前进群,立即预约锁定这场 AI 推理场景技术分享!

MantaKV:基于 CXL 共享内存的 KVCache 创新管理方案介绍

直播时间:2026 年 04 月 01 日 (周三)16:00-17:00

直播内容:

本次直播将深入剖析 AI 推理场景的核心需求与性能优化痛点,重点提出基于龙蜥操作系统面向 CXL 的 KVCache 管理解决方案;聚焦于 PD 分离架构下的 KVCache 复用场景,详细介绍 MantaKV 的创新机制,并展示其相较于传统 RDMA 方案所取得的显著性能提升。

适合人群:

AI 推理软件研发工程师。

讲师介绍:

Yihong Lian,浪潮信息系统软件架构师,研究领域为软件工程、分布式系统架构和设计。作为 MantaKV 的核心研发者,目前从事基于 CXL 共享内存加速 AI 推理的基础设施建设。

小龙温馨提醒往期龙蜥大讲堂视频回放已上线至龙蜥官网,欢迎观看,有任何疑问欢迎随时咨询龙蜥助手—小龙(微信:openanolis_assis)。


相关文章
|
20天前
|
存储 人工智能 缓存
极速、稳定、丝滑:OpenClaw 接入 Mooncake 后的性能跃迁
OpenClaw 不只是更快了,更重要的是更稳了。
|
20天前
|
人工智能 达摩院 云计算
玄铁 C950 发布!龙蜥社区加速 RISC-V 云计算落地
介绍龙蜥社区制定的 2025 年至 2030 年的五年发展规划,深入阐述龙蜥如何助力和加速RISC-V在云计算场景的落地。
|
人工智能 安全 Cloud Native
龙蜥社区衍生版浪潮信息 KOS 升级!支持最新 5.10 内核,让大模型“开箱即用”
社区衍生版KeyarchOS产品升级,实现了大模型应用的“开箱即用”。
|
20天前
|
人工智能 弹性计算 运维
|
2天前
|
人工智能 JavaScript API
还抢不到?阿里云百炼 Coding Plan 最新抢购教程+OpenClaw 部署保姆级攻略
阿里云百炼Coding Plan凭借高性价比与强大模型支持,成为2026年开发者AI编码的优选方案。虽Lite版已停售、Pro版需抢购,但掌握每日9:30补货策略,即可轻松获取服务。搭配阿里云轻量服务器或本地环境部署OpenClaw,仅需10分钟即可完成从模型订阅到AI智能体落地的全流程,实现大模型能力与实际开发任务的无缝对接。
283 4
|
7天前
|
机器学习/深度学习 自然语言处理 供应链
大模型应用:销量预测升级:Qwen大模型让时序分析从算数值到给建议.82
本文提出“会说话的时序分析系统”,融合ARIMA、Prophet等专业预测算法与大模型,实现从冰冷数值到自然语言洞察的跃迁:算法精准算未来,大模型解读原因、生成可落地建议,让时序数据真正成为懂业务、会决策的智能助手。
163 3
|
10天前
|
人工智能 安全 API
Windows 部署 OpenClaw,打造本地 AI 智能体
OpenClaw(昵称“小龙虾”)是2026年热门开源本地AI智能体,支持Windows一键部署、零代码操作,可自动整理文件、操控浏览器、收发邮件等,数据全留本地,安全高效,专为办公自动化而生。
|
4月前
|
人工智能 安全 数据安全/隐私保护

热门文章

最新文章