近日,以“智算时代的基础设施创新”为主题的龙蜥智算联盟 MeetUp 在北京海淀成功举办。本次活动由龙蜥社区、龙蜥智算联盟联合主办,得到了 InfoQ、CSDN、思否、51CTO、阅码场、OSCHINA、极星会等业内知名媒体与社区的大力支持并同步线上直播。现场来自阿里云、浪潮信息、中国科学技术大学、上海交通大学、郑州大学、沐曦股份、Imagination、联智科技、中兴通讯等产学研领域的技术专家带来了精彩的技术分享,围绕 AI Infra 全栈技术趋势与创新实践,与现场开发者进行了深入的技术交流,共同勾勒下一代 AI Infra 的技术蓝图。
(图/活动现场嘉宾合影)
会议伊始,浪潮信息系统软件研发部总经理、龙蜥社区技术委员会副主席苏志远先生为本次活动致开场辞。苏志远从芯片驱动、操作系统、算子库、AI 软件栈等系统软件研发创新到龙蜥社区的技术治理,为与会者描绘了智算技术创新与智算基础设施生态建设的清晰路径。
随后,阿里云资深技术专家、龙蜥智算联盟主席宋卓先生上台致辞。宋卓从联盟视角切入,结合龙蜥智算联盟的规划,就如何抓住 AI 南北向深度协同与创新的机遇提出见解,为接下来的技术分享拉开序幕。
致辞环节结束后,技术分享正式拉开帷幕。龙蜥社区 SGLang 项目开发者苏峰先生带来了《从黑盒到透明:SGLang tracing 如何赋能 LLM 推理性能诊断》的技术分享。他针对大模型推理服务中“请求延迟到底卡在队列等待、Prefill 计算还是 Decode 阶段”这一黑盒难题,介绍了基于 OpenTelemetry 标准的端到端全链路追踪系统,让性能调优从"猜测驱动"转变为"数据驱动"。
(图/苏峰)
中国科学技术大学计算机科学与技术学院特任副研究员白有辉老师进行了《面向multi-agent 场景的长上下文管理方法》的主题演讲。白老师介绍了如何利用稀疏化注意力机制结合层次化内存管理,突破 AI 芯片物理内存墙限制,提升推理效率。
(图/白有辉)
新加坡国立大学与上海交通大学联培博士后、2025 年度 CCF 博士学位论文激励计划获得者崔炜皞先生分享了《MuxWise:面向高 Goodput LLM 服务的 GPU 内 Prefill-Decode 复用技术》。他介绍了如何在一个 GPU 内实现 Prefill 与 Decode 的空分复用,实现高达 3 倍的 Goodput 提升,其团队已将相关代码合并入 SGLang 主分支,为社区做出了开源贡献。
(图/崔炜皞)
浪潮信息系统软件架构师 Hong Lion 先生带来了《CXL 池化内存在 AI 推理场景中的应用探索》的前沿技术分享,从理论探索到工程落地,展示了 CXL 技术在智算中心真实业务场景中的应用前景。
分享结束后,活动现场还举行了CXL 接口库开源发布仪式——浪潮信息正式将 CXL 接口库开源至龙蜥社区,为开发者在 CXL 内存池化、异构计算资源调度等方面提供标准化的接口支持。浪潮信息系统软件研发部高级研发经理张百林先生与龙蜥智算联盟主席宋卓先生共同启动了发布仪式。
茶歇过后,沐曦股份AI 研究院院长、清华大学集成电路学院博士李兆石先生带来了《InferMazeMap:分布式推理建模框架》的技术分享。他介绍了如何将模型结构、GPU 规格、并行配置、通信拓扑与优化策略统一映射为 TTFT、TPOT、TGS 等关键性能指标,为算子开发者、GPU 架构师与推理框架开发者提供一站式设计与建模分析工具。
(图/李兆石)
Imagination Technologies 颖脉信息高级工程师赵茜女士分享了《助力边缘 AI 的高效 GPU 创新架构》。她展示了新一代 GPU 在端侧 AI 领域的创新设计思路,探讨了如何在 NPU 性能密度与 CPU 可编程性之间取得平衡,推动 AI 从云端走向设备端。
(图/赵茜)
联智科技CEO、北京软件和信息服务业协会特聘专家付鸿雁女士进行了《从割裂到协同——超智融合算力中心的系统化搭建思路与落地路径》的主题演讲。她深耕高性能计算二十余年,指出超智融合不是简单的硬件堆砌,而是从芯片到运维的全栈深度融合,为算力中心的系统化搭建提供了落地路径。
(图/付鸿雁)
中兴通讯 AI Infra 资深算法工程师王辰宇先生带来了《量化部署+算子优化:解锁国产化硬件大模型高效推理破局之道》的实战分享。他介绍了如何通过低比特量化实现高效部署,以及如何通过多算子融合与单算子调优,全面提升端到端推理性能。
(图/王辰宇)
郑州大学电气与信息工程学院教授、中国计算机学会多媒体专业委员会执行委员陈恩庆先生作为最后一位演讲嘉宾,带来了《面向具身智能开放环境的云边协同视觉检测识别》的分享。他介绍了如何利用云端大模型与本地算力的云边协同,提升具身智能体在非结构化开放场景中的零样本识别与增量学习能力。
(图/陈恩庆)
从 SGLang 全链路追踪,到 MuxWise 的 GPU 内 PD 复用;从 CXL 池化内存的开源发布,到 InferMazeMap 的分布式推理建模;从边缘 AI 的 GPU 创新架构,到超智融合算力中心的系统化搭建;再到国产化硬件的量化部署与具身智能的云边协同——本次活动共同见证了一场覆盖 AI Infra 全栈的技术巡礼。
最后,感谢本次活动各位嘉宾的精彩演讲,也感谢浪潮信息及龙蜥社区伙伴:潘珏君、张旭芳、周美青、蔡佳丽、金美琴、倪俊雄(以上排名不分先后)等人的组织与配合,使得本次 MeetUp 活动圆满结束。
视频&课件
本次 MeetUp 回顾视频及 PPT 已上传至龙蜥官网,欢迎点击查看:
PPT课件:https://docs.openanolis.cn/document/detail/rpzigrnb
视频回放:https://openanolis.cn/video#1613533175946559578
附活动现场集锦:
—— 完 ——