CXL 接口库开源!龙蜥智算联盟 MeetUp 圆满举办,聚焦 AI Infra全栈创新落地

简介: 围绕 AI Infra 全栈技术趋势与创新实践,与现场开发者进行了深入的技术交流,共同勾勒下一代 AI Infra 的技术蓝图。

近日,以“智算时代的基础设施创新”为主题的龙蜥智算联盟 MeetUp 在北京海淀成功举办。本次活动由龙蜥社区、龙蜥智算联盟联合主办,得到了 InfoQ、CSDN、思否、51CTO、阅码场、OSCHINA、极星会等业内知名媒体与社区的大力支持并同步线上直播。现场来自阿里云、浪潮信息、中国科学技术大学、上海交通大学、郑州大学、沐曦股份、Imagination、联智科技、中兴通讯等产学研领域的技术专家带来了精彩的技术分享,围绕 AI Infra 全栈技术趋势与创新实践,与现场开发者进行了深入的技术交流,共同勾勒下一代 AI Infra 的技术蓝图。

(图/活动现场嘉宾合影)

会议伊始,浪潮信息系统软件研发部总经理、龙蜥社区技术委员会副主席苏志远先生为本次活动致开场辞。苏志远从芯片驱动、操作系统、算子库、AI 软件栈等系统软件研发创新到龙蜥社区的技术治理,为与会者描绘了智算技术创新与智算基础设施生态建设的清晰路径。

随后,阿里云资深技术专家、龙蜥智算联盟主席宋卓先生上台致辞。宋卓从联盟视角切入,结合龙蜥智算联盟的规划,就如何抓住 AI 南北向深度协同与创新的机遇提出见解,为接下来的技术分享拉开序幕。

 

致辞环节结束后,技术分享正式拉开帷幕。龙蜥社区 SGLang 项目开发者苏峰先生带来了《从黑盒到透明:SGLang tracing 如何赋能 LLM 推理性能诊断》的技术分享。他针对大模型推理服务中“请求延迟到底卡在队列等待、Prefill 计算还是 Decode 阶段”这一黑盒难题,介绍了基于 OpenTelemetry 标准的端到端全链路追踪系统,让性能调优从"猜测驱动"转变为"数据驱动"。

(图/苏峰)

中国科学技术大学计算机科学与技术学院特任副研究员白有辉老师进行了《面向multi-agent 场景的长上下文管理方法》的主题演讲。白老师介绍了如何利用稀疏化注意力机制结合层次化内存管理,突破 AI 芯片物理内存墙限制,提升推理效率。

(图/白有辉)


新加坡国立大学与上海交通大学联培博士后、2025 年度 CCF 博士学位论文激励计划获得者崔炜皞先生分享了《MuxWise:面向高 Goodput LLM 服务的 GPU 内 Prefill-Decode 复用技术》。他介绍了如何在一个 GPU 内实现 Prefill 与 Decode 的空分复用,实现高达 3 倍的 Goodput 提升,其团队已将相关代码合并入 SGLang 主分支,为社区做出了开源贡献。

(图/崔炜皞)

浪潮信息系统软件架构师 Hong Lion 先生带来了《CXL 池化内存在 AI 推理场景中的应用探索》的前沿技术分享,从理论探索到工程落地,展示了 CXL 技术在智算中心真实业务场景中的应用前景。


分享结束后,活动现场还举行了CXL 接口库开源发布仪式——浪潮信息正式将 CXL 接口库开源至龙蜥社区,为开发者在 CXL 内存池化、异构计算资源调度等方面提供标准化的接口支持。浪潮信息系统软件研发部高级研发经理张百林先生与龙蜥智算联盟主席宋卓先生共同启动了发布仪式。

茶歇过后,沐曦股份AI 研究院院长、清华大学集成电路学院博士李兆石先生带来了《InferMazeMap:分布式推理建模框架》的技术分享。他介绍了如何将模型结构、GPU 规格、并行配置、通信拓扑与优化策略统一映射为 TTFT、TPOT、TGS 等关键性能指标,为算子开发者、GPU 架构师与推理框架开发者提供一站式设计与建模分析工具

(图/李兆石)

Imagination Technologies 颖脉信息高级工程师赵茜女士分享了《助力边缘 AI 的高效 GPU 创新架构》。她展示了新一代 GPU 在端侧 AI 领域的创新设计思路,探讨了如何在 NPU 性能密度与 CPU 可编程性之间取得平衡,推动 AI 从云端走向设备端。

(图/赵茜)

联智科技CEO、北京软件和信息服务业协会特聘专家付鸿雁女士进行了《从割裂到协同——超智融合算力中心的系统化搭建思路与落地路径》的主题演讲。她深耕高性能计算二十余年,指出超智融合不是简单的硬件堆砌,而是从芯片到运维的全栈深度融合,为算力中心的系统化搭建提供了落地路径。

(图/付鸿雁)

中兴通讯 AI Infra 资深算法工程师王辰宇先生带来了《量化部署+算子优化:解锁国产化硬件大模型高效推理破局之道》的实战分享。他介绍了如何通过低比特量化实现高效部署,以及如何通过多算子融合与单算子调优,全面提升端到端推理性能。

(图/王辰宇)

郑州大学电气与信息工程学院教授、中国计算机学会多媒体专业委员会执行委员陈恩庆先生作为最后一位演讲嘉宾,带来了《面向具身智能开放环境的云边协同视觉检测识别》的分享。他介绍了如何利用云端大模型与本地算力的云边协同,提升具身智能体在非结构化开放场景中的零样本识别与增量学习能力。

(图/陈恩庆)

从 SGLang 全链路追踪,到 MuxWise 的 GPU 内 PD 复用;从 CXL 池化内存的开源发布,到 InferMazeMap 的分布式推理建模;从边缘 AI 的 GPU 创新架构,到超智融合算力中心的系统化搭建;再到国产化硬件的量化部署与具身智能的云边协同——本次活动共同见证了一场覆盖 AI Infra 全栈的技术巡礼。


最后,感谢本次活动各位嘉宾的精彩演讲,也感谢浪潮信息及龙蜥社区伙伴:潘珏君、张旭芳、周美青、蔡佳丽、金美琴、倪俊雄(以上排名不分先后)等人的组织与配合,使得本次 MeetUp 活动圆满结束


视频&课件

本次 MeetUp 回顾视频及 PPT 已上传至龙蜥官网,欢迎点击查看:

PPT课件:https://docs.openanolis.cn/document/detail/rpzigrnb

视频回放:https://openanolis.cn/video#1613533175946559578

附活动现场集锦:

—— 完 ——


相关文章
|
1月前
|
人工智能 运维 编译器
|
2月前
|
安全 数据库连接 索引
5个让你代码更优雅的Python技巧
5个让你代码更优雅的Python技巧
270 141
|
2月前
|
大数据 PHP
5个提升开发效率的PHP技巧
5个提升开发效率的PHP技巧
365 143
|
2月前
|
索引 Python
5个让你惊艳的Python一行代码技巧
5个让你惊艳的Python一行代码技巧
279 142
|
2月前
|
机器学习/深度学习 人工智能 数据可视化
【AI加持】基于PyQt+YOLO+DeepSeek的口罩佩戴检测系统(详细介绍)
本文介绍了一个基于PyQt+YOLO+DeepSeek的口罩佩戴检测系统。该系统利用YOLOv8实现高效目标检测,结合PyQt5构建可视化界面,并集成DeepSeek模型进行智能分析。支持图片、视频、摄像头等多种数据源输入,可实时检测口罩佩戴情况。系统采用多线程技术保证流畅运行,并使用SQLite3进行数据存储管理。该方案有效解决了公共场所口罩佩戴监测难题,相比人工巡查显著提升了管理效率和准确性,为智慧城市建设和公共卫生安全管理提供了智能化解决方案。
322 34
【AI加持】基于PyQt+YOLO+DeepSeek的口罩佩戴检测系统(详细介绍)
|
2月前
|
人工智能 监控 数据可视化
【AI加持】基于PyQt+YOLO+DeepSeek的车型检测系统(详细介绍)
本文介绍了一款基于PyQt5、YOLOv8和DeepSeek的车型检测系统。该系统通过YOLOv8实现实时目标检测,可识别公交车、小汽车等多种车型,并利用DeepSeek进行智能分析评估。系统采用Sqlite3进行数据存储,结合多线程技术提升性能。应用场景包括交通流量监测、智慧停车场管理、公路收费站和城市安防等,为智能交通建设提供高效解决方案。系统还具备登录注册功能,确保使用安全。该技术方案将计算机视觉与AI分析相结合,推动交通管理向智能化方向发展。
463 36
|
30天前
|
缓存 安全 小程序
Lua-LSM 系列二:从 CopyFail 到 Dirty Frag,看 732 字节的漏洞,用 79 字节关上
最近发生的真实安全漏洞场景,展示 Lua-LSM 如何在 79 字节内完成对内核提权漏洞的热缓解。
|
2月前
|
人工智能 智能硬件
告别“废话式”提问:让AI输出高质量答案的3个核心技巧
告别“废话式”提问:让AI输出高质量答案的3个核心技巧
595 77
|
4天前
|
存储 运维 数据管理
告别“大海捞针”:OSS Vector Bucket 如何赋能媒资管理平台
在 AI 时代,媒资平台面临多模态数据爆炸式增长的管理挑战。阿里云 OSS Vector Bucket 提供统一向量存储与语义检索能力,支持 30 亿级素材秒级精准查找,打破数据孤岛,降低成本,助力内容创作提效降本。
171 11
|
1月前
|
缓存 人工智能 运维
SysOM Agent智能运维系列:Pod内存高告警,一次对话30秒定位根因
让内存诊断从"靠经验排查"变成"可解释、可复现、可执行"的工程化流程。

热门文章

最新文章