直播预告: 异构场景下的大模型优化技术 | 龙蜥大讲堂

简介: 异构场景下的大模型优化技术 。

「龙蜥大讲堂」精彩预告来了,点击下方海报抢先了解。欢迎扫描海报二维码提前进群,立即预约锁定这场 AI 关键技术分享!

异构场景下的大模型优化技术

直播时间:2026 年 04 月 15 日 (周三)16:00-17:00

直播内容:

本次直播带大家了解异构推理的工作机制,掌握不同类型模型上的性能优化技巧,以及分享异构推理的基本过程和存在问题,分析在基于龙蜥操作系统的硬件资源受限场景下,稠密模型和 MoE 模型在 CPU 端的卸载技术。

适合人群:

研发工程师、运维工程师

讲师介绍:

Rongfei Xu,浪潮信息系统软件架构师。博士毕业于北航计算机学院计算机软件与理论专业,研究领域为服务器操作系统、大模型推理等系统优化技术。目前从事异构推理的性能提升工作。

小龙温馨提醒往期龙蜥大讲堂视频回放已上线至龙蜥官网,欢迎观看,有任何疑问欢迎随时咨询龙蜥助手—小龙(微信:openanolis_assis)。


相关文章
|
23天前
|
人工智能 安全 数据中心
DeepSeek V4炸场背后:硅谷在“造墙”,中国在“修路”
4月24日,DeepSeek-V4发布即登顶Hugging Face开源榜,以百万级上下文、极低KV Cache及国产芯片深度适配惊艳业界;同期Kimi K2.6紧随其后。中美AI路径分野凸显:硅谷闭源互搏,中国开源协同——技术共享、架构互鉴、生态共荣,走出一条“和而不同”的AGI新路。
211 0
|
26天前
|
人工智能 自然语言处理 安全
阿里云百炼Token Plan是什么?套餐、API调用、工具配置与优惠活动完整实战手册
阿里云百炼Token Plan以统一Credits计费、多模型自由切换、团队化管理、预算可控、安全隐私为核心优势,为团队与企业提供一站式AI大模型订阅服务。三档套餐覆盖轻度到重度全场景需求,兼容主流编程与智能体工具,开通简单、接入方便、成本透明,配合丰富的新用户优惠、批量折扣、长期订阅福利,是当前团队规模化使用AI服务的高性价比方案。
534 5
|
2月前
|
存储 人工智能 安全
|
5月前
|
存储 人工智能 编译器
智驾大模型的「隐形战场」:当GPU堆不动了,行业拼什么?
与参会嘉宾一起探讨了如何通过技术协作加速智能驾驶的进步,分享了各自在自动驾驶技术栈中的前沿实践与生态思考。
|
22天前
|
安全 Linux iOS开发
Tenable Nessus 10.12.0 (macOS, Linux, Windows) - 漏洞评估解决方案
Tenable Nessus 10.12.0 (macOS, Linux, Windows) - 漏洞评估解决方案
105 1
|
12天前
|
人工智能 安全 Linux
【安全公告】Linux 内核高危本地提权漏洞 CVE-2026-31431 龙蜥已修复,请及时升级更新
龙蜥社区已发布 Anolis OS 7/8/23 的官方安全修复公告 ANSA-2026:0566、ANSA-2026:0565、ANSA-2026:0564。受影响用户请立即完成修复。
|
22天前
|
存储 缓存 自然语言处理
PHP的OPcache与全栈性能优化——从字节码缓存到预加载
PHP的执行过程分为四个阶段:词法/语法解析→生成抽象语法树(AST)→编译为字节码(opcodes)→执行(ZendVM)
120 9
|
22天前
|
人工智能 Anolis
倒计时 1 天!欢迎解锁 AI Infra MeetUp 直播渠道,明天北京见
AI Infra 产学研用全链路最新技术趋势与产业动态。

热门文章

最新文章