直播预告: 异构场景下的大模型优化技术 | 龙蜥大讲堂

简介: 异构场景下的大模型优化技术 。

「龙蜥大讲堂」精彩预告来了,点击下方海报抢先了解。欢迎扫描海报二维码提前进群,立即预约锁定这场 AI 关键技术分享!

异构场景下的大模型优化技术

直播时间:2026 年 04 月 15 日 (周三)16:00-17:00

直播内容:

本次直播带大家了解异构推理的工作机制,掌握不同类型模型上的性能优化技巧,以及分享异构推理的基本过程和存在问题,分析在基于龙蜥操作系统的硬件资源受限场景下,稠密模型和 MoE 模型在 CPU 端的卸载技术。

适合人群:

研发工程师、运维工程师

讲师介绍:

Rongfei Xu,浪潮信息系统软件架构师。博士毕业于北航计算机学院计算机软件与理论专业,研究领域为服务器操作系统、大模型推理等系统优化技术。目前从事异构推理的性能提升工作。

小龙温馨提醒往期龙蜥大讲堂视频回放已上线至龙蜥官网,欢迎观看,有任何疑问欢迎随时咨询龙蜥助手—小龙(微信:openanolis_assis)。


相关文章
|
16天前
|
存储 人工智能 缓存
极速、稳定、丝滑:OpenClaw 接入 Mooncake 后的性能跃迁
OpenClaw 不只是更快了,更重要的是更稳了。
|
3天前
|
机器学习/深度学习 人工智能 监控
MiniMax M2.7开源: 模型开始迭代自己了!
MiniMax M2.7正式开源!作为M2系列新一代旗舰,首次实现“模型参与自我迭代”范式:自主驱动RL训练、优化Harness架构。软件工程(SWE-Pro 56.22%)、专业办公(GDPval-AA ELO 1495)、互动娱乐能力全面跃升,支持SGLang/vLLM/Transformers本地部署。
370 6
|
3月前
|
存储 弹性计算 固态存储
2026年阿里云服务器4核8G配置收费标准与活动价格,最优购买方案与价格对比
2026年阿里云4核8G云服务器提供多样化实例选择,价格跨度显著。经济型e实例年费约1477元起,适配个人网站、开发测试等轻量场景;通用算力型u2a实例年费约898元起,以高性价比支撑企业通用业务;计算型c9i实例年费约3147元起,聚焦高性能计算场景。用户可通过新客专属折扣、九代实例年付6.4折、领券满减等策略降低成本,结合带宽降配+CDN加速、弹性云盘等技巧进一步优化成本,适配小型网站、电商后台、在线游戏等多场景需求。
|
9天前
|
人工智能 测试技术 开发工具
Anthropic 的 Harness 工程架构演进
本文分享Anthropic的Harness工程实践:从双Agent解决“一次做太多”与“过早完成”,到三Agent(Planner/Generator/Evaluator)引入独立评估与上下文重置根治自我偏差和上下文焦虑,最终随模型能力提升动态裁撤冗余设计。核心结论:模型边界持续外推,Harness工程是当前决定Agent实际效果的关键变量。
206 0
|
4天前
|
人工智能 安全 数据挖掘
GitHub 14万星!Claude Code 从「会写代码」到「工程系统」的升级指南
小华同学专注AI工程化实践!「Everything Claude Code」是面向Claude等AI编程工具的开源系统,含47个代理、181个技能、79个命令,支持上下文持久化、验证闭环、安全扫描(AgentShield)与持续学习,助开发者将AI从“对话助手”升级为可交付、可沉淀的智能工程系统。(239字)
374 1
|
11天前
|
人工智能 安全 机器人
阿里云无影云电脑部署OpenClaw图文教程:QQ集成+千问Qwen3.6-Plus配置+新手避坑指南
2026年,OpenClaw(原Clawdbot)作为开源AI代理自动化框架的标杆产品,凭借轻量化部署、跨平台兼容、大模型生态完善、即时通讯集成便捷的核心优势,成为个人与团队搭建专属智能助手的首选方案。阿里云无影云电脑以云端桌面、随时随地访问、环境预置、安全稳定的特性,为OpenClaw提供7×24小时不间断运行的理想环境,彻底解决本地部署断电、断网、设备性能不足的痛点。搭配QQ深度集成,用户可通过QQ单聊、群聊随时随地与AI助手交互;配合阿里云千问Qwen3.6-Plus高性能大模型,实现智能对话、代码生成、任务自动化、文档处理、信息检索等全场景能力。本文全程提供可直接复制的代码命令,从阿里
330 10
|
8天前
|
人工智能 自然语言处理 安全
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
本文介绍了Claude Code终端AI助手的使用指南,主要内容包括:1)常用命令如版本查看、项目启动和更新;2)三种工作模式切换及界面说明;3)核心功能指令速查表,包含初始化、压缩对话、清除历史等操作;4)详细解析了/init、/help、/clear、/compact、/memory等关键命令的使用场景和语法。文章通过丰富的界面截图和场景示例,帮助开发者快速掌握如何通过命令行和交互界面高效使用Claude Code进行项目开发,特别强调了CLAUDE.md文件作为项目知识库的核心作用。
9061 27
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
|
28天前
|
人工智能 Linux API
保姆级图文实战|OpenClaw阿里云/本地秒级部署+MiniMax M2.5接入步骤流程
2026年,AI智能体的落地核心已从“技术探索”转向“高效落地”,OpenClaw(Clawdbot)作为轻量化、高兼容的AI Agent框架,凭借容器化部署优势、灵活的技能扩展能力,成为衔接阿里云基础设施与MiniMax M2.5大模型的核心载体。MiniMax M2.5作为2026年新一代原生Agent生产级模型,采用混合专家(MoE)架构,总参数达2300亿却仅激活100亿参数推理,实现了性能与成本的双重突破,推理成本降至主流模型的1/10至1/20,搭配OpenClaw可实现自动化任务拆解、复杂指令执行、长文本处理等高阶功能,广泛适用于办公自动化、研报解析、代码开发等多场景。
1386 1
|
15天前
|
人工智能 JSON 监控
Claude Code 源码泄露:一份价值亿元的 AI 工程公开课
我以为顶级 AI 产品的护城河是模型。读完这 51.2 万行泄露的源码,我发现自己错了。
5697 26

热门文章

最新文章

下一篇
开通oss服务