文档备案控制台

开发者社区 > 龙蜥操作系统 > 视频 > 正文

一个高效可扩展的 Agentic RL 框架

发布者：龙蜥社区（OpenAnolis） 2026-03-17 17:53:02 279

龙蜥社区（OpenAnolis）

+关注

视频介绍

近期，强化学习的任务形态正从以reasoningtask为主，逐步演进为更复杂的Agentictask。这类任务引入了agentframework，更加复杂的数据生成流程与稳定性挑战，对RL训练框架提出了全新要求。本次演讲将聚焦slime框架，系统介绍其针对AgenticRL场景所做的一系列关键优化设计，包括灵活的rollout机制、解耦的agent接入方式、高效的并行与同步策略等，全面展示slime如何显著提升AgenticRL训练的scalability。

视频标签：

Linux

Anolis

相关视频

龙蜥操作系统

龙蜥社区（OpenAnolis）是面向国际的 Linux 服务器操作系统开源根社区及创新平台，秉承“平等、开放、协作、创新”的原则，理事会由阿里云、统信软件、龙芯、Arm 、Intel 等 24 家国内外头部企业共同组成，有超过 1000 家来自芯片厂商、软件厂商、整机厂商、操作系统厂商等覆盖操作系统全产业链的合作伙伴参与生态共建。

热门文章

热门讨论

展开全部

展开全部

+关注

龙蜥社区（OpenAnolis）

欢迎加入OpenAnolis龙蜥社区：钉钉群号 43205002258。

文章

问答

视频

相关文章

更多

软件测试面试题：交付一个性能测试项目，请阐述你的性能测试流程? 软件测试面试题：性能测试的核心原则是什么？软件测试面试题：性能测试指标有哪些？软件测试面试题：常见的性能测试方法有哪些？以及每类测试方法的目的是什么？软件测试面试题：做性能测试时你用过哪种测试工具？请说明其工作原理或举例说明工作流程。软件测试面试题：请分别针对性能测试、负载测试和压力测试试举一个简单的例子？软件测试面试题：性能测试时，是不是必须进行参数化？为什么要创建参数？LoadRunner中如何创建参数？软件测试面试题：简述性能测试的步骤。软件测试面试题：怎么分析性能测试结果？软件测试面试题：简述性能测试流程？