文档备案控制台

开发者社区 ModelScope模型即服务正文

基于deepseek-v3来复现r1

基于deepseek-v3来复现r1，请问有大佬知道当前有训练框架支持v3那样的671B大参数基座模型的grpo强化学习训练吗？

目前看市面上的R1复现都是基于一些小B模型的

展开

收起

游客gfmqatg7kz7n2 2025-05-14 17:44:03 250 版权

0 条回答

写回答

取消提交回答

相关问答

购买阿里国外的云服务器是否可以访问谷歌？

92580

50

0

this xml file does not appear to have any style in

61081

11

0

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

141858

16

0

C语言数组赋值报错，打印出来的是乱码，怎么解决？

1567

1

0

#支付宝授权提示请在支付宝客户端打开链接

24386

19

0

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

283832

11

0

#支付宝周期扣款无线端唤起签约页面提示“免密支付安全验证”？

8091

2

0

阿里云怎样设置二级域名以及域名解析？

66832

14

0

基础语言百问-Python

69572

30

0

sql server的用户名和密码怎么查啊？

41327

21

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关文章

论文解读：LLM 不直接改代码，也能让程序跑快 3 倍？

论文解读：DeepSeek DSpark 在真实高并发推理服务中，如何保证 Token 生成又好又快？

基于通话日志行为特征与机器学习的语音钓鱼网络主动检测框架研究

Microsoft Teams 主题远程访问钓鱼攻击全链路检测与防御体系研究

AI 赋能自动语音诈骗全链路检测与 STIR/SHAKEN 协同防御研究

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

在ModelScope中，这个下载文件是模型文件吗？存储路径能改吗？

modelscope-funasr的onnxruntime c++只能使用onnx结尾的模型吗？

下载ModelScope模型默认放在哪个目录下啊，可以指定目录吗？

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

com/action/joingroup?code=v1是什么意思

cuda 是11.3，ModelScope的mmcv怎么安装？

ModelScope下载速度慢怎么解决？

IndexTTS 部署报错：No module named 'tn'

modelscope中snapshot- download是自带断点续下吗？

展开全部

高效部署通义万相Wan2.1：ComfyUI文生/图生视频实战，工作流直取！

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

Hermes Agent：深度技术剖析报告

在魔搭使用ComfyUI，玩转AIGC

video-subtitle-remover（VSR）--开源AI去字幕方案深度解析

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

AgentScope 2.0 发布：从"跑通 Demo"到"稳定落地"，构建可靠智能体的工程底座

阿里开源AI视频生成大模型 Wan2.1：14B性能超越Sora、Luma等模型，一键生成复杂运动视频

展开全部

还有其他疑问?