文档备案控制台

开发者社区 ModelScope模型即服务正文

微调Deepseek-R1-distill-7B、merge_lora true后无法回答问题

使用最新的ms-swift框架对Deepseek-R1-distill-7B进行微调，对微调出来的模型进行deploy ckpt_dir是可以正常问答的，而在进行swift export该checkpoint后（merge_lora true），再对合并后的结果进行deploy --model部署后，就无法正常回答了，一个问题要等很久才会出来一堆感叹号？为什么？是哪里需要特殊参数吗？

展开

收起

1870992051875295 2025-03-14 11:20:14 248 版权

1 条回答

写回答

取消提交回答

1870992051875295

这个7B模型参数貌似是冻结的，微调时不会收敛，一直为0

2025-03-14 17:36:07

赞同 415 展开评论

相关问答

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

132384

15

0

#支付宝授权提示请在支付宝客户端打开链接

17154

18

0

通过www和不带www的网址输入最终都指向www.我的域名.com，求指教

141076

45

0

购买阿里国外的云服务器是否可以访问谷歌？

86002

48

0

空间如何支持这些函数

35090

22

0

#支付宝身份验证失败（人气大爆发，一会再试试）？

9650

1

0

this xml file does not appear to have any style in

53418

10

0

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

264725

10

0

com/action/joingroup?code=v1是什么意思

220543

21

0

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

4392

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关文章

Xcode 26.2 (17C52) 发布 - Apple 平台 IDE

ModelScope魔搭社区发布月报 -- 25年12月

《Android瘦LTO与Swift集成层启动优化实战指南》

框架选错全白费：主流微调工具横向对比与选型指南

[大模型实战 06] 我的模型我做主：在 Kaggle 上用 Unsloth 极速微调 Qwen3

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

运行qwen-image显示Reconnecting

如何下载modelscope模型？

dataset的版本问题导致与modelscope不兼容

ModelScope下载速度慢怎么解决？

我希望通过damo-YOLO训练1500*1500的图片

在ModelScope中，下载模型时的ssl问题怎么解决？!

com/action/joingroup?code=v1是什么意思

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

无法导入 modelscope，已经pip install了

展开全部

OpenClaw（原 Clawdbot）钉钉对接保姆级教程手把手教你打造自己的 AI 助手

保姆级 OpenClaw （原 Clawdbot）飞书对接教程手把手教你搭建 AI 助手

阿里云通义千问向全社会开放！

HTTPS 原理

免费的模型API平台盘点

OoderAI BridgeCode 产品白皮书——全方位赋能企业编程升级

Qwen3-Coder-Next开源！推动小型混合模型在智能体编程上的边界

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

目前最火的 AI 助手 Clawdbot 又又又改名了并且发布新版本

Qwen3-TTS全面开源：支持超低延迟流式合成的多语言语音大模型

展开全部

还有其他疑问?