文档备案控制台

开发者社区千问大模型正文

大模型sft后出现复读机情况

训练脚本如下：

Path

MODEL=/models/Qwen3-8B
OUTPUT_DIR=/sft_output/zhongliu/Qwen3-8B/zhongliu_v5

MASTER_PORT=29500 \
NPROC_PER_NODE=4 \
CUDA_VISIBLE_DEVICES=4,5,6,7 \
swift sft \
--model ${MODEL} \
--train_type full \
--torch_dtype bfloat16 \
--num_train_epochs 3 \
--per_device_train_batch_size 1 \
--per_device_eval_batch_size 1 \
--learning_rate 1e-5 \
--gradient_accumulation_steps 4 \
--save_strategy epoch \
--logging_steps 1 \
--max_length 10240 \
--warmup_ratio 0.05 \
--dataloader_num_workers 8 \
--save_total_limit 5 \
--save_only_model true \
--output_dir ${OUTPUT_DIR} \
--report_to tensorboard \
--deepspeed zero3 \
--gradient_checkpointing true \
--use_liger_kernel \
--attn_impl flash_attn \

测试temperature=0.6，top_p=0.95,还是会出现模型复读的情况，训练数据集是做的中医领域的相关数据集，自我认知以及安全性。

展开

收起

游客wgw62ndjcqwds 2026-01-08 14:21:59 69 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

0 条回答

写回答

取消提交回答

问答分类：

Swift 大模型服务平台百炼

问答地址：

开发者社区 > 千问大模型 > 问答

相关问答

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

134938

16

0

#支付宝授权提示请在支付宝客户端打开链接

18307

19

0

#支付宝身份验证失败（人气大爆发，一会再试试）？

10597

2

0

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

266488

11

0

轻量级应用服务器端口问题（打不开）

31823

21

0

购买阿里国外的云服务器是否可以访问谷歌？

86722

49

0

this xml file does not appear to have any style in

54321

11

0

今天刚刚买的阿里云香港服务器，国内无法访问，坑啊

35057

17

0

LoRa的网络覆盖能力范围是怎么样的？

4100

1

0

com/action/joingroup?code=v1是什么意思

220930

21

0

千问大模型

阿里云自主研发的千问大模型，凭借万亿级超大规模数据训练和领先的算法框架，实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

我要提问

相关文章

大模型应用：通俗理解大模型量化：从概念到实践的原理流程完整拆解.38

重磅！Cursor确认现场出席D2并发表主题演讲：Cursor大规模agentic编程系统的工程实践

智能体如何“看懂”界面，精准找到“人想要”的对应地方

适时性智能 AI：AI 建站的协作式共创新模式

智慧医疗·区域云HIS源码一体化协同平台 (SaaS版)

相关解决方案

更多

零代码微调，打造领域专属大模型

触手可及，函数计算玩转 AI 大模型

告别低效沟通，使用大模型发起语音通话

构建大模型应用的安全防护体系

Kimi K2，开源万亿参数大模型

热门讨论

热门文章

调用百炼做的agent，API显示401问题，具体如图，请问各位原因是什么啊？

如何在claude code上调用mcp实现自动化数据采集？

发送excel文件，在钉钉上打开报错误。OfficeImportErrorDomain错误912

claude code接入千问3.5效果怎么样如题,用过的老哥给评测一下

AI助理表单填报示例功能为什么没有？

大模型的token是怎么计算的？

在idea中有时候暂时不用，如何临时关闭自动提示和补全呢？

idea2023.3版本中插件通义灵码打开界面卡死

阿里云通义千问，怎么申请内测？

VSCode中无法登录通义灵码

展开全部

重磅！阿里云Coding Plan全面上线四大顶流模型

大模型应用：大模型与智能体（Agent）的核心差异：从定义到实践全解析.34

AI学习全景图：从大模型到RAG，从工具到变现，一条从0到1的路线

2026年智能体（Agent）怎么学？从入门到实战的全景避坑指南

Docker+vLLM内网离线部署Qwen3 流程

ollama + qwen2.5-coder + VS Code + Continue 实现本地AI 辅助写代码

通义灵码编程智能体，上线！

深度解析智能体工作流(Agentic Workflows)：核心概念、模式与应用

阿里千问“驻桌”，阿里重构PC生产力

Agent与大模型的区别

展开全部

还有其他疑问?