备案控制台

开发者社区 > ModelScope模型即服务 > 正文

ModelScope的这种情况我们该怎么调整？

使用Qwen-1_8B-Chat微调我们自己的数据，--custom_train_dataset_path 和 --custom_val_dataset_path 指定我们的数据，sft_type=full时，--eval_human true验证结果随机，--eval_human false效果还可以；sft_type=lora，我们自己的数据特征直接没学习到。ModelScope的这种情况我们该怎么调整？以下是lora训练的命令行参数PYTHONPATH=../../.. \
CUDA_VISIBLE_DEVICES=0,1 \
torchrun \
--nproc_per_node=$nproc_per_node \
--master_port 29500 \
/mnt/10101/staryea/aigc/modelscope_tuning/swift-main/examples/pytorch/llm/llm_sft.py \
--model_id_or_path qwen/Qwen-1_8B-Chat \
--model_revision master \
--sft_type lora \
--template_type qwen \
--dtype AUTO \
--output_dir output \
--ddp_backend nccl \
--train_dataset_sample -1 \
--val_dataset_sample -1 \
--num_train_epochs 1 \
--max_length -1 \
--check_dataset_strategy warning \
--gradient_checkpointing true \
--batch_size 1 \
--w

展开

收起

陈幕白 2024-02-26 21:27:34 62 0

1 条回答

写回答

取消提交回答

顾九思

lora训练的命令行参数贴一下，然后sft_type=lora 你需要指定 --lora_target_modules ALL.
eval_human true验证结果随机, 你应该是输入格式和数据集中的prompt不一致此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-02-26 21:59:13

赞同展开评论打赏

相关问答

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

55205

28

0

企业邮箱

8641

6

0

this xml file does not appear to have any style in

28766

8

0

如果购买了域名，一定要备案才能用吗

36047

34

0

OSS的endpoint如何查看

29400

3

0

com/action/joingroup?code=v1是什么意思

204789

19

0

有哪些值得收藏的五个种子搜索引擎&磁力搜索引擎？

91866

16

0

什么是二进制？二进制怎么算？

37135

40

0

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

227736

10

0

配置了安全组规则，端口还是无法访问

27087

20

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

热门讨论

热门文章

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

com/action/joingroup?code=v1是什么意思

ModelScope中，模型下载默认路径在哪个路径？

modelscope-funasr的FunClip怎么安装的？

ModelScope有部署qwen2-72b的么，正常推理需要多大的显存？

无法导入 modelscope，已经pip install了

CUDA error: CUDA-capable device(s) is busy

服务器上onnxruntime-gpu 调用结束，如何释放显存

请问在 ModelScope 上的模型断网使用报这个错误啥原因了?

关于 Windows平台上 ttsfrd 库的问题。

展开全部

阿里云通义千问向全社会开放！

multi-agent：多角色Agent协同合作，高效完成复杂任务

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

开源版图生视频I2VGen-XL：单张图片生成高质量视频

通义千问72B、1.8B、Audio模型开源！魔搭社区最佳实践来啦！

【RAG实践】Rerank，让RAG更近一步

自然语言处理Transformer模型最详细讲解（图解版）

【机器学习技巧】回归模型的几个常用评估指标（R2、Adjusted-R2、MSE、RMSE、MAE、MAPE）及其在sklearn中的调用方式

vanna+qwen实现私有模型的SQL转换

展开全部

相关电子书

更多

低代码开发师（初级）实战教程 立即下载

冬季实战营第三期：MySQL数据库进阶实战 立即下载

阿里巴巴DevOps 最佳实践手册 立即下载