备案控制台

开发者社区 > ModelScope模型即服务 > 正文

qwen1.5，微调训练的时候,ModelScope官方给的参数能否直接使用，有什么需要注意的吗?

"qwen1.5，微调训练的时候,ModelScope官方给的参数能否直接使用，有什么需要注意的吗?
DISTRIBUTED_ARGS=""
--nproc_per_node $NPROC_PER_NODE \
--nnodes $NNODES \
--node_rank $NODE_RANK \
--master_addr $MASTER_ADDR \
--master_port $MASTER_PORT
""

torchrun $DISTRIBUTED_ARGS src/train_bash.py \
--deepspeed $DS_CONFIG_PATH \
--stage sft \
--do_train \
--use_fast_tokenizer \
--flash_attn \
--model_name_or_path $MODEL_PATH \
--dataset your_dataset \
--template qwen \
--finetuning_type lora \
--lora_target q_proj,v_proj\
--output_dir $OUTPUT_PATH \
--overwrite_cache \
--overwrite_output_dir \
--warmup_steps 100 \
--weight_decay 0.1 \
--per_device_train_batch_size 4 \
--gradient_accumulation_steps 4 \
--ddp_timeout 9000 \
--learning_rate 5e-6 \
--lr_scheduler_type cosine \
--logging_steps 1 \
--cutoff_len 4096 \
--save_steps 1000 \
--plot_loss \
--num_train_epochs 3 \
--bf16"

展开

收起

小小爱吃香菜 2024-05-01 08:56:48 109 0

0 条回答

写回答

取消提交回答

相关问答

对modelscope的实体命名预训练模型进行微调上出现错误

35

0

0

微调llama3时报modelscope - ERROR错，能帮忙看一下什么问题吗

49

0

0

在modelscope-funasr训练的样例batch size为啥是20000这么大呢？

47

1

0

为什么我微调modelscope大模型时报错，让我升级内核啊？能升级吗？

59

1

0

modelscope-funasr微调时候会出现loss为负的情况，怎么回事？

38

0

0

modelscope-funasr20ms的情况下vad参数是如何设置的？

53

0

0

modelscope训练完一直出现同一个错误怎么回事？

64

1

0

ModelScope 使用mossformer的训练代码出现如下报错，该如何解决啊？

54

1

0

modelscope-funasr的vad模型对输入的语音长度是不是有最短时长的要求？

79

0

0

在modelscope-funasr中使用加载模型比如下慢非常多的情况，如何解决？

58

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

热门讨论

热门文章

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

com/action/joingroup?code=v1是什么意思

ModelScope中，模型下载默认路径在哪个路径？

modelscope上跑报错，提示要pip install ttsfrd，搞不定

我希望通过damo-YOLO训练1500*1500的图片

modelscope-funasr的FunClip怎么安装的？

ModelScope有部署qwen2-72b的么，正常推理需要多大的显存？

ModelScope有没有人知道windows安装ttsfrd的方法或者ttsfrd源码？

关于 Windows平台上 ttsfrd 库的问题。

钉钉宜搭内如何将任务的流程表单发到工作群内，群内任意成员可以查看此任务，并选择是否接受任务？

展开全部

阿里云通义千问向全社会开放！

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

CosyVoice 2.0：阿里开源升级版语音生成大模型，支持多语言和跨语言语音合成，提升发音和音色等的准确性

实战阿里qwen2.5-coder 32B，如何配置Cline的Ollama API接口。

Deepseek开源R1系列模型，纯RL助力推理能力大跃升！

MiniCPM-o 2.6：流式全模态，端到端，多模态端侧大模型来了！

MiniCPM-o 2.6：面壁智能开源多模态大模型，仅8B参数量就能媲美GPT-4o，支持实时交互，在ipad等终端设备上运行

multi-agent：多角色Agent协同合作，高效完成复杂任务

DeepSeek-V2.5-1210 在线开放使用！支持联网搜索，在各大领域的表现得到全面提升

WeaveFox：蚂蚁集团推出 AI 前端智能研发平台，能够根据设计图直接生成源代码，支持多种客户端和技术栈

展开全部

相关课程

更多

个性化语音合成模型微调

261

1

去学习

ModelScope社区Library技术架构介绍

229

1

去学习

相关电子书

更多

视觉AI能力的开放现状及ModelScope实战 立即下载

ModelScope助力语音AI模型创新与应用 立即下载

低代码开发师（初级）实战教程 立即下载