备案控制台

开发者社区 ModelScope模型即服务正文

ModelScope参数里面有没有可调的，能更节省显存？

"nproc_per_node=7
CUDA_VISIBLE_DEVICES=7,6,5,4,3,2,1 \
torchrun \
--nproc_per_node=$nproc_per_node \
--master_port 29500 \
/mnt/10101/staryea/aigc/modelscope_tuning/swift-main/examples/pytorch/llm/llm_sft.py \
--model_id_or_path qwen/Qwen-1_8B-Chat \
--model_revision master \
--sft_type lora \
--lora_target_modules ALL \
--template_type qwen \
--dtype AUTO \
--output_dir output/mix \
--ddp_backend nccl \
--train_dataset_sample -1 \
--val_dataset_sample -1 \
--num_train_epochs 3 \
--max_length -1 \
--check_dataset_strategy warning \
--gradient_checkpointing true \
--batch_size 1 \
--weight_decay 0.01 \
--learning_rate 1e-4 \
--gradient_accumulation_steps $(expr 16 / $nproc_per_node) \
--max_grad_norm 0.5 \
--warmup_ratio 0.1 \
--eval_steps 100 \
--save_steps 100 \
--save_only_model true \
--save_total_limit 2 \
--logging_steps 10 \
--train_dataset_mix_ratio 3.0 \
--resume_from_checkpoint output/mix/qwen-1_8b-chat/v22-20240305-065252/checkpoint-11300 \
--dataset jd-sentiment-zh \
--custom_train_dataset_path /mnt/10101/staryea/aigc/modelscope_tuning/data/qwen_intent_data.jsonl \
--custom_val_dataset_path /mnt/10101/staryea/aigc/modelscope_tuning/data/qwen_intent_val_data.jsonl \
--lora_target_modules ALL 现在训练还是会出现某一个卡显存不够的情况，导致训练中止， ModelScope参数里面有没有可调的，能更节省显存？"

展开

收起

小小爱吃香菜 2024-03-12 17:31:30 96 版权

1 条回答

写回答

取消提交回答

为了利利

"max_length限制一下 8192。此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

"

2024-03-12 20:28:37

赞同展开评论

相关问答

ModelScope 报显存不够如下图怎么解决？

319

1

0

在modelscope-funasr当音频文件超过一个小时后，显存溢出怎么解决？

245

1

0

modelscope-funasr20ms的情况下vad参数是如何设置的？

190

0

0

modelscope-funasr设置这个单位长度是什么参数？

368

1

0

在modelscope-funasr中推理的输出结果准确率要比直接推理的低，是参数有问题吗？

189

1

0

自定义数据集路径有问题是ModelScope的启动参数不对吗？

98

1

0

ModelScope微调qwen2不同参数的模型，分别需要的最低硬件要求是多少？

213

1

0

在modelscope-funasr我设4路的话，它的GPU显存占用就是4G吗？

116

1

0

ModelScope中，计算卡的显存是16g， vllm显所用显存也会均匀分布在各个卡上吗？

314

1

0

"gpu_memory_utilization 这个ModelScope参数的具体意思是啥？"

1059

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

相关文章

【Pytorch】基于LSTM-KAN、BiLSTM-KAN、GRU-KAN、TCN-KAN、Transformer-KAN(各种KAN修改一行代码搞定)的共享单车租赁预测研究(数据可换)Python

AR眼镜工业设备巡检运维的应用场景介绍｜阿法龙XR云平台

3.7V升压5V芯片深度剖析，PW5100/PW5300A/PW6276，选型无忧

室内人员定位手环从核心技术的差异、核心功能、应用场景及选购要点详解

RFID实验室资产轻松管控

热门讨论

热门文章

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，模型下载默认路径在哪个路径？

ModelScope中apikey在哪申请？

dataset的版本问题导致与modelscope不兼容

ModelScope下载速度慢怎么解决？

如何下载modelscope模型？

在modelscope-funasr想自己训练一种low resource 的方言，有训练的方案吗？

com/action/joingroup?code=v1是什么意思

创业项目：AI 拟人化中层解决方案

modelscope-funasr实时ASR的微调该怎么操作？

展开全部

Z-Image：冲击体验上限的下一代图像生成模型

Agent Skills技术协议与开源实现，让大模型拥有“即插即用”技能

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

共学 | 2025年，更加有效地搭建Agent

中文大模型体验

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Z-Image Turbo LoRA训练魔法：如何保持加速生图能力

Meta SAM3开源：让图像分割，听懂你的话

Qlib：华尔街颤抖！微软开源金融AI量化投资神器，助力智能投研

展开全部

还有其他疑问?