备案控制台

开发者社区 > ModelScope模型即服务 > 正文

ModelScope参数里面有没有可调的，能更节省显存？

"nproc_per_node=7
CUDA_VISIBLE_DEVICES=7,6,5,4,3,2,1 \
torchrun \
--nproc_per_node=$nproc_per_node \
--master_port 29500 \
/mnt/10101/staryea/aigc/modelscope_tuning/swift-main/examples/pytorch/llm/llm_sft.py \
--model_id_or_path qwen/Qwen-1_8B-Chat \
--model_revision master \
--sft_type lora \
--lora_target_modules ALL \
--template_type qwen \
--dtype AUTO \
--output_dir output/mix \
--ddp_backend nccl \
--train_dataset_sample -1 \
--val_dataset_sample -1 \
--num_train_epochs 3 \
--max_length -1 \
--check_dataset_strategy warning \
--gradient_checkpointing true \
--batch_size 1 \
--weight_decay 0.01 \
--learning_rate 1e-4 \
--gradient_accumulation_steps $(expr 16 / $nproc_per_node) \
--max_grad_norm 0.5 \
--warmup_ratio 0.1 \
--eval_steps 100 \
--save_steps 100 \
--save_only_model true \
--save_total_limit 2 \
--logging_steps 10 \
--train_dataset_mix_ratio 3.0 \
--resume_from_checkpoint output/mix/qwen-1_8b-chat/v22-20240305-065252/checkpoint-11300 \
--dataset jd-sentiment-zh \
--custom_train_dataset_path /mnt/10101/staryea/aigc/modelscope_tuning/data/qwen_intent_data.jsonl \
--custom_val_dataset_path /mnt/10101/staryea/aigc/modelscope_tuning/data/qwen_intent_val_data.jsonl \
--lora_target_modules ALL 现在训练还是会出现某一个卡显存不够的情况，导致训练中止， ModelScope参数里面有没有可调的，能更节省显存？"

展开

收起

小小爱吃香菜 2024-03-12 17:31:30 23 0

1 条回答

写回答

取消提交回答

为了利利

"max_length限制一下 8192。此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

"

2024-03-12 20:28:37

赞同展开评论打赏

相关问答

modelscope-funasr推理时候解码的默认参数pt和onnx都是一样的吧？

3

1

0

ModelScope qwen2 7b instruct至少需要多少显存？

63

1

0

ModelScope修改了传入的model 参数为本地模型的绝对路径，但是不奏效，请问是参数不对吗？

4

1

0

ModelScope NPROC_PER_NODE，这个参数的意义是什么呢？

6

1

0

想问一下ModelScope多卡部署后，使用了多张卡的显存。是使用多张卡的GPU进行推理吗？

10

1

0

modelscope-funasr要微调paraformer的时候冻住一部分参数要怎么写？

26

1

0

modelscope-funasr显存占用多少呢？

9

0

0

通过torchaudio.load提前加载到显存里，但modelscope-funasr不认怎么办？

10

0

0

ModelScope的48G显存报溢出错误，怎么解决？

13

0

0

ModelScope中，报显存溢出问题怎么解决?

12

0

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

热门讨论

热门文章

最近大模型降价潮，哪家才是真的“价美”也“物美”？

com/action/joingroup?code=v1是什么意思

ModelScope中，模型下载默认路径在哪个路径？

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

无法导入 modelscope，已经pip install了

如何训练属于自己的“通义千问”呢？

ModelScope 使用14B模型推理时报这个错误？

docker和open-webui、ollama 部署本地的qwen2 14b 提供了API接口吗？

我希望通过damo-YOLO训练1500*1500的图片

请问ModelScope中，怎么修改本地运行，模型自动下载到 c 盘下？

展开全部

Llama 3开源！魔搭社区手把手带你推理，部署，微调和评估

阿里云通义千问向全社会开放！

Phi-3：小模型，大未来！（附魔搭社区推理、微调实战教程）

vanna+qwen实现私有模型的SQL转换

multi-agent：多角色Agent协同合作，高效完成复杂任务

ModelScope--人像卡通化、人像美肤

ChatGPT中文版杀疯了,已登录AI模型市场

万字长文 | 多目标跟踪最新综述（基于Transformer/图模型/检测和关联/孪生网络）（上）

自然语言处理Transformer模型最详细讲解（图解版）

LLM大模型实战 —— DB-GPT阿里云部署指南

展开全部

相关课程

更多

个性化语音合成模型微调

40

1

去学习

ModelScope社区Library技术架构介绍

174

1

去学习

相关电子书

更多

视觉AI能力的开放现状及ModelScope实战 立即下载

ModelScope助力语音AI模型创新与应用 立即下载

低代码开发师（初级）实战教程 立即下载