文档备案控制台

开发者社区 ModelScope模型即服务正文

报错的都是oom，显存爆了，不用加哪些modelscope参数？

"CUDA_VISIBLE_DEVICES=2,3,4,5 swift export \
--model_type baichuan2-7b-chat \
--model_id_or_path /workspace/model/llm/baichuan2/Baichuan2-7B-Chat \
--quant_bits 4 \
--dataset ms-bench-mini \
--quant_method awq \
--tensor_parallel_size 4 \
--gpu_memory_utilization 0.6 \
--max_model_len 1024 \
--use_flash_attn True 报错的都是oom，显存爆了，不用加哪些modelscope参数？"

展开

收起

小小爱吃香菜 2024-05-25 20:39:28 664 版权

2 条回答

写回答

取消提交回答

为了利利

"参考以下图片
推理时爆显存可以设置-tensor_parallel_size 4 \
--gpu_memory_utilization 0.6 \
--max_model_len 1024 \参数。此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”"

2024-05-29 08:41:52

赞同展开评论
算精通

北京阿里云ACE会长

减小批量大小（Batch Size）：

如果命令中可以指定批量大小，尝试减小它。较小的批量大小会减少每次迭代的显存需求。
调整--quant_n_samples和--quant_seqlen：

对于AWQ量化，减小--quant_n_samples（默认值通常是256）和--quant_seqlen（默认值通常是2048）可以减少量化过程中的显存占用。

2024-05-26 08:00:52

赞同 2 展开评论

相关问答

llamaindex整合modelscope本地模型，启动报错

708

1

0

ModelScope 报显存不够如下图怎么解决？

440

1

0

modelscope这个报错呢怎么回事？在参数里加上encoding=utf-8，又会出现这个报错

266

1

0

modelscope-funasr执行sencevoice后报错怎么解决？

297

0

0

modelscope-funasr够支持直接在automodel类使用附加vad模型的参数吗？

345

0

0

在modelscope-funasr当音频文件超过一个小时后，显存溢出怎么解决？

375

1

0

modelscope-funasr设置这个单位长度是什么参数？

508

1

0

modelscope-funasr这个报错是什么问题？

209

1

0

modelscope里做了个简单的例子，出现报错怎么处理呀？

282

1

0

在modelscope-funasr中finetune.sh脚本，中间报错如何解决？

216

0

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关文章

2026年最新阿里云服务器租用收费价格：ECS、轻量、GPU云服务器活动价格参考

2026年阿里云GPU云服务器配置价格表及性能测评

大模型微调开源框架推荐

Xcode 26.4.1 (17E202) 发布 - Apple 平台 IDE

Xcode 26.5 (17F42) 发布 - Apple 平台 IDE

热门讨论

热门文章

下载ModelScope模型默认放在哪个目录下啊，可以指定目录吗？

ModelScope中，模型下载默认路径在哪个路径？

ModelScope下载速度慢怎么解决？

modelscope-funasr的onnxruntime c++只能使用onnx结尾的模型吗？

com/action/joingroup?code=v1是什么意思

在ModelScope中，这个下载文件是模型文件吗？存储路径能改吗？

cuda 是11.3，ModelScope的mmcv怎么安装？

ModelScope镜像地址是什么？

ModelScope免费额度完了，在哪里购买？

我下载的gguf文件，最新的LMSTUDIO仍然无法识别什么问题

展开全部

高效部署通义万相Wan2.1：ComfyUI文生/图生视频实战，工作流直取！

在魔搭使用ComfyUI，玩转AIGC

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

手把手教你捏一个自己的Agent

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践

video-subtitle-remover（VSR）--开源AI去字幕方案深度解析

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

展开全部

还有其他疑问?