文档备案控制台

开发者社区 ModelScope模型即服务正文

ModelScope中，为啥gpu使用率上不去？

"

CUDA_VISIBLE_DEVICES=1 \
python llm_sft.py \
--model_type qwen1half-14b-chat \
--model_id_or_path /root/autodl-tmp/swift/Qwen1.5-14B-Chat\
--custom_train_dataset_path /root/autodl-tmp/swift/Processed_Dabby.jsonl\
--batch_size 64 \
--max_length 4096 \
--use_loss_scale true \
--gradient_accumulation_steps 2 \
--learning_rate 5e-5 \
--use_flash_attn true \
--eval_steps 2000 \
--save_steps 2000 \
--train_dataset_sample -1 \
--num_train_epochs 1 \
--check_dataset_strategy none \
--gradient_checkpointing true \
--weight_decay 0.1 \
--max_grad_norm 1.0 \
--warmup_ratio 0.03 \
--save_total_limit 2 \
--logging_steps 10 \
--use_flash_attn false \
--sft_type lora \
--lora_target_modules ALL \
--lora_rank 8 \
--lora_alpha 32 ModelScope中，为啥gpu使用率上不去？数据有200条，以上是运行脚本。"

展开

收起

小小爱吃香菜 2024-07-17 08:19:14 230 版权

1 条回答

写回答

取消提交回答

为了利利

--use_flash_attn true 单卡，CUDA_VISIBLE_DEVICES=0 此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-07-23 15:43:08

赞同展开评论

相关问答

modelscope-funasr怎么设置使得模型可以用CUDA0以外的其他gpu？

34141

1

0

modelscope-funasr服务端部署的话，推荐什么样的GPU？

358

0

0

在modelscope-funasr如果使用GPU的话这个编译需要改什么？

734

0

0

modelscope-funasr的GPU调用失败了，是什么原因？

248

0

0

modelscope-funasr能支持用gpu来做实时转写吗？

250

0

0

modelscope-funasr最新的gpu高吞吐服务用的模型和原来cpu的参数量是一样的么？

370

0

0

ModelScope中示例页面的GPU版本和CPU版本。这两个不同版本会影响推理效率吗？

298

1

0

在modelscope-funasr中funasr 中文实时的可以gpu部署吗？

338

0

0

ModelScope没有看见复制，模型选择、cpu/GPU选择有特别要求吗，有详细说明吗？

268

1

0

modelscope-funasr的gpu docker离线转写有dockerfile参考么？

262

0

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关文章

基于YOLOv11的工业轴承缺陷检测产线实时质检系统

Pydantic v2 入门教程：模型、字段、验证器

从 OpenClaw 到 Hermes Agent：安装、迁移、配置、实战演示

认知无线电频谱共享下的多用户分集模型MATLAB实现

2026年阿里云通义千问Qwen3.7-Plus全解析：功能、优势与618订阅方案

热门讨论

热门文章

modelscope 中，如何指定从ms下载模型以及指定下载路径？

我下载的gguf文件，最新的LMSTUDIO仍然无法识别什么问题

ModelScope中，模型下载默认路径在哪个路径？

ModelScope下载速度慢怎么解决？

modelscope cache 环境变量是啥？

com/action/joingroup?code=v1是什么意思

如何修改通义千问的system prompt，以修改自定义名字

modelscope-funasr的onnxruntime c++只能使用onnx结尾的模型吗？

问一下ModelScope AI能驱动数字人吗？

ModelScope哪里可以下到bge的embedding啊，我用来本地部署？

展开全部

高效部署通义万相Wan2.1：ComfyUI文生/图生视频实战，工作流直取！

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

阿里云通义千问向全社会开放！

美团开源发布 LongCat-Flash-Chat：专为高效智能体任务设计，推理速度超100 tokens/s

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

docker安装部署FunASR

在 AMD ROCm DSW 上跑通 DeepSeek-V4-Flash：vLLM 兼容部署、长上下文验证与 8K 性能扫参

Seedance vs Sora vs Kling：AI 视频生成模型深度对比

展开全部

还有其他疑问?