备案控制台

开发者社区 ModelScope模型即服务正文

ModelScope中，为啥gpu使用率上不去？

"

CUDA_VISIBLE_DEVICES=1 \
python llm_sft.py \
--model_type qwen1half-14b-chat \
--model_id_or_path /root/autodl-tmp/swift/Qwen1.5-14B-Chat\
--custom_train_dataset_path /root/autodl-tmp/swift/Processed_Dabby.jsonl\
--batch_size 64 \
--max_length 4096 \
--use_loss_scale true \
--gradient_accumulation_steps 2 \
--learning_rate 5e-5 \
--use_flash_attn true \
--eval_steps 2000 \
--save_steps 2000 \
--train_dataset_sample -1 \
--num_train_epochs 1 \
--check_dataset_strategy none \
--gradient_checkpointing true \
--weight_decay 0.1 \
--max_grad_norm 1.0 \
--warmup_ratio 0.03 \
--save_total_limit 2 \
--logging_steps 10 \
--use_flash_attn false \
--sft_type lora \
--lora_target_modules ALL \
--lora_rank 8 \
--lora_alpha 32 ModelScope中，为啥gpu使用率上不去？数据有200条，以上是运行脚本。"

展开

收起

小小爱吃香菜 2024-07-17 08:19:14 76 版权

1 条回答

写回答

取消提交回答

为了利利

--use_flash_attn true 单卡，CUDA_VISIBLE_DEVICES=0 此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-07-23 15:43:08

赞同展开评论

相关问答

modelscope-funasr怎么设置使得模型可以用CUDA0以外的其他gpu？

33911

1

0

modelscope-funasr服务端部署的话，推荐什么样的GPU？

183

0

0

在modelscope-funasr如果使用GPU的话这个编译需要改什么？

261

0

0

modelscope-funasr的GPU离线转写服务的说话人识别模块要怎么配置啊？

207

0

0

modelscope-funasr的 docker gpu1.1 容器中启动服务时，报这个是啥问题？

160

1

0

modelscope-funasr能支持用gpu来做实时转写吗？

129

0

0

modelscope-funasr最新的gpu高吞吐服务用的模型和原来cpu的参数量是一样的么？

153

0

0

modelscope-funasr最新的gpu高吞吐服务用的模型和原来cpu的是一样的么？

119

0

0

ModelScope中示例页面的GPU版本和CPU版本。这两个不同版本会影响推理效率吗？

166

1

0

在modelscope-funasr中funasr 中文实时的可以gpu部署吗？

194

0

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

相关文章

基于python的汽车数据可视化、推荐及预测系统

来自 Howland 2003 活动的机载多角度成像光谱仪 (AirMISR) 数据

ChatGPT与我们玩游戏_排雷

CMSIS-NN：ARM Cortex-M处理器的高效神经网络内核——论文解读

μNAS：面向微控制器的约束神经架构搜索——论文解读

热门讨论

热门文章

cpu部署报错 Torch not compiled with CUDA enabled

dataset的版本问题导致与modelscope不兼容

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，模型下载默认路径在哪个路径？

如何下载modelscope模型？

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

modelscope显示每天有2000次的API免费额度，在500次的时候，就提示限流了

ModelScope下载速度慢怎么解决？

com/action/joingroup?code=v1是什么意思

modelscope-funasr 热词如何设置？

展开全部

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

轻量高效，8B 性能强劲书生科学多模态模型Intern-S1-mini开源

Qwen-Image-Edit：全能图像编辑，驱动内容创作提质增效

FastAPI开发者福音！FastAPI-MCP：将FastAPI秒变MCP服务器的开源神器，无需配置自动转换！

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

InternVL3.5多模态大模型开源发布，1B-241B九种尺寸，支持跨平台GUI自动化与矢量图生成

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

【SpringBoot】OAuth 2.0 授权码模式 + JWT 令牌自动续签的终极落地指南，包含深度技术细节、生产环境配置、安全加固方案和全链路监控

基于Spring AI构建智能Text-to-SQL转换器：一个完整的MCP

魔搭社区模型速递（8.23-8.30）

展开全部

还有其他疑问?