备案控制台

开发者社区 ModelScope模型即服务正文

ModelScope中运行7B模型，报错：[rank0]: ,怎么解决？

python -m vllm.entrypoints.openai.api_server --served-model-name Qwen2-7B-Instruct --model /modelscope_cache/hub/qwen/ModelScope中Qwen2-7B-Instruct ，运行7B模型，报错：[rank0]: ,怎么解决？ torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 1.16 GiB. GPU ，

展开

收起

小小爱吃香菜 2024-07-24 08:25:14 145 版权

1 条回答

写回答

取消提交回答

为了利利

python -m vllm.entrypoints.openai.api_server --served-model-name Qwen2-7B-Instruct --model /modelscope_cache/hub/qwen/Qwen2-7B-Instruct --dtype half --max_model_len 8192 看下显存够的话，max_model_len可以大一些。此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-07-24 16:32:15

赞同 2 展开评论

相关问答

通过modelscope环境搭建LLama Factory使用 WebUI微调训练，访问页面报错

582

1

0

modelscope官方docker镜像下载后在windows下如何运行

771

2

0

modelscope-funasr报错是什么原因？

115

1

0

modelscope-funasr运行这个命令是报错，怎么解决？

143

0

0

modelscope-funasr的sensevoice运行api时报的这个错该怎么解决？

174

1

0

在modelscope上git上这个语句报错，我是CPU版本，怎么回事？

140

1

0

ModelScope 用git 复制并上传一个已有的空间，可以发布。运行后出现以下问题，怎么处理？

125

1

0

在modelscope-funasr中本地运行文件是可以的，是什么原因造成的？

86

1

0

ModelScope创空间成功运行了，如何上传文档让其学习知识库？

103

1

0

modelscope-funasr运行官方示例代码还是报错了，怎么解决？

117

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

相关文章

Python装饰器：优雅地增强函数功能

Python装饰器：优雅增强函数功能

Python列表推导式：优雅与效率的完美结合

ASTER L2 表面反射 SWIR 和 ASTER L2 表面反射 VNIR V003

ASTER L2 表面温度 V003

热门讨论

热门文章

ModelScope下载速度慢怎么解决？

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，模型下载默认路径在哪个路径？

dataset的版本问题导致与modelscope不兼容

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

cpu部署报错 Torch not compiled with CUDA enabled

如何下载modelscope模型？

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

ModelScope中，大佬们4卡跑lora时，遇到这样的错，怎么解决？

调用Dashscope接口时报错

展开全部

92_自我反思提示：输出迭代优化

144_推理时延优化：Profiling与瓶颈分析 - 使用PyTorch Profiler诊断推理延迟，优化矩阵运算的独特瓶颈

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

通义DeepResearch全面开源！同步分享可落地的高阶Agent构建方法论

智谱旗舰模型GLM-4.6开源发布，代码能力对齐Claude Sonnet 4

45_混合专家模型：MoE架构详解

139_剪枝优化：稀疏模型压缩 - 分析结构化剪枝的独特速度提升与LLM部署加速实践

142_故障容错：冗余与回滚机制 - 配置多副本的独特健康检查

99_监督微调：Alpaca数据集格式与实现

展开全部

还有其他疑问?