备案控制台

开发者社区 ModelScope模型即服务正文

请问下我使用ModelScope vllm加载qwen1.5的模型，这哪里不太对呢？

请问下我使用ModelScope vllm加载qwen1.5的模型，不管我使用14B-chat还是7B-chat，显存都是72G，这哪里不太对呢？

展开

收起

夹心789 2024-06-09 08:25:17 166 版权

1 条回答

写回答

取消提交回答

芯在这

可以设置max_model_len，gpu_memory_utilization ，此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-06-11 09:33:42

赞同展开评论

相关问答

使用 dashscope-sdk-java 调用qwen3-max-preview模型回答问题，没有

43

0

0

ModelScope接口访问qwen-coder，报错409

114

0

0

加载Qwen/Qwen-7B-Chat模型报错

181

0

0

使用modelscope、Qwen1.8B-chat 模型推理时报错编码错误

124

0

0

怎么使用vllm部署最新的qwen3的mbedding 和reranker模型呢

742

0

0

百炼平台使用qwen-plus和qwen-max模型超时

391

2

0

请问如何在微软的Autogen 0.4框架下使用Qwen模型实现工具调用？

615

1

0

通义灵码能不能自定义LLM模型？

316

1

0

使用qwen-mt-turbo模型的openapi限流如何解除

296

0

0

modelscope微调后的多模态大模型Qwen-VL和graghrag相结合构建知识库的案例有嘛？

177

0

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

dataset的版本问题导致与modelscope不兼容

我希望通过damo-YOLO训练1500*1500的图片

ModelScope下载速度慢怎么解决？

ModelScope中，大佬们4卡跑lora时，遇到这样的错，怎么解决？

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

从modelscope下载模型失败，怎么回事？

如何下载modelscope模型？

com/action/joingroup?code=v1是什么意思

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

展开全部

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

万字长文深度解析最新Deep Research技术：前沿架构、核心技术与未来展望

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

Qwen3-VL再添丁！4B/8B Dense模型开源，更轻量，仍强大

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Open AI Model

【AI绘画】你有多久没有打开SD了？

Dolphin：40语种+22方言！清华联合海天瑞声推出的语音识别大模型，识别精度超Whisper两代

自然语言处理Transformer模型最详细讲解（图解版）

展开全部

还有其他疑问?