文档备案控制台

开发者社区 ModelScope模型即服务正文

部署ModelScope默认直接填满第一个GPU，导致内存溢出，这个有解决办法吗？

qwen/Qwen-72B-Chat部署ModelScope默认直接填满第一个GPU，导致内存溢出，这个有解决办法吗？

展开

收起

小小爱吃香菜 2024-04-24 08:20:41 195 版权

1 条回答

写回答

取消提交回答

为了利利

vllm 部署的话，有个参数可以设置，--tensor_parallel_size 此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-04-24 12:19:27

赞同展开评论

相关问答

modelscope-funasr在windows(cpu)上跑要多大的内存?

325

0

0

modelscope-funasr服务端部署的话，推荐什么样的GPU？

386

0

0

modelscope-funasr的语音情感识别，如何离线部署？

302

0

0

想请问下ModelScope里Vllm部署了qwen1.5-32B之后，它无限输出日志怎么解决？

638

0

0

在modelscope-funasr如果使用GPU的话这个编译需要改什么？

771

0

0

modelscope-funasr的GPU调用失败了，是什么原因？

271

0

0

modelscope-funasr的GPU离线转写服务的说话人识别模块要怎么配置啊？

424

0

0

modelscope-funasr的 docker gpu1.1 容器中启动服务时，报这个是啥问题？

359

1

0

modelscope-funasr能支持用gpu来做实时转写吗？

277

0

0

大佬，oracle单表增量同步时候源库服务器额外占用内存近2g，这不正常吧

763

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关文章

构建高可用大模型应用架构：大模型服务进程保活 + 全自动故障自愈实践.163

使用阿里云GPU服务器快速部署DeepSeek-V4-Pro模型：Chatbox可视化接入全流程

DeepSeek-V4-Pro快速接入教程：使用阿里云GPU服务器全流程

大模型服务隔离与舱壁模式：构建防过载、防独占高可用架构应用实践解析.164

【洛神公开课】第5期：AI网络白皮书-01数据采集篇

相关解决方案

更多

一键训练模型及部署GPU共享推理服务

快速部署DeepSeek-OCR

一键部署幻兽帕鲁游戏服务器

OpenAI 重磅开源，快速部署GPT-OSS模型

部署 Nginx 并通过 Ingress 暴露服务

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

com/action/joingroup?code=v1是什么意思

ModelScope镜像地址是什么？

ModelScope下载速度慢怎么解决？

modelscope-funasr的onnxruntime c++只能使用onnx结尾的模型吗？

cuda 是11.3，ModelScope的mmcv怎么安装？

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

ModelScope这个免费额度可以在哪里查询啊？

【DCT-Net人像卡通化】生成图像颜色诡异暗青色

modelscope cache 环境变量是啥？

展开全部

高效部署通义万相Wan2.1：ComfyUI文生/图生视频实战，工作流直取！

2026 最新Stable Diffusion 本地部署教程下载安装使用详细图解（含官网安装包）

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

Claude Code 四大定制机制完全指南：CLAUDE.md、Hooks、Skills、Subagents 怎么选怎么用

Seedance vs Sora vs Kling：AI 视频生成模型深度对比

docker安装部署FunASR

Hermes Agent：深度技术剖析报告

展开全部

还有其他疑问?