备案控制台

开发者社区 ModelScope模型即服务正文

ModelScope有部署qwen2-72b的么，正常推理需要多大的显存？

请问一下，ModelScope有部署qwen2-72b的么，正常推理需要多大的显存？

展开

收起

小小爱吃香菜 2024-06-26 08:30:41 7713 版权

2 条回答

写回答

取消提交回答

aliyun7689123603-22772

进行正常的推理任务时，Qwen2-72B模型需要A100 GPU（具备80 GB显存）或更高配置的显卡支持。这意味着推理服务部署至少需要A100级别的显卡以满足其显存需求。

2024-07-13 20:12:22

赞同 147 展开评论
游客x55rk7ntoj37y

4张V100失败了我看hg上写：运行BF16或FP16模型需要多卡至少144GB显存（例如2xA100-80G或5xV100-32G）；运行Int4模型至少需要48GB显存（例如1xA100-80G或2xV100-32G）。

2024-06-26 16:35:46

赞同 161 展开评论

相关问答

千问Qwen3 32B大模型部署需要什么配置的GPU服务器？

1334

1

0

请问MNN支持在高通或者MTK平台上部署大模型吗？

156

0

0

千问Qwen3 14B大模型部署最低配置GPU服务器要求？

1179

1

0

Qwen3 32B,14B,8B大模型部署分别需要多少显存，GPU服务器如何选？

3541

1

0

千问大模型Qwen3-8B、4B、32B、235B、0.6B参数含义，需要什么配置的服务器部署？

864

1

0

部署大模型Qwen3 32B,14B,8B参数的大模型部署分别需要多少显存？

3358

1

0

阿里云部署DeepSeek 70B大模型配置推荐？

222

1

0

怎么使用vllm部署最新的qwen3的mbedding 和reranker模型呢

844

0

0

在GPU服务器上使用魔搭部署deepseek70b大模型时，有一个文件出现校验之类的错误？

225

0

0

在4卡4090（24G）服务器上利用modelscope离线部署Qwen2vl-Flux时报错

296

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

热门讨论

热门文章

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，模型下载默认路径在哪个路径？

ModelScope中apikey在哪申请？

dataset的版本问题导致与modelscope不兼容

ModelScope下载速度慢怎么解决？

com/action/joingroup?code=v1是什么意思

怎么搭建本地文生图工作流

关于 Windows平台上 ttsfrd 库的问题。

modelscope上跑报错，提示要pip install ttsfrd，搞不定

关于模型的下载，huggingface下载速度太慢，如何在modelscope快速下载？

展开全部

Z-Image：冲击体验上限的下一代图像生成模型

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

智谱开源GLM-ASR：动动嘴，活就干了

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

Meta SAM3开源：让图像分割，听懂你的话

一文读懂“大语言模型”

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

共学 | 2025年，更加有效地搭建Agent

Mobile-Agent：通过视觉感知实现自动化手机操作，支持多应用跨平台

展开全部

还有其他疑问?