文档备案控制台

开发者社区问答正文

Qwen2-72B-Instruct的推理服务运行对服务器资源的要求比Qwen2-72B更高吗？

Qwen2-72B-Instruct的推理服务运行对服务器资源的要求比Qwen2-72B更高吗？

展开

收起

河水流流 2024-08-17 17:57:38 1020 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

八月八
作为Qwen2-72B-Instruct相较于Qwen2-72B模型配置要求确实更高，

在阿里云部分大语言模型的微调、评测与部署实践文档与人工智能API控制台中都有提到相关配置，在人工智能API控制台的具体要求是：
Qwen2-72B-Instruct部署机型选择
1. 模型支持单机多卡推理，
2. 需要的最低卡型配置：GPU显存160G，两卡A100（80G），
3. 推荐部署机型：8卡V100（gn6e）。
如果您的输入token（包含您设定的历史对话）较长，可能需要更大显存的机器进行支持

Qwen2-72B部署机型选择
1. 模型支持单机多卡推理，
2. 需要的最低卡型配置：GPU显存16G，单卡P100、单卡T4、单卡V100（gn6v），
3. 推荐部署机型：单卡GU30、单卡A10。
2024-08-17 23:20:32

赞同展开评论

问答标签：

运行云服务器 ECS qwen云服务器 ECS 服务云服务器 ECS 云服务器 ECS qwen 服务运行云服务器 ECS

问答地址：

开发者社区 > 云计算 > 问答

相关问答

千问Qwen3 32B大模型部署需要什么配置的GPU服务器？

3180

1

0

通义灵码IDE 运行终端命令非常慢！

1249

1

0

千问Qwen3 14B大模型部署最低配置GPU服务器要求？

2653

1

0

Qwen3 32B,14B,8B大模型部署分别需要多少显存，GPU服务器如何选？

6961

1

0

千问大模型Qwen3-8B、4B、32B、235B、0.6B参数含义，需要什么配置的服务器部署？

2534

1

0

阿里云训练大模型的服务器类型选择建议？

489

1

0

大模型项目服务器系统选ubuntu 22.04还是24.04？

395

1

0

完全无法连接互联网的情况下，如何在vscode中登录通义灵码并远程链接到内网超算服务器上的大模型？

467

1

0

在GPU服务器上使用魔搭部署deepseek70b大模型时，有一个文件出现校验之类的错误？

435

0

0

在4卡4090（24G）服务器上利用modelscope离线部署Qwen2vl-Flux时报错

523

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

qoderWorkCn什么时候才能接入阿里云-百炼平台的token plan,自家套餐都没接入

程序员群体，大家都在用什么code plan方案？还有用的什么编码智能体？

QoderCN Jetbrains插件存在EDT反模式

你们能不能简化点购买什么的，一会qoder官网，一会进阿里云。想续费，点了一会来回跳。。。。

什么时候支持本地模型呢？

相关解决方案

更多

一键训练模型及部署GPU共享推理服务

通义灵码一站式定制专属MCP服务

千问与 LangChain 搭建对话服务

对话分析，让服务更懂客户

高效构建全球网络服务性能观测体系

还有其他疑问?