文档备案控制台

开发者社区问答正文

Qwen2-72B-Instruct的推理服务运行对服务器资源的要求比Qwen2-72B更高吗？

Qwen2-72B-Instruct的推理服务运行对服务器资源的要求比Qwen2-72B更高吗？

展开

收起

河水流流 2024-08-17 17:57:38 1008 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

八月八
作为Qwen2-72B-Instruct相较于Qwen2-72B模型配置要求确实更高，

在阿里云部分大语言模型的微调、评测与部署实践文档与人工智能API控制台中都有提到相关配置，在人工智能API控制台的具体要求是：
Qwen2-72B-Instruct部署机型选择
1. 模型支持单机多卡推理，
2. 需要的最低卡型配置：GPU显存160G，两卡A100（80G），
3. 推荐部署机型：8卡V100（gn6e）。
如果您的输入token（包含您设定的历史对话）较长，可能需要更大显存的机器进行支持

Qwen2-72B部署机型选择
1. 模型支持单机多卡推理，
2. 需要的最低卡型配置：GPU显存16G，单卡P100、单卡T4、单卡V100（gn6v），
3. 推荐部署机型：单卡GU30、单卡A10。
2024-08-17 23:20:32

赞同展开评论

问答标签：

运行云服务器 ECS 云服务器 ECS资源 qwen云服务器 ECS 服务云服务器 ECS 云服务器 ECS qwen

问答地址：

开发者社区 > 云计算 > 问答

相关问答

千问Qwen3 32B大模型部署需要什么配置的GPU服务器？

3111

1

0

通义灵码IDE 运行终端命令非常慢！

1230

1

0

千问Qwen3 14B大模型部署最低配置GPU服务器要求？

2599

1

0

Qwen3 32B,14B,8B大模型部署分别需要多少显存，GPU服务器如何选？

6817

1

0

千问大模型Qwen3-8B、4B、32B、235B、0.6B参数含义，需要什么配置的服务器部署？

2393

1

0

阿里云训练大模型的服务器类型选择建议？

462

1

0

大模型项目服务器系统选ubuntu 22.04还是24.04？

376

1

0

完全无法连接互联网的情况下，如何在vscode中登录通义灵码并远程链接到内网超算服务器上的大模型？

462

1

0

在GPU服务器上使用魔搭部署deepseek70b大模型时，有一个文件出现校验之类的错误？

417

0

0

在4卡4090（24G）服务器上利用modelscope离线部署Qwen2vl-Flux时报错

504

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

关于国际版和国内版客户端购买套餐问题

Pro试用版是只有300的Credits么？

Qoder REPO WIKI使用优化

idea qoder cn报错

qoder cn 积分为什么消耗这么快???

相关解决方案

更多

一键训练模型及部署GPU共享推理服务

通义灵码一站式定制专属MCP服务

千问与 LangChain 搭建对话服务

对话分析，让服务更懂客户

高效构建全球网络服务性能观测体系

还有其他疑问?