开发者社区> 问答> 正文

Qwen2-72B-Instruct的推理服务运行对服务器资源的要求比Qwen2-72B更高吗?

Qwen2-72B-Instruct的推理服务运行对服务器资源的要求比Qwen2-72B更高吗?

展开
收起
河水流流 2024-08-17 17:57:38 34 0
1 条回答
写回答
取消 提交回答
  • 作为Qwen2-72B-Instruct相较于Qwen2-72B模型配置要求确实更高

    在阿里云部分大语言模型的微调、评测与部署实践文档与人工智能API控制台中都有提到相关配置,在人工智能API控制台的具体要求是:
    Qwen2-72B-Instruct部署机型选择

    1. 模型支持单机多卡推理,
    2. 需要的最低卡型配置:GPU显存160G,两卡A100(80G),
    3. 推荐部署机型:8卡V100(gn6e)。

    如果您的输入token(包含您设定的历史对话)较长,可能需要更大显存的机器进行支持

    Qwen2-72B部署机型选择

    1. 模型支持单机多卡推理,
    2. 需要的最低卡型配置:GPU显存16G,单卡P100、单卡T4、单卡V100(gn6v),
    3. 推荐部署机型:单卡GU30、单卡A10。
    2024-08-17 23:20:32
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
如何运维千台以上游戏云服务器 立即下载
网站/服务器取证 实践与挑战 立即下载
ECS计算与存储分离架构实践 立即下载