modelscope的Qwen 系列 有没有支持的芯片列表?

modelscope的Qwen 系列 有没有支持的芯片列表?

展开
收起
小小爱吃香菜 2024-04-23 21:50:20 45 分享 版权
阿里云 AI 助理回答

根据提供的知识库资料,以下是关于ModelScope的Qwen系列支持的芯片列表及相关信息的详细解答:

支持的芯片类型

Qwen系列大模型镜像在部署时对芯片的支持有明确的要求,主要分为CPUGPU两种类型:

1. CPU支持

  • 适用场景:适用于无GPU需求的环境。
  • 运行要求:对驱动无特殊要求,适合资源有限或不需要高性能计算的场景。

2. GPU支持

  • 适用场景:适用于需要高性能计算的场景,尤其是大模型推理和训练任务。
  • 支持的GPU架构
    • Ampere架构(如A10):完全支持。
    • 不支持的GPU架构
    • Turing架构(如T4)
    • Volta架构(如V100)
    • Pascal架构(如P100、P4)
  • 驱动要求:需要NVIDIA驱动版本 >= 530,并兼容R470和R525驱动。

镜像类型与芯片适配

Qwen系列大模型镜像分为「运行环境镜像」和「一键部署镜像」,两者均支持CPU和GPU部署,但对GPU的支持有特定限制:

1. 运行环境镜像

  • GPU版本
    • 预装了支持量化模型的依赖库(如optimumauto-gptqflash-attn),能够高效运行Qwen系列大模型。
    • 需要CUDA 12.1.1支持,且仅兼容Ampere架构的GPU。
  • CPU版本
    • 不依赖GPU,适合轻量级任务。

2. 一键部署镜像

  • 继承自运行环境镜像,额外包含启动脚本和Web Demo脚本,便于快速部署。
  • 对GPU的支持要求与运行环境镜像一致。

模型与硬件配置建议

根据具体模型的大小和复杂度,推荐的硬件配置如下:

模型推荐芯片类型最低显存要求
Qwen-Chat-7BGPU(Ampere架构)Tesla 16GB
Qwen 1.8-72BGPU(Ampere架构)Ada 48GB
  • 小模型(如Qwen-Chat-7B):推荐使用Tesla系列GPU,显存至少16GB。
  • 大模型(如Qwen 1.8-72B):推荐使用Ada系列GPU,显存至少48GB。

重要提醒

  • 不支持的GPU架构:Turing(T4)、Volta(V100)、Pascal(P100、P4)等架构的GPU无法运行Qwen系列镜像,请确保硬件符合要求。
  • 驱动版本要求:GPU部署时需安装NVIDIA驱动 >= 530,否则可能导致镜像无法正常运行。
  • 量化模型支持:GPU镜像预装了optimumauto-gptq等库,支持量化模型的高效推理。

通过以上信息,您可以根据实际需求选择合适的芯片类型和硬件配置来部署Qwen系列模型。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

热门讨论

热门文章

还有其他疑问?
咨询AI助理