modelscope的Qwen 系列 有没有支持的芯片列表?
根据提供的知识库资料,以下是关于ModelScope的Qwen系列支持的芯片列表及相关信息的详细解答:
Qwen系列大模型镜像在部署时对芯片的支持有明确的要求,主要分为CPU和GPU两种类型:
Qwen系列大模型镜像分为「运行环境镜像」和「一键部署镜像」,两者均支持CPU和GPU部署,但对GPU的支持有特定限制:
optimum
、auto-gptq
、flash-attn
),能够高效运行Qwen系列大模型。根据具体模型的大小和复杂度,推荐的硬件配置如下:
模型 | 推荐芯片类型 | 最低显存要求 |
---|---|---|
Qwen-Chat-7B | GPU(Ampere架构) | Tesla 16GB |
Qwen 1.8-72B | GPU(Ampere架构) | Ada 48GB |
optimum
、auto-gptq
等库,支持量化模型的高效推理。通过以上信息,您可以根据实际需求选择合适的芯片类型和硬件配置来部署Qwen系列模型。
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352