modelscope中，加载量化模型，报错.加载 Qwen-1_8B-Chat 是正常？

swift app-ui --model_type qwen-7b-chat-int4 modelscope中，加载量化模型，报错.加载 Qwen-1_8B-Chat 是正常？

展开

收起

小小爱吃香菜 2024-04-09 18:07:31 466 版权

阿里云 AI 助理回答

根据您提供的问题，您在使用 swift app-ui --model_type qwen-7b-chat-int4 加载量化模型时遇到报错，而加载 Qwen-1_8B-Chat 模型时正常。以下是针对该问题的详细分析和解决建议：

1. 问题分析

从知识库中可以了解到，通义千问系列模型（如 Qwen-7B-Chat 和 Qwen-1_8B-Chat）支持多种量化版本（如 INT4、INT8 等），但不同模型的量化版本可能存在兼容性或配置要求上的差异。

Qwen-7B-Chat-Int4 是通义千问大模型系列的 70 亿参数规模的 INT4 量化版本，对应的模型路径为 modelscope://qwen/Qwen-7B-Chat-Int4。
Qwen-1_8B-Chat 是通义千问系列的较小规模模型，其加载正常可能是因为其量化版本与当前环境更兼容。

报错的原因可能包括以下几种情况： 1. 模型文件不完整或损坏：下载的 Qwen-7B-Chat-Int4 模型文件可能存在问题。 2. 硬件或软件环境不匹配：INT4 量化模型对硬件（如 CPU 或 GPU）和软件（如 PyTorch 版本、CUDA 驱动等）有特定要求。 3. 命令参数错误：swift app-ui 命令可能未正确指定模型路径或量化类型。

2. 解决步骤

步骤 1：检查模型文件完整性

确保 Qwen-7B-Chat-Int4 模型文件已正确下载且无损坏。可以通过以下方式验证： - 使用 ModelScope 提供的 snapshot_download 方法重新下载模型文件：

python3 download_from_modelscope.py -model_name Qwen/Qwen-7B-Chat-Int4 -version v1.1.7

替换 -version 参数为实际需要的版本号。

步骤 2：验证硬件和软件环境

INT4 量化模型对运行环境有较高要求，需确保以下条件满足： - 硬件要求： - 至少 30 GiB 内存（推荐 64 GiB）。 - 支持 AVX512 指令集的 Intel CPU 或 NVIDIA GPU（如 A100、V100）。 - 软件要求： - 安装最新版本的 PyTorch 和 CUDA（如果使用 GPU）。 - 确保安装了支持 INT4 量化的深度学习框架（如 BigDL-LLM 或 DeepGPU-LLM）。

步骤 3：调整命令参数

在运行 swift app-ui 命令时，确保正确指定了模型路径和量化类型。例如：

swift app-ui --model_type qwen-7b-chat-int4 --model_path modelscope://qwen/Qwen-7B-Chat-Int4

如果仍然报错，可以尝试手动加载模型并测试推理功能，以排除命令工具本身的问题。

步骤 4：尝试其他量化版本

如果 INT4 量化版本无法正常加载，可以尝试使用其他量化版本（如 INT8 或 FP16）。例如： - 下载 Qwen-7B-Chat 的 INT8 量化版本：

python3 download_from_modelscope.py -model_name Qwen/Qwen-7B-Chat-Int8 -version v1.1.7

修改命令参数为：

swift app-ui --model_type qwen-7b-chat-int8 --model_path modelscope://qwen/Qwen-7B-Chat-Int8

步骤 5：查看日志并定位问题

如果上述步骤仍无法解决问题，请查看报错日志，重点关注以下信息： - 是否提示缺少依赖库或驱动。 - 是否提示模型文件路径错误。 - 是否提示硬件不支持 INT4 量化。

3. 重要提醒

模型授权：Qwen-7B-Chat 的代码依照 LICENSE 开源，免费商用需填写商业授权申请。请确保遵守相关协议和法律法规。
环境兼容性：INT4 量化模型对硬件和软件环境要求较高，建议优先使用阿里云推荐的 ECS 实例（如 ecs.g8i.4xlarge）和镜像（如 Alibaba Cloud Linux 3.2104 LTS）。