modelscope中关于用swift对LLM量化时,参数的含义咨询

https://modelscope.cn/docs/LLM%E9%87%8F%E5%8C%96%E6%96%87%E6%A1%A3 链接中对原始模型量化,类似这样的命令:

CUDA_VISIBLE_DEVICES=0 swift export \
    --model_type qwen1half-7b-chat --quant_bits 4 \
    --dataset alpaca-zh alpaca-en sharegpt-gpt4:default --quant_method awq

想给各专家了解下如下几个问题:
1、命令中的model_type取值都有哪些呢?怎么去确定这个取值
2、如果模型已经下载到本地,是不是有其他参数可以指定(swift 没找到查看相关选项,命令的操作)
3、在该文档中所有操作涉及到的--model_type含义都是一养的吗?比如推理

展开
收起
沉寂-风 2024-07-04 16:52:57 124 发布于广东 分享
分享
版权
举报
1 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    image.png

    image.png

    详细的信息这里可以看到,源码

    https://github.com/modelscope/swift

    quant_bits:指定量化的位数,量化可以减少模型的精度,以换取更快的推理速度和更小的模型大小。

    dataset:指定用于模型训练或评估的数据集。

    2024-07-07 07:59:35 举报
    赞同 7 展开评论

    评论

阿里云自主研发的通义大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

还有其他疑问?
咨询AI助理
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等