文档备案控制台

开发者社区千问大模型正文

modelscope中关于用swift对LLM量化时，参数的含义咨询

https://modelscope.cn/docs/LLM%E9%87%8F%E5%8C%96%E6%96%87%E6%A1%A3 链接中对原始模型量化，类似这样的命令：

CUDA_VISIBLE_DEVICES=0 swift export \
    --model_type qwen1half-7b-chat --quant_bits 4 \
    --dataset alpaca-zh alpaca-en sharegpt-gpt4:default --quant_method awq

想给各专家了解下如下几个问题：
1、命令中的model_type取值都有哪些呢？怎么去确定这个取值
2、如果模型已经下载到本地，是不是有其他参数可以指定(swift 没找到查看相关选项，命令的操作)
3、在该文档中所有操作涉及到的--model_type含义都是一养的吗？比如推理

展开

收起

沉寂-风 2024-07-04 16:52:57 347 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

详细的信息这里可以看到，源码

https://github.com/modelscope/swift

quant_bits：指定量化的位数，量化可以减少模型的精度，以换取更快的推理速度和更小的模型大小。

dataset：指定用于模型训练或评估的数据集。

2024-07-07 07:59:35

赞同 8 展开评论

问答分类：

Swift 大模型服务平台百炼

问答标签：

LLM量化 LLM参数 Swift参数 modelscope参数 modelscope swift

问答地址：

开发者社区 > 千问大模型 > 问答

相关问答

modelscope-funasr这个量化模型在哪里下载？

311

0

0

modelscope-funasr够支持直接在automodel类使用附加vad模型的参数吗？

324

0

0

modelscope-funasr设置这个单位长度是什么参数？

485

1

0

ModelScope中，微调参数里面有可能会导致模型回复中断的参数或者是数据里面没有长文本的数据？

236

1

0

ModelScope有没有switf微调框架，所有参数设置的说明？

210

1

0

ModelScope中， llm生成的图谱如何修改和测试呢？

167

0

0

ModelScope微调qwen2不同参数的模型，分别需要的最低硬件要求是多少？

313

1

0

ModelScope中，使用SWIFT的进行sft报错，这是要升级驱动？

296

1

0

modelscope的swift昨天部署还是正常运行的，今天重启电脑后就一直报错如下错误，怎么解决？

155

1

0

在A10 24G显存下执行下面微调demo，会内存溢出，是什么原因？

181

1

0

千问大模型

阿里云自主研发的千问大模型，凭借万亿级超大规模数据训练和领先的算法框架，实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

我要提问

相关文章

AI不稳定不是工程Bug，是一场系统性误读——意图共鸣科技行业洞察

医疗AI智能体：整体效能评估可视化：从原理到实践的10大核心量化指标体系.130

Meta AI眼镜百万销量：AI硬件的iPhone时刻到了？

深度了解千问Qwen3.7-Max 阿里云百炼旗舰模型能力特点与计费订阅方案参考

AI时代，大学生应该提前准备什么？

热门讨论

热门文章

部署好了OPen-webui，接下来需要做什么？

如何修改通义千问的system prompt，以修改自定义名字

发送excel文件，在钉钉上打开报错误。OfficeImportErrorDomain错误912

调用百炼做的agent，API显示401问题，具体如图，请问各位原因是什么啊？

如何结合Dify和亮数据网页抓取API来搭建自动化爬虫工作流？

谷歌浏览器访问 https://tongyi.aliyun.com/，发出提问之后，无法出现响应回答

如何在claude code上调用mcp实现自动化数据采集？

大模型的token是怎么计算的？

如何训练属于自己的“通义千问”呢？

jetbrain IDE 无法正常安装 TONGYI Lingma plugin

展开全部

阿里云百炼Qwen3.7-Max简介：能力、优势、支持订阅计划参考

2026年智能体（Agent）怎么学？从入门到实战的全景避坑指南

【完全免费】VS Code 最好用的 12 款 AI 代码提示插件！！！

阿里云百炼千问Qwen3.7-Max全面解析：核心能力、技术特性与订阅使用全指南

Claude Code 快速上手指南（新手友好版）

Claude Code 官方工作原理与使用指南

阿里云千问大模型是什么？阿里云千问大模型全解析：核心功能、价格配置与使用方法详解

阿里云Qwen3.6-27B是什么？阿里云Qwen3.6-27B 解析：稠密架构、百万上下文与企业级部署

阿里云Qwen3.6 MoE大模型全新开源详解：模型特性、ECS/ACS/计算巢部署流程、vLLM配置与代码调用全教程

MNN × Qwen 实战：离线运行大模型的正确姿势

展开全部

还有其他疑问?