备案控制台

开发者社区 ModelScope模型即服务正文

运行Chatglm2-6b-int4出错

我用的程序是：

from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("ZhipuAI/chatglm2-6b-int4", trust_remote_code=True)
model = AutoModel.from_pretrained("ZhipuAI/chatglm2-6b-int4", trust_remote_code=True).cuda()
model = model.eval()
response, history = model.chat(tokenizer, "你好", history=[])
response, history = model.chat(tokenizer, "晚上睡不着应该怎么办", history=history)
print(response)

出的错误是：

File ~/.cache/huggingface/modules/transformers_modules/chatglm2-6b-int4/quantization.py:287, in extract_weight_to_half(weight, scale_list, source_bit_width)
285 func = kernels.int8WeightExtractionHalf
286 elif source_bit_width == 4:
--> 287 func = kernels.int4WeightExtractionHalf
288 else:
289 assert False, "Unsupported bit-width"

AttributeError: 'NoneType' object has no attribute 'int4WeightExtractionHalf'

展开

收起

chatglm2-6b-int4

alicl 2023-08-07 20:47:05 404 版权

1 条回答

写回答

取消提交回答

tbjoyzazjyfru

同问题，请问解决了嘛？

2023-09-05 14:03:03

赞同展开评论

相关问答

Qwen2.5-14B-Instruct-GPTQ-Int4量化模型是只能在GPU上运行吗？

260

0

0

ModelScope中，请问这边在运行14B-Chat-Int4z这个示例的时候没有获得正确结果？

102

2

0

modelscope中，16g显存的显卡不知道能不能运行，想问怎么设置成int8量化？

143

1

0

modelscope-funasr在运行 7B chat int4模型时报的错，咋解决？

100

0

0

modelscope我在运行 7B chat int4模型时报的错麻烦给看一下什么问题？

68

1

0

ModelScope中，请问Qwen-14B-Chat-Int4运行最少需要多少内存？

2603

2

0

服务器上运行Qwen-7B-Chat-Int4报错？

240

1

0

go程序运行报错type *int in argument to demo

937

1

0

go程序运行报错cannot use []int literal (type []int)

1641

1

0

UDAF实际调用时传入int类型，定义时是long类型，运行时报参数不匹配，int不能转成long类型吗？发现Flink-SQL在编写的时候需要写很多的CAST

3111

2

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

相关文章

Java Stream API：现代数据处理之道

矩形隧道中MIMO信道特性的模态理论解释——论文解读

【动态多目标优化算法】基于自适应启动策略的混合交叉动态约束多目标优化算法(MC-DCMOEA)求解CEC2018研究（Matlab代码实现）

基于二进制粒子群优化(BPSO)最佳PMU位置(OPP)配置研究（Matlab代码实现）

基于串行并行ADMM算法的主从配电网分布式优化控制研究（Matlab代码实现）

热门讨论

热门文章

cpu部署报错 Torch not compiled with CUDA enabled

ModelScope中，模型下载默认路径在哪个路径？

我希望通过damo-YOLO训练1500*1500的图片

怎么基于ModelScope-Agent搭建一个很简单的智能体？

dataset的版本问题导致与modelscope不兼容

ModelScope下载速度慢怎么解决？

资源部署与调用相关技术咨询

com/action/joingroup?code=v1是什么意思

普通轻薄本能跑哪些多模态大模型

如何知道ModelScope的 flash-attn 正常运行？

展开全部

通义DeepResearch全面开源！同步分享可落地的高阶Agent构建方法论

蛋白质语言模型 ProGen：在实验室合成由 AI 预测的蛋白质

Wan2.2再次开源数字人：Animate-14B！一键实现电影角色替换和动作驱动

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

Qwen3-Next：迈向更极致的训练推理性价比

B站开源IndexTTS2，用极致表现力颠覆听觉体验

一文读懂“大语言模型”

FastAPI开发者福音！FastAPI-MCP：将FastAPI秒变MCP服务器的开源神器，无需配置自动转换！

Memobase：开源AI长期记忆系统，让AI真正记住每个用户的秘密武器

展开全部

还有其他疑问?