备案控制台

开发者社区 ModelScope模型即服务正文

运行Chatglm2-6b-int4出错

我用的程序是：

from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("ZhipuAI/chatglm2-6b-int4", trust_remote_code=True)
model = AutoModel.from_pretrained("ZhipuAI/chatglm2-6b-int4", trust_remote_code=True).cuda()
model = model.eval()
response, history = model.chat(tokenizer, "你好", history=[])
response, history = model.chat(tokenizer, "晚上睡不着应该怎么办", history=history)
print(response)

出的错误是：

File ~/.cache/huggingface/modules/transformers_modules/chatglm2-6b-int4/quantization.py:287, in extract_weight_to_half(weight, scale_list, source_bit_width)
285 func = kernels.int8WeightExtractionHalf
286 elif source_bit_width == 4:
--> 287 func = kernels.int4WeightExtractionHalf
288 else:
289 assert False, "Unsupported bit-width"

AttributeError: 'NoneType' object has no attribute 'int4WeightExtractionHalf'

展开

收起

chatglm2-6b-int4

alicl 2023-08-07 20:47:05 454 版权

1 条回答

写回答

取消提交回答

tbjoyzazjyfru

同问题，请问解决了嘛？

2023-09-05 14:03:03

赞同展开评论

相关问答

ModelScope中，请问这边在运行14B-Chat-Int4z这个示例的时候没有获得正确结果？

148

2

0

Qwen2.5-14B-Instruct-GPTQ-Int4量化模型是只能在GPU上运行吗？

415

0

0

modelscope中，16g显存的显卡不知道能不能运行，想问怎么设置成int8量化？

166

1

0

modelscope-funasr在运行 7B chat int4模型时报的错，咋解决？

154

0

0

modelscope我在运行 7B chat int4模型时报的错麻烦给看一下什么问题？

86

1

0

ModelScope中，请问Qwen-14B-Chat-Int4运行最少需要多少内存？

2770

2

0

服务器上运行Qwen-7B-Chat-Int4报错？

274

1

0

go程序运行报错type *int in argument to demo

980

1

0

go程序运行报错cannot use []int literal (type []int)

1654

1

0

UDAF实际调用时传入int类型，定义时是long类型，运行时报参数不匹配，int不能转成long类型吗？发现Flink-SQL在编写的时候需要写很多的CAST

3263

2

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

相关文章

🚀 预训练技巧

预训练技巧

🚀 预训练技巧

ONNX Runtime Python 推理性能优化：8 个低延迟工程实践

H100 真的被封印了吗？我用 vLLM+FP8 把吞吐拉爆了

热门讨论

热门文章

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，模型下载默认路径在哪个路径？

ModelScope中apikey在哪申请？

dataset的版本问题导致与modelscope不兼容

ModelScope下载速度慢怎么解决？

如何下载modelscope模型？

在modelscope-funasr想自己训练一种low resource 的方言，有训练的方案吗？

com/action/joingroup?code=v1是什么意思

modelscope-funasr实时ASR的微调该怎么操作？

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

展开全部

中企投资印度新能源“有戏”吗？

Z-Image：冲击体验上限的下一代图像生成模型

Agent Skills技术协议与开源实现，让大模型拥有“即插即用”技能

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

共学 | 2025年，更加有效地搭建Agent

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

中文大模型体验

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Z-Image Turbo LoRA训练魔法：如何保持加速生图能力

阿里云通义千问向全社会开放！

展开全部

还有其他疑问?