modelscope CPU跑chatglm有什么加速的方法嘛?
可以试试ollama,用这个gguf的 Q4_K版本应该能试试
https://www.modelscope.cn/models/llm-research/glm-4-9b-chat-gguf/files 此回答整理自钉钉群“魔搭ModelScope开发者联盟群 ①”
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352