在mac笔记本下LM studio部署Qwen3.5 9B模型响应很慢

在mac笔记本下LM studio部署Qwen3.5 9B模型响应很慢,笔记本是mac3 max ,48G,模型是QWEN3.5-9B-Q8.gguf.
首先GUP的配置是32,上不到99,上下文长度4096,问个你好,大概要20秒中左右回复,具体运行情况与一些配置,系统调用情况见下图,怎么解决?截屏2026-04-12 15.20.26.png
截屏2026-04-12 15.22.52.png
截屏2026-04-12 15.23.33.png
截屏2026-04-12 15.23.50.png
截屏2026-04-12 15.24.16.png
截屏2026-04-12 15.21.22.png

展开
收起
1449597056053349 2026-04-12 15:39:23 69 分享 版权
0 条回答
写回答
取消 提交回答

阿里云自主研发的千问大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

还有其他疑问?
咨询AI助理