文档备案控制台

开发者社区 ModelScope模型即服务正文

关于Qwen3.5小模型的性能问题

我在自己的电脑上本地部署了Qwen3.5的几个小模型，在软件环境完全相同的，提出问题也相同的情况下，得到了如下的测试
结果：
第一次测试结果：
qwen3.5 0.8B 耗时 323.6914972 秒
qwen3.0 4B 耗时 216.2048938 秒
第二次测试结果：
qwen3.5 0.8b 耗时 113.0595229 秒
qwen3.0 4b 耗时 83.0959226 秒
其中第二次是在关闭思维链路以后得到的测试结果，可以看到耗时大幅缩减了。但是两次测试结果都是0.8b模型耗费的时间比4b模型耗费的时间要长很多。请问这是什么原因呢？有没有再进一步优化的可能？

展开

收起

游客si3rnjix7uwnk 2026-03-12 10:26:52 488 版权

1 条回答

写回答

取消提交回答

马Jack

给您推荐最划算最便宜的阿里云产品 https://www.aliyun.com/activity?userCode=m4a0ywsh

稳定不贵，不用写代码，分钟级部署OpenClaw
https://www.aliyun.com/activity/ecs/clawdbot?userCode=m4a0ywsh

2026-03-18 13:48:47

赞同 926 展开评论

相关问答

购买阿里国外的云服务器是否可以访问谷歌？

93344

50

0

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

142688

16

0

this xml file does not appear to have any style in

61732

11

0

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

285936

11

0

基础语言百问-Python

70078

30

0

C语言数组赋值报错，打印出来的是乱码，怎么解决？

1696

1

0

搭建dnf私服需要大概啥配置的

10757

2

0

阿里云怎样设置二级域名以及域名解析？

67004

14

0

#支付宝授权提示请在支付宝客户端打开链接

25330

19

0

C语言中default使用注意事项是什么？

1719

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关解决方案

更多

GLM-5.2：长任务时代开源旗舰模型

高效构建全球网络服务性能观测体系

实现 MySQL 到 ADB 秒级分析性能

基于 Spark 和 PyTorch 的模型训练方案

模型蒸馏：让0.6B模型媲美235B模型

热门讨论

热门文章

com/action/joingroup?code=v1是什么意思

ModelScope中，模型下载默认路径在哪个路径？

ModelScope下载速度慢怎么解决？

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

ModelScope这个免费额度可以在哪里查询啊？

IndexTTS 部署报错：No module named 'tn'

ModelScope免费额度完了，在哪里购买？

我下载的gguf文件，最新的LMSTUDIO仍然无法识别什么问题

modelscope-funasr的onnxruntime c++只能使用onnx结尾的模型吗？

在魔塔社区-模型服务里面一键部署的deepseek模型怎么使用？

展开全部

Gemini 3.5 Pro 泄露刷屏！前端一次成型赶超 Fable 5，7 月 17 日或将亮相

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

Claude Code 四大定制机制完全指南：CLAUDE.md、Hooks、Skills、Subagents 怎么选怎么用

Codex 完整避坑指南（2026 版）：沙箱、权限、AGENTS.md、Worktree 七类坑一次讲清

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

分层结构化决策对话智能体灵钥 V5.1 全新升级｜具备观点边界、关系感知的深度思辨 Agent，配套线上 Demo 与真实用户数据采集方案

高效部署通义万相Wan2.1：ComfyUI文生/图生视频实战，工作流直取！

展开全部

还有其他疑问?