文档备案控制台

开发者社区千问大模型正文

RTX5060Ti运行Qwen3-VL-8B-Instruct模型速度慢

RTX5060Ti16G使用的CUDA12.8+CUDNN9.8+Pytorch 2.11.dev，用的8B，运行一张640x480的简单图片，输出耗时54s

但是同样的图片，在RTX4060 12G使用的CUDA11.8+CUDNN9.6+Pytorch2.9，用的4B输出耗时只有4s。
专门测试了2B、4B、8B的5060Ti，基本都在40s以上。
图片是一张

但是未找到任何文字。

未曝出任何错误。

展开

收起

游客2s2fjn5luntxa 2025-12-16 16:55:14 805 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

0 条回答

写回答

取消提交回答

问答分类：

算法框架/工具 PyTorch 大模型服务平台百炼

问答地址：

开发者社区 > 千问大模型 > 问答

相关问答

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

288094

11

0

购买阿里国外的云服务器是否可以访问谷歌？

93860

50

0

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

143095

16

0

this xml file does not appear to have any style in

62183

11

0

基础语言百问-Python

70418

30

0

#支付宝授权提示请在支付宝客户端打开链接

25765

19

0

阿里云怎样设置二级域名以及域名解析？

67110

14

0

全息（Holography）技术是什么技术？

1407

1

0

搭建dnf私服需要大概啥配置的

10845

2

0

请问一下，PG表的id为序列，超过最大值了怎么办？ nextval: reached maximum

1665

1

0

千问大模型

阿里云自主研发的千问大模型，凭借万亿级超大规模数据训练和领先的算法框架，实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

我要提问

相关文章

广州网站制作-使用 rsync 命令实现多台 Web 服务器代码同步

【剪映小助手】保存草稿接口（Save Draft）

纯前端 AI 视频特效实践：在浏览器中完成实物识别与动态描边

最新版通义千问（Qwen3.7-Plus）功能介绍

阿里云百炼大模型平台全解：入口、免费额度领取与API调用实战

相关解决方案

更多

GLM-5.2：长任务时代开源旗舰模型

OpenAI 重磅开源，快速部署GPT-OSS模型

模型蒸馏：让0.6B模型媲美235B模型

基于 Spark 和 PyTorch 的模型训练方案

一键训练模型及部署GPU共享推理服务

热门讨论

热门文章

大模型的token是怎么计算的？

AI助理表单填报示例功能为什么没有？

调用百炼做的agent，API显示401问题，具体如图，请问各位原因是什么啊？

通义千问和Chatgpt分别的区别是什么？功能优势分别是什么？

请问为何创建应用时没有“通义千问”应用可以选择呢？

发送excel文件，在钉钉上打开报错误。OfficeImportErrorDomain错误912

使用qwen-mt-turbo模型的openapi限流如何解除

关于通义千问Qwen-7B-Chat模型下载后模型文件保存的目录的问题

通义听悟发布，大模型的接入如何让产品更聪明？

通义千问为什么会中断对话？

展开全部

最新版通义千问（Qwen3.8-Max-Preview）功能介绍

阿里云通义千问大模型最新功能介绍

最新版阿里云通义千问大模型功能介绍

最新版通义千问（Qwen3.7-Max）功能介绍

最新版通义千问（Qwen3.7-Max）功能介绍

最新版通义千问（Qwen3.8-Max-Preview）功能介绍

最新版通义千问（Qwen3.7-Max）功能介绍

最新版通义千问（Qwen3.7-Max）功能介绍

阿里云通义千问大模型介绍：核心功能、性能优势、行业落地场景与官方定价解析

2026 最新版通义千问付费版全功能介绍

展开全部

还有其他疑问?