文档备案控制台

开发者社区 ModelScope模型即服务正文

qwen-vl-chat模型可以传入多张图片吗？

如下图中的红框位置，本人使用的是官方的demo代码，除了单张本地图片和图片url可以传入，可以传入【多张图片】进行图像识别吗？

展开

收起

游客euzbdslcvoev4 2023-11-26 12:52:43 2524 版权

2 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

Qwen-VL-Chat 模型目前并不支持一次处理多张图片的功能。
该模型仅支持一次处理一张图片，并且只能返回该图片的一份文本描述。如果您想同时处理多张图片，那么您需要多次调用该模型，并分别对每张图片进行处理。
当然，您也可以考虑自己编写一些自定义代码来处理这种情况。例如，您可以编写一段 Python 代码，将所有图片合并成一张大图，然后再将其传递给 Qwen-VL-Chat 模型进行处理。

2023-11-27 13:18:27

赞同展开评论
算精通

北京阿里云ACE会长

不可以。目前 qwen-vl-chat 模型不支持传入多张图片进行图像识别。根据官方文档，该模型仅支持传入单张本地图片或图片 URL。如果你需要进行多张图片的图像识别，

2023-11-26 18:15:29

赞同展开评论

相关问答

qwen3-asr-flash 模型的HTTP API接口不支持本地文件上传吗？

307

1

0

为什么现在连qwen3-coder 之类的模型都不能选了，就一个智能回答？

568

1

0

通义灵码2.5.16版本。没有deepseekR1模型了吗？

1163

4

0

vsCode今天更新之后,使用代码处的通义灵码一键修复,会自动变换模型

294

2

0

怎么使用vllm部署最新的qwen3的mbedding 和reranker模型呢

1059

0

0

用JAVA sdk调用qwen-omni-turbo模型，没有返回语音流，modalities已设置

264

2

0

千问模型写文案，有一定概率出现生成的文案缺少标点符号的情况

238

0

0

请问如何在微软的Autogen 0.4框架下使用Qwen模型实现工具调用？

1046

1

0

能否请大佬大佬在魔搭上上传一下 Citrus1.0-Qwen-72B模型

565

0

0

Qwen2.5-14B-Instruct-GPTQ-Int4量化模型是只能在GPU上运行吗？

592

0

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关文章

推荐一款可以简单快速部署开源AI模型的桌面软件 Doo AI

工程师思维看透人心？这个“集成框架”可能颠覆了个人成长领域

别再只依赖 ChatGPT 了：多模型协同，才是 AI 项目走向生产的关键一步

从统计相关性到结构性必然性：一个解决AI幻觉与对齐问题的框架探讨

Claude Code 源码泄露，升级 OpenClaw 的研究方案

热门讨论

热门文章

ModelScope这个是什么情况，打不开 notebook？

ModelScope中，模型下载默认路径在哪个路径？

ModelScope下载速度慢怎么解决？

ModelScope这个免费额度可以在哪里查询啊？

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

com/action/joingroup?code=v1是什么意思

在魔塔社区-模型服务里面一键部署的deepseek模型怎么使用？

如何下载modelscope模型？

我下载的gguf文件，最新的LMSTUDIO仍然无法识别什么问题

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

展开全部

高效部署通义万相Wan2.1：ComfyUI文生/图生视频实战，工作流直取！

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

Claude Cowork 支持第三方模型接入开放而不开源

Qwen3.6发布27B Dense模型，提供旗舰级编程能力，魔搭Serverless训练服务Day0支持

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

LTX-2.3开源：视频生成引擎级升级

阿里开源AI视频生成大模型 Wan2.1：14B性能超越Sora、Luma等模型，一键生成复杂运动视频

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

展开全部

还有其他疑问?