开发者社区 > ModelScope模型即服务 > 正文

qwen-vl-chat模型可以传入多张图片吗?

如下图中的红框位置,本人使用的是官方的demo代码,除了单张本地图片和图片url可以传入,可以传入【多张图片】进行图像识别吗?
image.png

展开
收起
游客euzbdslcvoev4 2023-11-26 12:52:43 488 0
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    Qwen-VL-Chat 模型目前并不支持一次处理多张图片的功能。
    该模型仅支持一次处理一张图片,并且只能返回该图片的一份文本描述。如果您想同时处理多张图片,那么您需要多次调用该模型,并分别对每张图片进行处理。
    当然,您也可以考虑自己编写一些自定义代码来处理这种情况。例如,您可以编写一段 Python 代码,将所有图片合并成一张大图,然后再将其传递给 Qwen-VL-Chat 模型进行处理。

    2023-11-27 13:18:27
    赞同 展开评论 打赏
  • 北京阿里云ACE会长

    不可以。目前 qwen-vl-chat 模型不支持传入多张图片进行图像识别。根据官方文档,该模型仅支持传入单张本地图片或图片 URL。如果你需要进行多张图片的图像识别,

    2023-11-26 18:15:29
    赞同 展开评论 打赏

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载