目前我不知道那个模型可以实现多张图片对比的功能?能否给一些建议?
我现在正在下载MiniCPM-V-2,他好像只能传单张图片?
也不知道能不能实现我要的效果
我是个新手,求帮助
根据您的需求,您希望找到一个能够实现多张图片对比功能的模型。以下是基于知识库资料的详细解答和建议:
在阿里云百炼平台中,以下模型支持多张图片输入,并可以对图片内容进行分析和描述,可能满足您的需求:
您提到正在尝试使用 MiniCPM-V-2,但发现它只能处理单张图片。根据目前的知识库资料,MiniCPM-V-2 确实是一个专注于单图处理的模型,主要用于图片内容的理解和生成描述。如果您需要实现多张图片的对比功能,MiniCPM-V-2 可能无法直接满足需求。
如果您希望通过上述模型实现多张图片对比功能,可以参考以下步骤:
示例代码(Python):
import os
import dashscope
messages = [
{
"role": "system",
"content": [{"text": "You are a helpful assistant."}]
},
{
"role": "user",
"content": [
{"image": "图片1的URL"},
{"image": "图片2的URL"},
{"text": "这两张图片有什么不同?"}
]
}
]
response = dashscope.MultiModalConversation.call(
api_key=os.getenv('DASHSCOPE_API_KEY'),
model='qwen-vl-max-latest',
messages=messages
)
print(response.output.choices[0].message.content[0]["text"])
vl_high_resolution_images=True来提升单张图片的Token上限至16384。希望以上信息对您有所帮助!如果有其他疑问,欢迎随时提问。
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352