dashcope 中的视觉问答中的图像数据格式的支持

通过python的 sdk (dashscope)访问通义视觉模型(如 qwen-vl-plus), MultiModalConversation 类的消息参数(messages),其中 content支持图片问答,如果要上传图片,目前支持url方式或者本地文件(看代码本地文件是会先上传到 oss然后取得 url地址),是否有考虑支持 Image对象或者base64编码的图片数据?

目前很多的多模态处理库,都支持base64 编码的图片,比如 openai sdk,autogen 等。而且在很多情况下图片数据是通过各种方式获取的,比如直接获取的摄像头数据,如果能支持 Image对象或者base64编码的图片数据将会很有用。

展开
收起
1220302993610537 2024-05-30 23:14:28 166 分享 版权
1 条回答
写回答
取消 提交回答
  • 您好,辛苦您加入“阿里云百炼使用体验”群的钉钉群号: 65295003032,在钉钉群内反馈您的问题

    2024-06-21 14:55:11
    赞同 展开评论

基于通义系列大模型和开源大模型的一站式大模型服务平台,提供「生成式大模型的全流程应用工具」和「企业大模型的全链路训练工具」。为大模型,也为小应用。 阿里云百炼官网网址:https://www.aliyun.com/product/bailian

还有其他疑问?
咨询AI助理