开发者社区阿里云百炼文章正文

QWEN-VL Plus 使用小记

2024-12-11 304 发布于山东

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

通义法睿合同智能审查，1个月8份合同免费体验

简介： 近期尝试使用Qwen VL Plus模型处理图像识别任务，以GIS专业背景选择了一张街景图片进行测试。体验上，API调用流畅，环境配置简单，且成本低廉，免费额度可支持约1,000张图片的处理。不过，模型在某些情况下会产生幻觉，如对仅含Google水印的街景图片错误地描述存在地名信息。此外，其文本描述风格多变，从轻松愉快到沉稳不一，有时甚至会拒绝回答。

最近在尝试使用image-text类型的LLM来判断图像。因为是GIS专业的，就随便找了一张街景。采用了Qwen VL Plus模型。

首先调用很丝滑。api配置很简单，环境配置很简单。
其次费用比较低。平均下来，一张图用了差不多1k token，这样的话，免费额度可以问1，000张。
但是回答的幻觉还是有的。

在街景图像中。只有google的水印。但是他描述了图片中有地名的存在……
文本描述能力上，文风多样。一会儿轻快愉悦。一会儿沉稳。甚至拒绝回答。

文章标签：

定位技术

数据安全/隐私保护

API

wsqstar

+关注

2文章

打赏

阿里云大数据Al技术

11月前

机器学习/深度学习人工智能算法

通义千问Qwen-72B-Chat大模型在PAI平台的微调实践

本文将以Qwen-72B-Chat为例，介绍如何在PAI平台的快速开始PAI-QuickStart和交互式建模工具PAI-DSW中高效微调千问大模型。

阿里云大数据Al技术

148989 88 102

迟遇

自然语言处理安全机器人

什么是Chat GPT3

随着 Chat GPT 技术的进一步发展，有几个关键方面值得关注。首先是模型的扩展和改进。尽管 Chat GPT 在生成对话方面取得了很大的进展，但仍然存在一些局限性。模型在处理复杂问题和多轮对话时可能存在困难，很容易陷入回答模棱两可或不相关的内容。因此，改进模型在上下文理解和对话逻辑方面的能力是很重要的。其次是对话的多模态处理。目前的 Chat GPT 模型主要基于文本输入和生成。然而，与人类对话经常伴随着语音、图像和其他非文本的元素不同，模型在多模态对话中的表现仍然较弱。因此，将多模态信息整合到 Chat GPT 中，使其能够更好地处理多媒体对话，将是一个有挑战性但有前景的方向。

迟遇

271 0 0

Star时光

11月前

监控 PyTorch 算法框架/工具

Qwen-VL怎么用自己的数据集微调

Star时光

1283 0 0

modelscope

2月前

机器学习/深度学习并行计算 API

Qwen2.5-1M: 支持100万Tokens上下文的开源Qwen模型

两个月前，Qwen团队升级了 Qwen2.5-Turbo，使其支持最多一百万个Tokens的上下文长度。今天，Qwen正式推出开源的 Qwen2.5-1M 模型及其对应的推理框架支持。

modelscope

499 28 29

技术内容小助手

2月前

机器学习/深度学习编解码 JSON

Qwen2.5-VL！Qwen2.5-VL！！Qwen2.5-VL！！！

技术内容小助手

240 0 1

不要葱姜蒜

4月前

搜索推荐物联网 PyTorch

Qwen2.5-7B-Instruct Lora 微调

本教程介绍如何基于Transformers和PEFT框架对Qwen2.5-7B-Instruct模型进行LoRA微调。

不要葱姜蒜

4314 34 41

modelscope

9天前

机器学习/深度学习文字识别测试技术

Qwen2.5-VL-32B: 更聪明、更轻量!

年前，阿里通义千问团队推出了 Qwen2.5-VL 系列模型，获得了社区的广泛关注和积极反馈。在 Qwen2.5-VL 系列的基础上，研究团队使用强化学习持续优化模型，并使用 Apache 2.0 协议开源 32B 这个备受喜爱的参数规模的新 VL 模型—— Qwen2.5-VL-32B-Instruct。相比此前发布的 Qwen2.5-VL 系列模型，本次推出的 32B 模型的特点如下：

modelscope

231 0 0

游客s67t3mdq4gcco

4月前

存储 JSON 安全

使用 Qwen 进行Self-instruct数据生成

使用Qwen进行自指令数据生成，通过Self-instruct技术自动化为大型语言模型生成指令。用户可安装CAMEL包并设置Qwen API密钥，配置ChatAgent和SelfInstructPipeline，基于种子指令迭代生成大量新指令。支持多种过滤器（如长度、关键词、标点符号等）确保生成指令的质量和多样性。欢迎加入Discord获取支持与交流。

游客s67t3mdq4gcco

223 8 8

aliyun4381607004

3月前

并行计算 PyTorch 算法框架/工具

阿里云PAI-部署Qwen2-VL-72B

阿里云PAI-部署Qwen2-VL-72B踩坑实录

aliyun4381607004

1391 1 2

aliyun7689123603-22772

4月前

人工智能自然语言处理算法

Qwen-Coder：通过Qwen 2.5模型实现智能代码生成的技术实践

aliyun7689123603-22772

735 17 17

阿里云百炼

+关注

QWEN-VL Plus 使用小记

阿里云百炼

热门文章

最新文章

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

QWEN-VL Plus 使用小记

阿里云百炼

热门文章

最新文章

相关电子书

相关实验场景