千问最新图像基座模型,正式发布!

简介: 阿里巴巴发布Qwen-Image-2.0:全球领先的图文多模态模型,支持1K token长文本与2K高分辨率,集图像生成与编辑于一体,在AI Arena评测中生图/编辑分列全球第三、第二。中文文字渲染精准,已开放API邀测及Qwen Chat免费体验。

刚刚,阿里巴巴正式发布新一代图像生成及编辑模型Qwen-Image-2.0。该模型支持1K token的超长文字输入和2K高分辨率,可准确渲染复杂指令。

作为千问大模型的图像生成模型底座,Qwen-Image-2.0集生图和编辑于一体,在AI Arena文生图评测中斩获1029分,位列全球第三。

目前,阿里云百炼上已开通API邀测,开发者也可直接通过Qwen Chat(https://chat.qwen.ai/)免费体验新模型。

集图像生成与编辑于一体

Qwen-Image-2.0在Qwen-Image和Qwen-Image-Edit两大模型基础上全新升级,首次将图像生成和编辑统一到一个模型中去,以更轻量的模型架构,实现了生图和改图性能的大幅提升。

根据提供图片(图左)

生成一个九宫格带不同拍照姿势的组图(图右)

性能方面,在AI Arena评测中,Qwen-Image-2.0在图像生成中得分1029,位列第三;在图片编辑中得分1034,仅次于Nano Banana Pro。

输入提示词大幅拓展,可实现复杂任务

Qwen-Image-2.0将输入提示词扩展到1K token,可详尽描述任务,实现更专业的文字渲染,轻松拿捏专业PPT、高级海报、多格漫画等复杂图片。

比如以小楷字体几近完全渲染《兰亭集序》数百字的全文配图,以自然语言生成论文格式配图的复杂PPT等,根据超市环境生成现实风格的超市商品海报等。

文字渲染更优,生图应用场景更丰富

基于模型架构与性能的全新升级,Qwen-Image-2.0生图质感尤为细腻,小至老人皱纹的褶皱,大到浩然宇宙,模型生成的人物、自然、建筑等常用图片都极其逼真。

其中,在中文汉字渲染方面,Qwen-Image-2.0表现极为突出,不但可以以多种字体准确渲染汉字,而且写得又多又准,效果比 Nano Banana Pro更优。

同时,用户也可上传数张图片进行编辑,生成诸如九宫格多手势自拍、全景式人物图像拆解、多种创意风格造型,以及诗词配图等。

根据提供图片(图左)

生成全景式人物概念拆解(图右)

根据提供图片(图左1)

稳定生成不同创意风格图片(图左起2、3、4)

基于全新的Qwen-Image-2.0模型,用户还可与AI协同创作出更丰富、更实用的图片。

比如一句话生成杭州两日旅游攻略图,写实风格的商品海报,极为逼真的绿色丛林,4x6的多格漫画组图,儿童绘本图等。

/ END /



来源  |  阿里云公众号

相关文章
阿里发布 Qwen-Image-2.0,实测复杂插画生成,手绘细节还原度很高!
阿里千问Qwen-Image-2.0刚发布即实测!我们用其生成视频封面,精准还原“手绘风格+颜色编码+精细布局”。提示词含标题、图标、配色与排版要求,效果惊艳。现可通过chat.qwen.ai免费体验!
|
24天前
|
人工智能 自然语言处理 前端开发
借助 AI Coding 快速打造 AI Agent 系统
本项目构建了基于LangGraph的购物场景生成AI Agent,通过Agent Skills模块化技能、Planner智能规划及A2A+MCP标准化协议,实现从自然语言一键生成结构化场景、智能匹配商品并对接会场搭建。借助AI Coding工具,数天内完成低代码到高扩展架构的跃迁,显著提升运营效率与系统可靠性。
借助 AI Coding 快速打造 AI Agent 系统
|
23天前
|
存储 人工智能 Docker
OpenClaw进化指南:阿里云+Windows本地部署+EvoMap自进化配置,让AI Agent学会自我成长
2026年是AI智能体的爆发元年,OpenClaw(原Clawdbot/Moltbot)凭借开源可控、全场景适配的特性成为现象级AI工具,但多数用户仍停留在“手动配置技能、重复调试问题”的初级阶段,殊不知通过EvoMap这个GitHub神器,能让OpenClaw实现**协议约束下的自主进化**——像人类一样复刻优质技能、自主优化能力,甚至形成独有的“数字人格”。
1415 8
|
23天前
|
人工智能 安全 Docker
OpenClaw(Clawdbot)Windows本地及阿里云上部署+12大热门场景自动化,小白零门槛上手
2026年,AI代理框架OpenClaw(原Clawdbot)凭借“全场景自动化+低门槛操作”成为现象级工具,能将工作、生活中的琐事一键自动化——从邮件管理、日程规划到智能家居控制、代码开发,无需复杂编程,通过自然语言指令即可实现。但多数用户卡在“部署配置”或“功能落地”环节,殊不知2026年阿里云部署已简化至10分钟完成,Windows本地搭建支持一键安装,搭配12个社区热门实战场景,零基础也能快速解锁全能力。
1124 6
|
23天前
|
运维 API 调度
中国企业级大模型市场,阿里千问占比32%位列第一!
沙利文报告指出,2025年下半年中国企业级大模型日均调用量达37.0万亿tokens,千问(Qwen)占比32.1%,近乎翻倍,稳居第一。企业应用动因转向提效降本,开源意愿显著增强,千问已开源400+模型,下载超10亿次,成全球第一开源大模型。
|
11天前
|
Arthas 人工智能 Java
我们做了比你更懂 Java 的 AI-Agent -- Arthas Agent
Arthas Agent 是基于阿里开源Java诊断工具Arthas的AI智能助手,支持自然语言提问,自动匹配排障技能、生成安全可控命令、循证推进并输出结构化报告,大幅降低线上问题定位门槛。
529 57
我们做了比你更懂 Java 的 AI-Agent -- Arthas Agent
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
Z-Image:冲击体验上限的下一代图像生成模型
通义实验室推出全新文生图模型Z-Image,以6B参数实现“快、稳、轻、准”突破。Turbo版本仅需8步亚秒级生成,支持16GB显存设备,中英双语理解与文字渲染尤为出色,真实感和美学表现媲美国际顶尖模型,被誉为“最值得关注的开源生图模型之一”。
4218 9
|
11天前
|
人工智能 自然语言处理 搜索推荐
做AI产品三年复盘,我看到的变与不变
本文以AI产品工程师视角,分“看自己、看行业、看世界”三部分,剖析AI巨变中不变的本质:人机协作需强化沟通力、工程判断力与责任担当;营销与金融正被生成式技术重塑;ClaudeCode等智能体虽形态演进,但“上下文(Context)”始终是决定效果的核心。
做AI产品三年复盘,我看到的变与不变
|
1月前
|
人工智能 开发者 API
阿里云百炼 Coding Plan 又双叒上新了!模型任选+首购 7.9/月,开发者速冲🚀
百炼Coding Plan春节升级!新增Qwen3.5-Plus等多款先进模型,Lite/Pro版新用户首月低至7.9元、39.9元,享2折起优惠;全面兼容Cursor、Claude Code等主流AI编程工具,订阅灵活,性价比超高!活动至4月1日。
|
23天前
|
存储 人工智能 网络安全
2026年OpenClaw/Clawdbot多Agent实战指南:阿里云+Windows部署,打造全功能AI智能体协作团队
2026年AI智能体进入规模化协作时代,OpenClaw(原Clawdbot)凭借原生多Agent支持、独立工作区隔离、灵活路由机制,成为搭建专属智能体团队的首选框架。不同于单智能体“全能但混乱”的痛点,多Agent架构通过“角色拆分、身份隔离、协作分工”,让每个智能体专注特定领域,彻底解决上下文污染、人设混乱、Token消耗过高的核心问题。
1391 3

热门文章

最新文章