千问最新图像基座模型,正式发布!

简介: 阿里巴巴发布Qwen-Image-2.0:全球领先的图文多模态模型,支持1K token长文本与2K高分辨率,集图像生成与编辑于一体,在AI Arena评测中生图/编辑分列全球第三、第二。中文文字渲染精准,已开放API邀测及Qwen Chat免费体验。

刚刚,阿里巴巴正式发布新一代图像生成及编辑模型Qwen-Image-2.0。该模型支持1K token的超长文字输入和2K高分辨率,可准确渲染复杂指令。

作为千问大模型的图像生成模型底座,Qwen-Image-2.0集生图和编辑于一体,在AI Arena文生图评测中斩获1029分,位列全球第三。

目前,阿里云百炼上已开通API邀测,开发者也可直接通过Qwen Chat(https://chat.qwen.ai/)免费体验新模型。

集图像生成与编辑于一体

Qwen-Image-2.0在Qwen-Image和Qwen-Image-Edit两大模型基础上全新升级,首次将图像生成和编辑统一到一个模型中去,以更轻量的模型架构,实现了生图和改图性能的大幅提升。

根据提供图片(图左)

生成一个九宫格带不同拍照姿势的组图(图右)

性能方面,在AI Arena评测中,Qwen-Image-2.0在图像生成中得分1029,位列第三;在图片编辑中得分1034,仅次于Nano Banana Pro。

输入提示词大幅拓展,可实现复杂任务

Qwen-Image-2.0将输入提示词扩展到1K token,可详尽描述任务,实现更专业的文字渲染,轻松拿捏专业PPT、高级海报、多格漫画等复杂图片。

比如以小楷字体几近完全渲染《兰亭集序》数百字的全文配图,以自然语言生成论文格式配图的复杂PPT等,根据超市环境生成现实风格的超市商品海报等。

文字渲染更优,生图应用场景更丰富

基于模型架构与性能的全新升级,Qwen-Image-2.0生图质感尤为细腻,小至老人皱纹的褶皱,大到浩然宇宙,模型生成的人物、自然、建筑等常用图片都极其逼真。

其中,在中文汉字渲染方面,Qwen-Image-2.0表现极为突出,不但可以以多种字体准确渲染汉字,而且写得又多又准,效果比 Nano Banana Pro更优。

同时,用户也可上传数张图片进行编辑,生成诸如九宫格多手势自拍、全景式人物图像拆解、多种创意风格造型,以及诗词配图等。

根据提供图片(图左)

生成全景式人物概念拆解(图右)

根据提供图片(图左1)

稳定生成不同创意风格图片(图左起2、3、4)

基于全新的Qwen-Image-2.0模型,用户还可与AI协同创作出更丰富、更实用的图片。

比如一句话生成杭州两日旅游攻略图,写实风格的商品海报,极为逼真的绿色丛林,4x6的多格漫画组图,儿童绘本图等。

/ END /



来源  |  阿里云公众号

相关文章
阿里发布 Qwen-Image-2.0,实测复杂插画生成,手绘细节还原度很高!
阿里千问Qwen-Image-2.0刚发布即实测!我们用其生成视频封面,精准还原“手绘风格+颜色编码+精细布局”。提示词含标题、图标、配色与排版要求,效果惊艳。现可通过chat.qwen.ai免费体验!
|
2月前
|
人工智能 自然语言处理 前端开发
借助 AI Coding 快速打造 AI Agent 系统
本项目构建了基于LangGraph的购物场景生成AI Agent,通过Agent Skills模块化技能、Planner智能规划及A2A+MCP标准化协议,实现从自然语言一键生成结构化场景、智能匹配商品并对接会场搭建。借助AI Coding工具,数天内完成低代码到高扩展架构的跃迁,显著提升运营效率与系统可靠性。
借助 AI Coding 快速打造 AI Agent 系统
|
2月前
|
存储 人工智能 Docker
OpenClaw进化指南:阿里云+Windows本地部署+EvoMap自进化配置,让AI Agent学会自我成长
2026年是AI智能体的爆发元年,OpenClaw(原Clawdbot/Moltbot)凭借开源可控、全场景适配的特性成为现象级AI工具,但多数用户仍停留在“手动配置技能、重复调试问题”的初级阶段,殊不知通过EvoMap这个GitHub神器,能让OpenClaw实现**协议约束下的自主进化**——像人类一样复刻优质技能、自主优化能力,甚至形成独有的“数字人格”。
1678 8
|
30天前
|
人工智能 安全 前端开发
阿里开源 Team 版 OpenClaw,5分钟完成本地安装
HiClaw 是 OpenClaw 的升级版,通过引入 Manager Agent 架构和分布式设计,解决了 OpenClaw 在安全性、多任务协作、移动端体验、记忆管理等方面的核心痛点。
1812 60
阿里开源 Team 版 OpenClaw,5分钟完成本地安装
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
Z-Image:冲击体验上限的下一代图像生成模型
通义实验室推出全新文生图模型Z-Image,以6B参数实现“快、稳、轻、准”突破。Turbo版本仅需8步亚秒级生成,支持16GB显存设备,中英双语理解与文字渲染尤为出色,真实感和美学表现媲美国际顶尖模型,被誉为“最值得关注的开源生图模型之一”。
4482 9
|
6月前
|
测试技术
哪里不对改哪里!全能图像编辑模型Qwen-Image-Edit来啦
Qwen-Image-Edit基于20B Qwen-Image模型,融合视觉语义与外观控制,支持中英文文字精准编辑、风格迁移、IP创作等多重功能,具备SOTA性能,助力低门槛、高精度图像编辑。
3330 23
|
2月前
|
人工智能 开发者 API
阿里云百炼 Coding Plan 又双叒上新了!模型任选+首购 7.9/月,开发者速冲🚀
百炼Coding Plan春节升级!新增Qwen3.5-Plus等多款先进模型,Lite/Pro版新用户首月低至7.9元、39.9元,享2折起优惠;全面兼容Cursor、Claude Code等主流AI编程工具,订阅灵活,性价比超高!活动至4月1日。
|
2月前
|
存储 人工智能 网络安全
2026年OpenClaw/Clawdbot多Agent实战指南:阿里云+Windows部署,打造全功能AI智能体协作团队
2026年AI智能体进入规模化协作时代,OpenClaw(原Clawdbot)凭借原生多Agent支持、独立工作区隔离、灵活路由机制,成为搭建专属智能体团队的首选框架。不同于单智能体“全能但混乱”的痛点,多Agent架构通过“角色拆分、身份隔离、协作分工”,让每个智能体专注特定领域,彻底解决上下文污染、人设混乱、Token消耗过高的核心问题。
1818 3
|
2月前
|
API
这个春节,大模型终于学会了“看图思考”
新春献礼!Qwen3.5-Plus重磅发布,支持高质量视觉理解与复杂推理一体化,图文生产力翻倍提升。效果更强、成本更低——API价格低至0.8元/百万Token,仅为Gemini 3的1/18。现已上线阿里云百炼模型广场,即刻体验!
183 5
|
2月前
|
自然语言处理 机器人 API
2026年阿里云简单部署OpenClaw(Clawdbot)并集成飞书完整步骤教程
最近OpenClaw(前身为Moltbot、Clawdbot)在版本迭代中进一步优化了与飞书的集成适配,无需复杂开发部署,通过规范化的凭证配置、权限开通与事件对接,即可实现飞书与OpenClaw的无缝联动。集成后,用户可在飞书单聊或群聊中直接与OpenClaw交互,驱动其完成办公自动化、任务管理、智能问答等核心功能,适配个人办公与轻量团队协作场景。本教程严格遵循官方适配逻辑,覆盖前期准备、飞书应用配置、OpenClaw对接、功能验证等全流程,确保操作可落地且信息原汁原味。
2386 1
2026年阿里云简单部署OpenClaw(Clawdbot)并集成飞书完整步骤教程

热门文章

最新文章