阿里巴巴于近日正式发布了图像生成与编辑统一模型 Wan2.7-Image。这款模型直击当前 AI 生图领域审美疲劳、色彩失控等痛点,通过引入更具“活人感”的人物生成、精准的色彩控制以及超长文本渲染能力,将图像创作从“抽卡式”的随机生成推向了“工业级”的精密控制新高度。关于Wan2.7-Image的更多细节,可以在阿里云百炼平台申请接入使用:https://www.aliyun.com/product/bailian
核心升级:从“千人一面”到“千人千面”
长期以来,AI 生成的人物形象常因“标准脸”而为人诟病。Wan2.7-Image 对此进行了深度优化,强化了虚拟形象捏脸功能。现在,用户可以通过提示词,从骨相、眼眸到五官的细微处进行全方位定制。无论是区分鹅蛋脸、圆脸、方脸,还是选择杏仁眼、深邃眼窝或丹凤眼,模型都能精准呈现,真正实现“千人千面”,让生成的人物告别虚假感,更具“活人感”。
告别“色彩盲盒”:精准的“调色盘”控制
对于设计师而言,色彩的精准度至关重要。Wan2.7-Image 全新支持的 “调色盘”功能,允许用户通过 Hex Code 一键提取参考图的颜色及占比,或手动输入自定义配色方案。无论是复刻梵高明媚的黄色系,还是对齐品牌手册的严格配色,用户都可以自由调控颜色的数量和比例,实现精准的视觉风格迁移。
突破文本渲染瓶颈:超长文字印刷级输出
超长文字渲染一直是 AI 生图的“硬伤”,容易导致文字模糊、错乱或遗漏。Wan2.7-Image 凭借其强大的上下文记忆与解析能力,支持最高 3K Token 的超长文本输入,可稳定处理包含复杂排版、多列表格、数学公式在内的内容。输出图像清晰锐利,达到印刷级标准,并支持中、英等12种语言,可直接用于生成一页A4纸的论文或专业图表。
交互式编辑与多主体一致性
除了生成能力,Wan2.7-Image 还强调“可操控性”:
- 哪里不爽点哪里:模型原生支持交互式编辑模块,用户可以通过精准框选,在指定区域实现元素的添加、对齐、移动或像素级替换(如将冰块替换为水果并保持光影不变),实现像素级的意图对齐。
- 强大的组图与一致性:该模型具备强大的组图生成能力,最多可一次性生成12张同风格系列图,适用于PPT配图、分镜脚本或电商模特套图。同时,其多主体一致性能力最高支持输入9张参考图,确保合影、电影海报或家具组合在不同画面中的风格与特征高度统一。
技术架构的飞跃
更精准的理解力,源于底层架构的突破。Wan2.7-Image 采用了领先的生成与理解统一模型架构,通过在共享隐空间内实现语义映射,让模型不再费力去猜测文字对应的画面,而是真正建立起从文本到图像的底层语义认知。此外,基于更大规模数据及尺寸训练而成的 Wan2.7-Image-Pro 也同步上线,其构图更加稳定,语义理解更强更精准。更多关于Wan2.7-Image的介绍,请移步到阿里云通义大模型官网查看:https://www.aliyun.com/product/tongyi
行业应用与体验渠道
Wan2.7-Image 的强大功能可广泛应用于多个行业。短剧与影视团队可低成本完成角色设定与特效预览;电商领域可裂变生成不同场景的卖点图,大幅降低拍摄成本;教育和科研从业者则可直接调用模型生成论文配图与信息图表。
即日起,用户可在 阿里云通义万相官网、wan.video 以及 阿里云百炼平台 体验 Wan2.7-Image,千问App也即将接入。针对时下大火的“龙虾热”,该模型现已支持Skill调用,进一步解锁了生成模型的应用场景。