【AI绘画大比拼】通义万相VS文心一格:探索十种风格下的绘画生成差异!

简介: 近日,通义大模型家族的新成员——通义万相已在人工智能大会上亮相。其中,通义万相的强大的“文生图”功能,不禁让我想到了去年八月由百度依托飞桨、文心大模型的技术创新推出的“AI作画”首款产品——文心一格。那么,在类似的Prompt下,两款产品的表现将会如何呢?今天就让我们就十种风格下二者生成图像的表现力,来看看这两款产品的差异。

一、背景

     近日,通义大模型家族的新成员——通义万相已在人工智能大会上亮相。其中,通义万相的强大的“文生图”功能,不禁让我想到了去年八月由百度依托飞桨、文心大模型的技术创新推出的“AI作画”首款产品——文心一格。

     那么,在类似的Prompt下,两款产品的表现将会如何呢?今天就让我们就十种风格下二者生成图像的表现力,来看看这两款产品的差异。

二、绘画生成


1、测试准备


AI绘画基础公式:Prompt= 画面主体+细节词+风格词

由于两款产品所支持的画面类型并不能一一对应,故本次测试中会手动选择两者最贴近的风格,将生成图像进行比对。个别的细节词会调换顺序,方便ai识别。

部分生成图采用文心一格——智能创作平台(ApI)手册中的生成图。


2、效果对比——左侧为通义万相,右侧为文心一格 


2.1 人像

Prompt:人像摄影,写实照片,超现实主义风格,高度详细的阴影和纹理,十分逼真,佳能35焦段,光圈1.8——默认风格

     人像绘制一直是国产ai绘画模型的一大劣势,对于本次测试的两款模型来说也是如此。万相的图像整体风格很统一,但是放大后可以看到人脸处的纹理非常僵硬,眼睛瞳孔的形状变形。文心一格在画面的细节处理上要好很多,毛发非常逼真。但在词汇理解上,文心一格并没有理解prompt中的光圈一词,导致画面生成了一圈奇怪的光晕。

2.2二次元

Prompt:少女,浅蓝色头发,长发,蓝眼睛,花朵发饰,侧脸,唯美,欧式背景,日式动漫人物,二次元风格

Prompt:男孩,西装,金丝眼镜,斯文,沉稳,二次元风格

     看的出来两款产品在二次元风格这一模块中做的都很不错。两次测试下来,万相给我的感觉更偏向于韩式漫画的风格,所创作出的图像都会带一些3D的感觉,人物都比较立体。文心一格的图像画风更接近于我印象中的传统二次元,但是图一的测试中,没有像万相一样把“欧式背景”体现出来,图二的人物我很喜欢,但是背景有一些变形。


2.3 3D动漫人物

Prompt:古风动漫少女,唯美春日花神,面容精致,毛发精致,3D立体,花朵盛开,CG,超细节,超高清——水彩画风格

     两款产品生成的动漫人物各有千秋,万相整体色调和背景相融合,都是粉色,细节也很精明,眼部妆容色彩如果能淡一些可能会更好。文心一格的画面颜色也做了统一,面容相对来说更为精致立体,如果能把春日花神的特征体现出来也会更好。

2.4素描

Prompt:老人,人像写真,皱纹,笑容灿烂

     和人像相同,万相的整体画面比较暗,文心一格的画面比较亮。万相的图像放大来看还是会感觉有一些“丝滑”,和图片中老人的皱纹这一特征比较违和,但是总体来说以及非常精细了。而文心一格的图像老人的额头一眼就看出来生成错误,大面积的复制粘贴,并且图像中老人的脸也没有展示完整。素描这一风格上文心一格还有待加强。

2.5动物

Prompt:爱情鸟绿,具有活力的异国绿色,动物,鹦鹉,高清,轮廓清晰完整,高清

     这里我选的都是默认风格,想生成出写实风格的鹦鹉。万相所生成的图像更接近于我脑海中的鹦鹉图,羽毛的细节如果可以优化一下更加细致就更好了。文心一格的画风更接近于画作,但是眼睛这里生成有bug。整体来说我更喜欢万相的生成内容。

2.6自然

Prompt:向日葵,油画风格,细腻,色彩鲜艳

     万相油画风格下的向日葵,还带了光影的绘画,这一点让我很惊喜!并且远处的向日葵并没有生成我以为的统一复制的风格,颜色也非常鲜艳。文心这边的向日葵没有突出色彩鲜艳这一特征,并且花瓣内测的颜色也没有想左侧一样渐变。本次油画风格我也更加喜欢万相的图像。

2.7古诗词

Prompt:举头望明月,低头思故乡

     对国内的ai绘画模型来说,古诗词也是一大难点。因为不单单要理解、绘画出诗句中的景象,所生成的图像还要带有一定的意境才算合格。本次测试的文本“举头望明月,低头思故乡”是我国著名诗句,表达了作者的思乡之情。

     万相所生成的图像描绘了“举头望明月”,画面色调也采用了冷色调,但是并没有看出“低头思故乡”,并且从人像背景也并不能看出是古代场景还是现代场景。文心所生成的图像自动匹配了国画风格,意境很到位,但是同样也没有表现出思乡之情。但总体来说生成的图像是在合格线上的。

2.8古风场景

Prompt:游戏梦幻唯美新中式风景,超高清,细节刻画,沐浴在花瓣里,满天花瓣,飘渺电影般环境,明亮清晰

     左侧万相生成的图像中漫天花瓣飞舞,河道两边有中式的小亭子,让人看到的第一眼以为是哪个古风游戏的场景截图,画面非常唯美。如果说左侧是游戏内的场景的画,右侧文心一格生成的镜像更像是插画设计稿,图中的建筑绘画的非常细腻。这一次的测试两款产品各有千秋。

Prompt:群山,古画,红枫叶

     在古画场景测试中,万相的“群山”细节还有待优化,枫叶多的地方画面会自动模糊,总体还是不错的。相对而言我更喜欢右侧文心一格生成的图像。每一座山的细节都各不相同,同时枫叶和枫叶交错的地方也没有模糊,还是很清晰。

2.9科技场景

Prompt:生态城市,未来城市,外星城市,科技城市,自然生态,未来生活,生态绿植

     本次测试了未来科技生态场景。两者的细节绘画都很不错,相比较而言我觉得万相的画面更加富有科技感,符合我脑海中的场景。文心一格的色调如果再明亮一些,远处背景的建筑再庞大一些会更好。

2.10插画

Prompt:都市,时尚,咖啡,办公,明亮,活力

     插画风格下两款产品生成的图像还是有些差异的。左侧的万相生成的图像堆积了许多元素但不违和,很具有设计感。而右侧文心生成的插画更加注重画面的内容。

三、结论


     经过本次测试,我个人认为万相在生成3D风格的人像和自然场景方面表现出色。其生成的人像逼真度高,有立体感,能够准确捕捉到人物的面部特征和表情。而在生成自然场景方面,万相能够细致地描绘出大自然的细节,如植物的纹理、水流的流动等,让画面更加生动。在油画风格中,万相所绘制的图像也非常惊艳。画面色彩鲜艳,构图美观。

     另一方面,文心一格在生成二次元图像和古风画方面表现突出。其生成的二次元图像色彩鲜艳,线条流畅,能够准确还原出动漫角色的特征和风格。在生成古风画方面,文心一格能够恰到好处地表现出古代绘画的质感和氛围,给人一种古典的美感。 可能是因为文心一格问世较早,通义万相发布时间短的原因,所以在功能体验上文心一格给我带来的体验更好。文心一格提供了许多可供用户操作的空间,如【选择画面风格】、【添加修饰词】、【不希望出现的内容】和【图片二次编辑功能】等。这些功能对于创作者来说是极大的帮助,也提供了较大的容错率。而通义万相在这些方面可能还有进一步的优化空间。

     希望在将来,通义万相能对其产品进行优化,为我们带来更好的体验。不论是提高生成效果的准确性和真实度,还是增加更多的可操作性和容错率,都能够让用户更方便地使用和创作。期待通义万相继续提升产品质量,为我们呈现出更多令人满意的画面和体验。


 📣社区里的小伙伴们体验过这两款产品吗?你们体验后更看好哪一款产品呢?
     如果你被
通义万相的细致打动,请在评论区发【1】

     如果你觉得文心一格体验更流畅,请在评论区发【2】

     欢迎在评论区留下你的观点,我们一起讨论❤

目录
打赏
0
1
7
2
72
分享
相关文章
AI视频生成也能自动补全!Wan2.1 FLF2V:阿里通义开源14B视频生成模型,用首尾两帧生成过渡动画
万相首尾帧模型是阿里通义开源的14B参数规模视频生成模型,基于DiT架构和高效视频压缩VAE,能够根据首尾帧图像自动生成5秒720p高清视频,支持多种风格变换和细节复刻。
117 7
AI视频生成也能自动补全!Wan2.1 FLF2V:阿里通义开源14B视频生成模型,用首尾两帧生成过渡动画
通义灵码2.0 - AI 程序员: AI 编程新时代的卓越助力
通义灵码是一款强大的AI编程助手,尤其在单元测试自动生成方面表现出色。它通过简化操作流程,快速生成覆盖广泛、质量较高的测试用例,支持直接编译与运行,显著提升开发效率。相比人工编写,通义灵码能大幅缩短时间成本,并更全面地覆盖边界和异常情况,但特定业务逻辑仍需人工补充。作为开发者的好帮手,它助力高效完成高质量单元测试,推动软件开发迈向新台阶。
26772 84
通义灵码 vs. GitHub Copilot:中国AI编码工具的破局之道
全球AI编码工具形成“双极格局”,GitHub Copilot凭借先发优势主导市场,而通义灵码通过差异化路径突围。技术层面,通义灵码在中文语境理解、云原生绑定上展现优势;生态方面,Copilot依托GitHub开源生态,通义灵码则深耕阿里云企业协同场景;开发者心智战中,通义灵码以数据合规、本土化服务及定制化能力取胜。这场较量不仅是技术的比拼,更是生态逻辑与开发者需求的全面博弈,彰显中国AI编码工具“换道超车”的潜力。
72 18
通义灵码:AI重构编码范式,开发者如何迎接“人机共生”时代?
本文探讨了以通义灵码为代表的AI编码助手如何推动软件开发从“人驱动工具”向“人机协同创造”演进。文章分析了其技术突破,如意图理解、上下文感知和可解释性,并讨论了开发者价值链条的重构,包括需求抽象、架构设计与代码审查能力的提升。同时,文章展望了行业变革对开发者身份、云生态竞争及技术伦理的影响,强调在AI驱动的“寒武纪大爆发”前夜,唯有持续进化才能适应未来软件工程的“人机共生”文明。
64 15
通义灵码:当AI成为你的编程搭档,效率革命已经到来
本文介绍了通义灵码作为AI编程伙伴的革命性意义及其技术特点。基于阿里云通义代码大模型CodeQwen1.5,它具备多模态代码理解、意图推理和跨语言知识融合能力,可重构开发者工作流,从智能编码到Debug预警再到文档自动化全面提升效率。数据显示,其能将常规开发时间缩短60%,错误率下降43%,新技术上手速度提升2倍。未来,通义灵码将推动需求-代码双向翻译、架构自演进等全新编程形态,助力开发者聚焦更高价值领域,开启人机共生的编程新时代。
43 9
通义灵码:以AI重塑开发者生产力,解锁智能编程新范式
通义灵码是阿里云推出的一款AI智能编程助手,基于通义大模型打造,深度集成于主流IDE。它不仅提供全场景智能代码生成、对话式开发体验和工程化智能重构等功能,还通过百亿级参数大模型底座、企业级环境适配、私有化部署等优势,重新定义人机协作边界。在真实开发场景中,通义灵码显著提升API开发与算法优化效率,助力开发者从机械劳动转向创造性对话,开启人机协同的新时代。
45 9
通义灵码:AI赋能编程,开启智能开发新时代
通义灵码是阿里云推出的一款专为开发者设计的智能编程助手,基于自主研发的大模型打造。它不仅具备代码生成、智能补全、代码优化和实时调试等功能,还通过垂直领域深度训练、多语言全栈支持以及与主流IDE无缝集成,大幅提升开发效率。真实案例显示,通义灵码可显著减少编码时间和错误率,助力开发者专注于业务逻辑。未来,它还将进一步理解业务需求、参与代码评审和跨团队协作,重新定义软件开发范式。立即体验,让AI赋能每一行代码!
65 8
通义灵码进阶指南:解锁AI编程的隐藏潜能
本文探讨了通义灵码在DevOps全流程中的深度应用,通过五大高阶技巧将其从“代码补全工具”升级为“全栈协作者”。内容涵盖AI驱动的架构设计优化、全链路异常预测、智能学习工作台、AIOps智能运维以及定制化AI助手训练。实际案例显示,这些方法可提升团队交付效率300%,重新定义开发者生产力边界。
37 6
通义灵码2.0深度评测:AI原生研发时代的开发者革命
作为一名五年开发经验的程序员,我深刻感受到从手动编码到AI辅助编程的变革。通义灵码2.0基于Qwen2.5-Coder大模型,通过代码生成、多文件协同、单元测试和跨语言支持等功能,显著提升开发效率。它能生成完整工程代码,自动处理复杂业务逻辑与依赖关系;在系统升级和微服务改造中表现出色;自动生成高质量单元测试用例;还具备跨语言转换能力。尽管存在一些改进空间,但其高频迭代和功能优化展现了巨大潜力。通义灵码2.0正推动软件开发从“体力活”向“架构创造力”转型,是开发者不可错过的生产力工具。
通义灵码2.0深度评测:AI原生研发时代的开发者革命