通义万相AI绘画创作体验评测

本文涉及的产品
视觉智能开放平台,图像资源包5000点
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
简介: 从使用者的角度解读通义万相AI绘画创作方案的优与劣

这是解决方案评测的第二篇,也是开发者新版评测的第二篇。希望大家可以踊跃参加,把你最真实的体验感受和建议分享出来。可点击下方链接前往评测活动首页:

解决方案评测|高效构建企业门户网站

解决方案评测|通义万相AI绘画创作

方案速览

从活动首页通过点击“查看方案”可一键直达解决方案详情页。方案从五个层面(是什么、为什么、用在哪、怎么做、需要啥)全方位阐述了如何使用阿里云服务来进行AI绘画创作。下面将从这五个方面详细解读下整体方案。

是什么

这一部分阐述方案是如何组合云产品服务来实现AI绘画创作的。下面是方案的拓扑:

image.png

此方案拓扑中,云服务器(ECS)被用于运行Web程序,来接收用户的图像处理请求;而对象存储(OSS)则用于存储某些场景中用户上传的图片,并通过签名的方式使得生成模型(通义万相/FaceChain)可以下载该图片,灵积模型服务(DashScope)通过提供基于HTTP接口的API,来实现应用程序的调用。

为什么

实现AI绘画创作的方式有很多种,为啥要选择使用阿里云服务,它能带给用户的能力和优势都有那些。方案从三个方面阐述了这一点。

  • 服务稳定易用

通义万相系列模型服务提供稳定生成高清图片的响应,以适应高并发和大流量,可用性不低于99%,确保了用户在任何时候都能顺畅地进行创作。

  • 集成与接入简单

提供了易于调用的API接口,简化了集成过程,并具有优秀的兼容性。背后的AI技术虽然非常复杂,但借助于灵积模型服务API,应用系统可以通过基于HTTP接口方便快速地接入,无需技术背景也可轻松上手。

  • 应用场景广泛

通义万相不仅可以将文本转换成图像,还能够进行涂鸦作画、人像风格化处理,以及人物写真生成等多种操作。这为用户在广告创意、艺术创作、游戏角色设计、社交媒体内容创作等多个领域提供了广泛的应用可能性。

用在哪

上面的优势说到了应用场景广泛,但具体都能用到那些场景呢,这部分内容着重阐述了这一点。方案总结了五大应用场景,分别是:

  • 艺术与设计创作

image.png

设计师和创意工作者可以快速生成概念草图、插画、海报、包装设计,甚至数字艺术品。创作者们只需输入创作的要点,利用文生图技术片刻就能获得成品,这大大地缩短了从构思到成品的时间,降低了创作门槛。此外文生图技术还提供了丰富的灵感源泉和高效的原型生成工具。

  • 广告与营销物料生成

image.png

文生图能够实现即时响应广告文案,生成符合品牌调性、产品特性和营销策略的视觉内容,节省了传统拍摄与后期制作的成本。广告内容可以根据实时热点迅速调整,实现高度定制化和敏捷营销。

  • 教育与培训资源制作

image.png

教育工作者和培训师利用文生图模型来创建生动、直观的教学素材。这有助于提升教学内容的吸引力和理解度,并且定制化的图像资源还能用于制作互动课件、电子教科书,从而丰富教学资源库。

  • 游戏与娱乐内容开发

image.png

游戏开发者可以借助文生图大模型快速生成游戏内的角色、道具和环境元素等美术资源,用于动态生成游戏NPC(非玩家角色)的外观或定制化玩家角色,从而增加游戏世界的多样性和沉浸感。

  • 时尚与服装设计

image.png

时尚设计师和电商平台利用文生图技术进行服装设计和虚拟试穿体验。电商平台可以结合用户身材数据,让用户输入文字描述想要的服装款式或风格,从而生成个性化虚拟试穿图片。

怎么做

在了解了方案是什么、方案有那些优势以及方案的应用场景后,该到了如何真正落地实施环节了,也就是实现上述功能,我要如何开展落地部署。这里方案提供了两种部署方式,有一键部署和手动部署。一键部署简化了底层基础环境的构建,可以大大节约部署时间;而手动部署却更加灵活,每一个环节都可以实现按需调整。下面将分别体验,这里就不做过多阐述。

需要啥

实施方案需要具备那些条件或者是需要提前准备那些必要服务呢,而如何以最经济的方式来获取这部分服务呢,这一部分就介绍了。实现方案的落地需要用到云服务器ECS、对象存储OSS以及接口API调用的灵积模型服务、生成模型通义万相。实现方案花费较大的就是云服务器ECS,方案也是很贴心地准备了优惠计划。如下:

image.png

如果你经常使用云服务器来部署或测试各类应用,还是建议购买这个99一年的套餐,它的好处是永久实现99一年。如果你是新用户,那恭喜你,你可以领取免费的ECS试用,而且规格还不错。如下:

image.png

部署实践

前提准备

在正式开始部署前,需要提前准备基础实施和云服务。如下:

  • 1个专有网络VPC:云服务器ECS创建于此VPC下。
  • 1台交换机:云服务器ECS创建于此交换机下。
  • 1台云服务器ECS:用于部署示例应用程序。
  • 1个对象存储OSS Bucket:用户存储用户上传的图片,并生成签名的URL提供给大模型进行下载。建议使用和ECS同地域下的OSS Bucket。
  • DashScope灵积模型服务:用于示例应用程序调用通义万相的服务。

接下来将按照方案提供的两种部署方式分别体验,先体验一键部署。点击方案的“一键部署”即可直达。如下:

对于如上的基础实施和云服务不知道如何选择的,尤其是针对云服务器ECS,可以参考如何选购ECS实例

第一步是你得有一个阿里云实名认证过的账号,这个这里就不展开阐述了,你可以通过手机号,邮箱进行注册并完成实名认证即可。如果你有账号且不是ECS的新用户,还需要确保账户余额不小于100元。这里着重演示如何开通灵积服务模型并获取API-KEY。

首次进入灵积服务控制台,会出现如下图的页面,显示未开通服务。

image.png

你只需点击页面上的"未开通",前往开通页面进行开通即可。如下:

image.png

开通之后再次返回控制台首页,就不会再显示未开通了。如果你之前使用过模型服务,还会在此进行显示。如下:

image.png

接下来需要创建API-KEY。在左侧导航栏单击管理中心 > API-KEY管理。单击创建新的API-KEY。如下:

image.png

在弹出的API-KEY详情页面,单击复制,将API-KEY妥善保存至本地后,单击我已保存,关闭。如下:

image.png

很多小机灵看到这里就会发问了,我不复制保存,我点击"查看"不就行了吗?是的,你确实可以点击"查看"进行查阅,但你会面临安全认证,看到这是不是觉得还不如保存到本地呢。如下:

image.png

那还有的宝子们会说了,我可以再申请一个啊,免得认证这么麻烦。这里要注意的是主账号,有且只能同时拥有三个有效的API-KEY,而不是越多越好哟,还是复制保存本地为妥。

一键部署

有了上述准备的这些基础服务,接下来就可以通过ROS编排一键部署了,只需点击文案的"一键部署"直达ROS控制台。在ROS控制台,我们需要输入的是应用的登录密码,API-KEY以及ECS的规格和密码。如下:

image.png

image.png

点击下一步,确认信息,点击创建。如下:

image.png

可以通过编排详情清楚地看到整个部署过程。如下:

image.png

大概4分钟后,整个部署完成。如下:

image.png

点击输出,就可以访问到本次部署的服务了。如下:

image.png

服务体验

输入ROS编排中定义的用户名和密码进行登录。如下:

image.png

如果此处你忘记了设置的是啥,可以通过编排的参数进行查看。如下:

image.png

但有粗心的小伙伴要问了,我密码也不晓得咋整。你可单击命令执行,选择查看,跳转到ECS控制台,在ECS云助手的执行信息中可查看到密码。如下:

image.png

完成登录后,你就完成了AI绘画创作Web服务的部署。如下:

image.png

到这整个部署就结束了,你可以尽情把玩了。比如我输入一个“乌云密布、雷鸣闪电”,其他默认,看能生成啥。如下:

image.png

效果是这样的,还是不错的。从图片URL来看,是存放在OSS对象存储的,非常高效便捷。

image.png

涂鸦作画再来一张。风格选择3D卡通,输入"比卡丘",而后在画板上随意一画,如下:

image.png

生成效果如下,不得不说,这效果连我都没想到,还真不错。

image.png

人物风格重绘。挑选一张本地的图片,选择复古漫画。如下

image.png

原图是这样的。如下:

image.png

复古漫画的生成效果如下:这漫画中的小天使加的妙啊。

image.png

3D童话生成效果如下:还是简单风格比较容易实现。

image.png

二次元的生成效果如下:最大程度地还原了。

image.png

小清新的生成效果如下:画风很奇怪,这个一点也不清新。

image.png

未来科技的生成效果如下:这个风格整体还可以。

image.png

国画古风的生成效果如下:我很好奇图上的小姐姐是怎么加进来的。

image.png

将军圣战的生成效果如下:这个效果就特立独行了。

image.png

炫彩卡通的生成效果如下:画本身没问题,但当你看到原图时还是有点诧异的。

image.png

清雅国风的生成效果如下:虽然画风很符合,但这转变也太大了。

image.png

喜迎新年的生成效果如下:这效果有点让人意外啊,好好的小精灵变成了小姑娘,还有这鼻子也是很独特。

image.png

至于手动部署这里就不过多演示了,除了基础环境需要自己动手构建外,其余同一键部署,感兴趣的朋友可以点击前往了解更多详情。以下是手动部署相较于一键部署的差异项:

1、部署应用涉及的有关资源和服务

image.png

2、安装应用程序

image.png

释放资源

完成上述体验后,一定要记得释放资源,避免产生额外费用。释放资源非常简单,只需要在ROS控制台,找到对应的资源栈,点击操作列的删除即可。如下:

image.png

在弹出的窗口中,选择释放资源,点击确定。如下:

image.png

体验总结

1)整个部署过程非常丝滑顺畅。非常推荐通过一键部署来完成应用的构建。通过ROS编排可以非常高效地完成基础环境的搭建及应用的部署。此外,API调用体验也相当顺畅,通过灵积模型服务,你只需创建一个API-KEY即可实现调用,真正做到了快速集成。

整个部署过程都有非常好用的文档参照,即使是小白用户也可以轻松完成部署。每一个填空都有文字和链接指引,极大地方便了用户。比如:

image.png

image.png

2)通过ROS编排和灵积模型服务,我可以非常快捷方便地构建一套AI绘画web应用。在实际测试中,通义万相的服务响应时间表现良好,能够快速地响应用户的请求,保持稳定的性能。在模型泛化能力方面表现良好,基本能够准确理解不同领域的文本,并生成相应的图片。支持多种图片风格,包括但不限于卡通、国风、复古等,满足了用户多样化的需求。生成的图片质量高,细节丰富,色彩还原度高,除小清新和国画古风外,其他风格与预期效果基本相符。无论是清晰度还是美观度,都达到了较高的水平。

虽然应用提供的风格较多,但这里不得不提一嘴的是,如果支持用户自定义就更好了,可以让用户自定义,将常用的放置在前台,其他的折叠或隐藏到更多中。

image.png

此外这里的图片规格竟然没有标准1080P的,如果按照尺寸,那就提供更多尺寸让用户来选择。非常建议按照照片比例来,比如1:1、16:9。比如通义万相官网的这种:

image.png

还有就是风格重绘中,小清新、国画古风这两个风格是很难生成用户预期图片的,不晓得是底层模型应用的问题还是其他适配问题,用人物图和玩偶图都达不到预期效果。

3)改进和提升方面:

  • 希望能够强化对图像细节的捕捉和生成,特别是在复杂场景和纹理丰富的物体上。

  • 期待扩大可生成的图像风格和主题范围,比如更多样化的艺术风格、历史时期、文化背景、热点新闻等。

    期待的新功能:

  • 允许用户自定义和上传自己的风格或主题模板,来满足特定需求。

  • 提供一个实时互动的界面,允许用户在生成过程中进行实时编辑和调整,如改变颜色、添加元素、调整构图等。

  • 可以根据用户的历史记录和偏好,提供智能的图片生成建议或推荐。

  • 除了静态图片外,支持生成动态图像、视频甚至3D模型。

  • 允许用户通过语音、手势等多模态输入来控制图像的生成和编辑。

我所期待的通义万相不是一个简单的AI工具,而是一个实实在在可以帮助用户创造价值的AI助手。

4)我使用过百度的文心一格、腾讯的元宝、美图的WHEE,以及现在的通义万相。他们的首页界面如下:

image.png

image.png

image.png

image.png

从成本上来讲,各家都有免费的额度供用户日常使用,除元宝外,美图每日提供80个美豆、文心一格提供40格电量、通义万相提供50个灵感值。腾讯元宝的AI作画没发现有VIP模式,美图的WHEE和百度的文心一格都是创作一幅画耗费两个额度,阿里的通义万相是一个额度生成一副作品。单从数量上来看,通义万相是最划算的,相比其他家按数量消耗额度,它可以用一个额度同时生成四张图片。

从易用性上来看,腾讯元宝的界面是最简洁的,但可玩性也是最弱的。其他家均提供高级或更多模式,这里文心一格的把玩性是最强的,但也意味着它功能性是分散的,美图作为老派的图片编辑工具,在WHEE上主打一个WEB版的图片编辑风格,通义万相算是中规中矩,基本能满足用户创作需求。

从应用场景上来看,百度的问心一格算是最丰富的,它不仅可以选择的图片风格更多,功能性上也是最多的。腾讯元宝和美图WHEE的应用场景和功能是最少的,也就满足个基本创作。通义万相虽然选择性不是很多,模板提供的也有限,但好在创作质量很高,很大程度上可以满足用户的创作需求。通义万相在应用场景上的广泛性可能是一个重要的竞争优势,因为它能够覆盖更多的市场和用户群体。

综上,我愿意推荐团队使用通义万相来进行AI绘画创作。通义万相作为阿里云推出的AI大模型服务,其背后有强大的技术支持和丰富的资源。在服务质量上具有较高的保障。其服务可用性≥99%,能够为用户提供稳定可靠的服务体验。界面设计简洁清爽,操作流程直观易懂,无需复杂的技术背景即可快速上手,大大降低了用户的学习成本,提高了创作效率。在应用场景上具有广泛的适用性,能够覆盖广告、设计、游戏、电影等多个领域。对于需要高效、便捷地进行图像创作的团队来说,通义万相无疑是一个值得推荐的选择。

相关实践学习
ECS云服务器新手上路
本实验会自动创建一台ECS实例。首先,远程登陆ECS实例,并部署应用。然后,登陆管理控制台,并对这台ECS实例进行管理操作。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
2月前
|
人工智能 JSON 数据格式
GEE、PIE和AI Earth平台进行案例评测:NDVI计算,结果差异蛮大
GEE、PIE和AI Earth平台进行案例评测:NDVI计算,结果差异蛮大
92 0
|
11天前
|
人工智能 弹性计算 API
创意“孵化机”——基于通义万相加速绘画创作流程
阿里云在2023年推出了AI绘画平台**通义万相**,该平台能够根据文本描述生成图像,应用于艺术创作。近期,阿里云优化了通义万相的接入方式,提供API文档和一键部署服务,使得非技术人员也能轻松集成到Web应用中。为促进用户尝试,阿里云还推出了解决方案评测活动,参与者有机会获得奖品。通义万相通过ECS、OSS、VPC和DashScope等云服务支持,简化了技术架构,加速了绘画创作流程。此外,阿里云提供了优惠购买方案,新人享有特别折扣。该服务不仅适用于艺术家,还可应用于多个领域,提高内容生成效率。
70753 24
|
3天前
|
人工智能 弹性计算 API
通义万相AI绘画创作一键部署实现
通义万相AI绘画创作提供了一键部署流程,点击链接登录,即可开始绘画生成。
27 13
|
2天前
|
人工智能 API 开发工具
通义万相AI绘画创作评测
通义万相AIGC Web服务评测:部署与API调用流程顺畅,集成便捷,响应快,模型泛化能力强,支持多种风格图像生成,图片质量高。建议增强模型定制、添加视频生成及多语言支持。相比竞品,具有成本、易用性优势,适合开发者集成使用。
|
9天前
|
存储 人工智能 弹性计算
通义万相AI绘画创作评测
- 一键部署流程顺畅,但手动部署环节有改进空间,期望能选择已有资源。 - 服务响应迅速,生成图片质量满意,相比DALL·E有一定差距。 - 建议优化部署指南,允许选择已有ECS和OSS存储。 - 成本、易用性具竞争力,接近FC速度,优于其他国内产品,推荐给他人使用。 - 部署流程顺利,一键部署体验好,但手动步骤需优化,希望可选已有云计算资源。 - 服务响应快,图片生成质量好,不过与DALL·E相比仍有提升空间。 - 希望增强部署灵活性,支持选择已创建的ECS实例和OSS存储。 - 相比同类产品,阿里云方案在成本和易用性上有优势,推荐给团队和伙伴。
41 7
|
12天前
|
人工智能 自然语言处理 测试技术
通义灵码评测: 阿里云出品通义大模型AI代码编程辅助工具
通义灵码是阿里云出品的一款基于通义大模型的AI智能编码辅助工具,提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码注释生成、代码解释、研发智能问答、异常报错排查等能力,并针对阿里云 SDK/OpenAPI 的使用场景调优,助力开发者高效、流畅的编码。
267 0
|
2月前
|
人工智能 运维 Devops
云效流水线智能排查功能实测:AI赋能DevOps,精准定位与高效修复实战评测
云效持续集成流水线Flow是阿里云提供的企业级CICD工具,免费且注册即用。它具备高可用性、免运维、深度集成阿里云服务、多样化发布策略及丰富的企业级特性。产品亮点包括智能排查功能,能快速定位问题,提高问题解决效率。云效Flow支持一站式DevOps流程,适用于各种规模的企业,助力实现高效、高质量的软件交付。现在即可免费试用,体验智能CICD解决方案。
|
2月前
|
机器学习/深度学习 自然语言处理
文生图模型-Stable Diffusion | AIGC
所谓的生成式模型就是通过文本或者随机采样的方式来得到一张图或者一段话的模型,比如文生图,顾名思义通过文本描述来生成图像的过程。当前流行的文生图模型,如DALE-2, midjourney以及今天要介绍的Stable Diffusion,这3种都是基于Diffusion扩散模型【1月更文挑战第6天】
529 0
|
2月前
|
人工智能 开发工具 git
【AI绘画】Stable Diffusion 客户端搭建
【AI绘画】Stable Diffusion 客户端搭建
94 0
【AI绘画】Stable Diffusion 客户端搭建
|
9月前
|
人工智能 物联网
AI 绘画Stable Diffusion 研究(十七)SD lora 详解(上)
AI 绘画Stable Diffusion 研究(十七)SD lora 详解(上)
1069 0