这是解决方案评测的第二篇,也是开发者新版评测的第二篇。希望大家可以踊跃参加,把你最真实的体验感受和建议分享出来。可点击下方链接前往评测活动首页:
方案速览
从活动首页通过点击“查看方案”可一键直达解决方案详情页。方案从五个层面(是什么、为什么、用在哪、怎么做、需要啥)全方位阐述了如何使用阿里云服务来进行AI绘画创作。下面将从这五个方面详细解读下整体方案。
是什么
这一部分阐述方案是如何组合云产品服务来实现AI绘画创作的。下面是方案的拓扑:
此方案拓扑中,云服务器(ECS)被用于运行Web程序,来接收用户的图像处理请求;而对象存储(OSS)则用于存储某些场景中用户上传的图片,并通过签名的方式使得生成模型(通义万相/FaceChain)可以下载该图片,灵积模型服务(DashScope)通过提供基于HTTP接口的API,来实现应用程序的调用。
为什么
实现AI绘画创作的方式有很多种,为啥要选择使用阿里云服务,它能带给用户的能力和优势都有那些。方案从三个方面阐述了这一点。
- 服务稳定易用
通义万相系列模型服务提供稳定生成高清图片的响应,以适应高并发和大流量,可用性不低于99%,确保了用户在任何时候都能顺畅地进行创作。
- 集成与接入简单
提供了易于调用的API接口,简化了集成过程,并具有优秀的兼容性。背后的AI技术虽然非常复杂,但借助于灵积模型服务API,应用系统可以通过基于HTTP接口方便快速地接入,无需技术背景也可轻松上手。
- 应用场景广泛
通义万相不仅可以将文本转换成图像,还能够进行涂鸦作画、人像风格化处理,以及人物写真生成等多种操作。这为用户在广告创意、艺术创作、游戏角色设计、社交媒体内容创作等多个领域提供了广泛的应用可能性。
用在哪
上面的优势说到了应用场景广泛,但具体都能用到那些场景呢,这部分内容着重阐述了这一点。方案总结了五大应用场景,分别是:
- 艺术与设计创作
设计师和创意工作者可以快速生成概念草图、插画、海报、包装设计,甚至数字艺术品。创作者们只需输入创作的要点,利用文生图技术片刻就能获得成品,这大大地缩短了从构思到成品的时间,降低了创作门槛。此外文生图技术还提供了丰富的灵感源泉和高效的原型生成工具。
- 广告与营销物料生成
文生图能够实现即时响应广告文案,生成符合品牌调性、产品特性和营销策略的视觉内容,节省了传统拍摄与后期制作的成本。广告内容可以根据实时热点迅速调整,实现高度定制化和敏捷营销。
- 教育与培训资源制作
教育工作者和培训师利用文生图模型来创建生动、直观的教学素材。这有助于提升教学内容的吸引力和理解度,并且定制化的图像资源还能用于制作互动课件、电子教科书,从而丰富教学资源库。
- 游戏与娱乐内容开发
游戏开发者可以借助文生图大模型快速生成游戏内的角色、道具和环境元素等美术资源,用于动态生成游戏NPC(非玩家角色)的外观或定制化玩家角色,从而增加游戏世界的多样性和沉浸感。
- 时尚与服装设计
时尚设计师和电商平台利用文生图技术进行服装设计和虚拟试穿体验。电商平台可以结合用户身材数据,让用户输入文字描述想要的服装款式或风格,从而生成个性化虚拟试穿图片。
怎么做
在了解了方案是什么、方案有那些优势以及方案的应用场景后,该到了如何真正落地实施环节了,也就是实现上述功能,我要如何开展落地部署。这里方案提供了两种部署方式,有一键部署和手动部署。一键部署简化了底层基础环境的构建,可以大大节约部署时间;而手动部署却更加灵活,每一个环节都可以实现按需调整。下面将分别体验,这里就不做过多阐述。
需要啥
实施方案需要具备那些条件或者是需要提前准备那些必要服务呢,而如何以最经济的方式来获取这部分服务呢,这一部分就介绍了。实现方案的落地需要用到云服务器ECS、对象存储OSS以及接口API调用的灵积模型服务、生成模型通义万相。实现方案花费较大的就是云服务器ECS,方案也是很贴心地准备了优惠计划。如下:
如果你经常使用云服务器来部署或测试各类应用,还是建议购买这个99一年的套餐,它的好处是永久实现99一年。如果你是新用户,那恭喜你,你可以领取免费的ECS试用,而且规格还不错。如下:
部署实践
前提准备
在正式开始部署前,需要提前准备基础实施和云服务。如下:
- 1个专有网络VPC:云服务器ECS创建于此VPC下。
- 1台交换机:云服务器ECS创建于此交换机下。
- 1台云服务器ECS:用于部署示例应用程序。
- 1个对象存储OSS Bucket:用户存储用户上传的图片,并生成签名的URL提供给大模型进行下载。建议使用和ECS同地域下的OSS Bucket。
- DashScope灵积模型服务:用于示例应用程序调用通义万相的服务。
接下来将按照方案提供的两种部署方式分别体验,先体验一键部署。点击方案的“一键部署”即可直达。如下:
对于如上的基础实施和云服务不知道如何选择的,尤其是针对云服务器ECS,可以参考如何选购ECS实例。
第一步是你得有一个阿里云实名认证过的账号,这个这里就不展开阐述了,你可以通过手机号,邮箱进行注册并完成实名认证即可。如果你有账号且不是ECS的新用户,还需要确保账户余额不小于100元。这里着重演示如何开通灵积服务模型并获取API-KEY。
首次进入灵积服务控制台,会出现如下图的页面,显示未开通服务。
你只需点击页面上的"未开通",前往开通页面进行开通即可。如下:
开通之后再次返回控制台首页,就不会再显示未开通了。如果你之前使用过模型服务,还会在此进行显示。如下:
接下来需要创建API-KEY。在左侧导航栏单击管理中心 > API-KEY管理。单击创建新的API-KEY。如下:
在弹出的API-KEY详情页面,单击复制,将API-KEY妥善保存至本地后,单击我已保存,关闭。如下:
很多小机灵看到这里就会发问了,我不复制保存,我点击"查看"不就行了吗?是的,你确实可以点击"查看"进行查阅,但你会面临安全认证,看到这是不是觉得还不如保存到本地呢。如下:
那还有的宝子们会说了,我可以再申请一个啊,免得认证这么麻烦。这里要注意的是主账号,有且只能同时拥有三个有效的API-KEY,而不是越多越好哟,还是复制保存本地为妥。
一键部署
有了上述准备的这些基础服务,接下来就可以通过ROS编排一键部署了,只需点击文案的"一键部署"直达ROS控制台。在ROS控制台,我们需要输入的是应用的登录密码,API-KEY以及ECS的规格和密码。如下:
点击下一步,确认信息,点击创建。如下:
可以通过编排详情清楚地看到整个部署过程。如下:
大概4分钟后,整个部署完成。如下:
点击输出,就可以访问到本次部署的服务了。如下:
服务体验
输入ROS编排中定义的用户名和密码进行登录。如下:
如果此处你忘记了设置的是啥,可以通过编排的参数进行查看。如下:
但有粗心的小伙伴要问了,我密码也不晓得咋整。你可单击命令执行,选择查看,跳转到ECS控制台,在ECS云助手的执行信息中可查看到密码。如下:
完成登录后,你就完成了AI绘画创作Web服务的部署。如下:
到这整个部署就结束了,你可以尽情把玩了。比如我输入一个“乌云密布、雷鸣闪电”,其他默认,看能生成啥。如下:
效果是这样的,还是不错的。从图片URL来看,是存放在OSS对象存储的,非常高效便捷。
涂鸦作画再来一张。风格选择3D卡通,输入"比卡丘",而后在画板上随意一画,如下:
生成效果如下,不得不说,这效果连我都没想到,还真不错。
人物风格重绘。挑选一张本地的图片,选择复古漫画。如下
原图是这样的。如下:
复古漫画的生成效果如下:这漫画中的小天使加的妙啊。
3D童话生成效果如下:还是简单风格比较容易实现。
二次元的生成效果如下:最大程度地还原了。
小清新的生成效果如下:画风很奇怪,这个一点也不清新。
未来科技的生成效果如下:这个风格整体还可以。
国画古风的生成效果如下:我很好奇图上的小姐姐是怎么加进来的。
将军圣战的生成效果如下:这个效果就特立独行了。
炫彩卡通的生成效果如下:画本身没问题,但当你看到原图时还是有点诧异的。
清雅国风的生成效果如下:虽然画风很符合,但这转变也太大了。
喜迎新年的生成效果如下:这效果有点让人意外啊,好好的小精灵变成了小姑娘,还有这鼻子也是很独特。
至于手动部署这里就不过多演示了,除了基础环境需要自己动手构建外,其余同一键部署,感兴趣的朋友可以点击前往了解更多详情。以下是手动部署相较于一键部署的差异项:
1、部署应用涉及的有关资源和服务
2、安装应用程序
释放资源
完成上述体验后,一定要记得释放资源,避免产生额外费用。释放资源非常简单,只需要在ROS控制台,找到对应的资源栈,点击操作列的删除即可。如下:
在弹出的窗口中,选择释放资源,点击确定。如下:
体验总结
1)整个部署过程非常丝滑顺畅。非常推荐通过一键部署来完成应用的构建。通过ROS编排可以非常高效地完成基础环境的搭建及应用的部署。此外,API调用体验也相当顺畅,通过灵积模型服务,你只需创建一个API-KEY即可实现调用,真正做到了快速集成。
整个部署过程都有非常好用的文档参照,即使是小白用户也可以轻松完成部署。每一个填空都有文字和链接指引,极大地方便了用户。比如:
2)通过ROS编排和灵积模型服务,我可以非常快捷方便地构建一套AI绘画web应用。在实际测试中,通义万相的服务响应时间表现良好,能够快速地响应用户的请求,保持稳定的性能。在模型泛化能力方面表现良好,基本能够准确理解不同领域的文本,并生成相应的图片。支持多种图片风格,包括但不限于卡通、国风、复古等,满足了用户多样化的需求。生成的图片质量高,细节丰富,色彩还原度高,除小清新和国画古风外,其他风格与预期效果基本相符。无论是清晰度还是美观度,都达到了较高的水平。
虽然应用提供的风格较多,但这里不得不提一嘴的是,如果支持用户自定义就更好了,可以让用户自定义,将常用的放置在前台,其他的折叠或隐藏到更多中。
此外这里的图片规格竟然没有标准1080P的,如果按照尺寸,那就提供更多尺寸让用户来选择。非常建议按照照片比例来,比如1:1、16:9。比如通义万相官网的这种:
还有就是风格重绘中,小清新、国画古风这两个风格是很难生成用户预期图片的,不晓得是底层模型应用的问题还是其他适配问题,用人物图和玩偶图都达不到预期效果。
3)改进和提升方面:
希望能够强化对图像细节的捕捉和生成,特别是在复杂场景和纹理丰富的物体上。
期待扩大可生成的图像风格和主题范围,比如更多样化的艺术风格、历史时期、文化背景、热点新闻等。
期待的新功能:
允许用户自定义和上传自己的风格或主题模板,来满足特定需求。
提供一个实时互动的界面,允许用户在生成过程中进行实时编辑和调整,如改变颜色、添加元素、调整构图等。
可以根据用户的历史记录和偏好,提供智能的图片生成建议或推荐。
除了静态图片外,支持生成动态图像、视频甚至3D模型。
允许用户通过语音、手势等多模态输入来控制图像的生成和编辑。
我所期待的通义万相不是一个简单的AI工具,而是一个实实在在可以帮助用户创造价值的AI助手。
4)我使用过百度的文心一格、腾讯的元宝、美图的WHEE,以及现在的通义万相。他们的首页界面如下:
从成本上来讲,各家都有免费的额度供用户日常使用,除元宝外,美图每日提供80个美豆、文心一格提供40格电量、通义万相提供50个灵感值。腾讯元宝的AI作画没发现有VIP模式,美图的WHEE和百度的文心一格都是创作一幅画耗费两个额度,阿里的通义万相是一个额度生成一副作品。单从数量上来看,通义万相是最划算的,相比其他家按数量消耗额度,它可以用一个额度同时生成四张图片。
从易用性上来看,腾讯元宝的界面是最简洁的,但可玩性也是最弱的。其他家均提供高级或更多模式,这里文心一格的把玩性是最强的,但也意味着它功能性是分散的,美图作为老派的图片编辑工具,在WHEE上主打一个WEB版的图片编辑风格,通义万相算是中规中矩,基本能满足用户创作需求。
从应用场景上来看,百度的问心一格算是最丰富的,它不仅可以选择的图片风格更多,功能性上也是最多的。腾讯元宝和美图WHEE的应用场景和功能是最少的,也就满足个基本创作。通义万相虽然选择性不是很多,模板提供的也有限,但好在创作质量很高,很大程度上可以满足用户的创作需求。通义万相在应用场景上的广泛性可能是一个重要的竞争优势,因为它能够覆盖更多的市场和用户群体。
综上,我愿意推荐团队使用通义万相来进行AI绘画创作。通义万相作为阿里云推出的AI大模型服务,其背后有强大的技术支持和丰富的资源。在服务质量上具有较高的保障。其服务可用性≥99%,能够为用户提供稳定可靠的服务体验。界面设计简洁清爽,操作流程直观易懂,无需复杂的技术背景即可快速上手,大大降低了用户的学习成本,提高了创作效率。在应用场景上具有广泛的适用性,能够覆盖广告、设计、游戏、电影等多个领域。对于需要高效、便捷地进行图像创作的团队来说,通义万相无疑是一个值得推荐的选择。