通义万相AI绘画创作体验评测

本文涉及的产品
视觉智能开放平台,图像资源包5000点
视觉智能开放平台,分割抠图1万点
NLP自然语言处理_高级版,每接口累计50万次
简介: 从使用者的角度解读通义万相AI绘画创作方案的优与劣

这是解决方案评测的第二篇,也是开发者新版评测的第二篇。希望大家可以踊跃参加,把你最真实的体验感受和建议分享出来。可点击下方链接前往评测活动首页:

解决方案评测|高效构建企业门户网站

解决方案评测|通义万相AI绘画创作

方案速览

从活动首页通过点击“查看方案”可一键直达解决方案详情页。方案从五个层面(是什么、为什么、用在哪、怎么做、需要啥)全方位阐述了如何使用阿里云服务来进行AI绘画创作。下面将从这五个方面详细解读下整体方案。

是什么

这一部分阐述方案是如何组合云产品服务来实现AI绘画创作的。下面是方案的拓扑:

image.png

此方案拓扑中,云服务器(ECS)被用于运行Web程序,来接收用户的图像处理请求;而对象存储(OSS)则用于存储某些场景中用户上传的图片,并通过签名的方式使得生成模型(通义万相/FaceChain)可以下载该图片,灵积模型服务(DashScope)通过提供基于HTTP接口的API,来实现应用程序的调用。

为什么

实现AI绘画创作的方式有很多种,为啥要选择使用阿里云服务,它能带给用户的能力和优势都有那些。方案从三个方面阐述了这一点。

  • 服务稳定易用

通义万相系列模型服务提供稳定生成高清图片的响应,以适应高并发和大流量,可用性不低于99%,确保了用户在任何时候都能顺畅地进行创作。

  • 集成与接入简单

提供了易于调用的API接口,简化了集成过程,并具有优秀的兼容性。背后的AI技术虽然非常复杂,但借助于灵积模型服务API,应用系统可以通过基于HTTP接口方便快速地接入,无需技术背景也可轻松上手。

  • 应用场景广泛

通义万相不仅可以将文本转换成图像,还能够进行涂鸦作画、人像风格化处理,以及人物写真生成等多种操作。这为用户在广告创意、艺术创作、游戏角色设计、社交媒体内容创作等多个领域提供了广泛的应用可能性。

用在哪

上面的优势说到了应用场景广泛,但具体都能用到那些场景呢,这部分内容着重阐述了这一点。方案总结了五大应用场景,分别是:

  • 艺术与设计创作

image.png

设计师和创意工作者可以快速生成概念草图、插画、海报、包装设计,甚至数字艺术品。创作者们只需输入创作的要点,利用文生图技术片刻就能获得成品,这大大地缩短了从构思到成品的时间,降低了创作门槛。此外文生图技术还提供了丰富的灵感源泉和高效的原型生成工具。

  • 广告与营销物料生成

image.png

文生图能够实现即时响应广告文案,生成符合品牌调性、产品特性和营销策略的视觉内容,节省了传统拍摄与后期制作的成本。广告内容可以根据实时热点迅速调整,实现高度定制化和敏捷营销。

  • 教育与培训资源制作

image.png

教育工作者和培训师利用文生图模型来创建生动、直观的教学素材。这有助于提升教学内容的吸引力和理解度,并且定制化的图像资源还能用于制作互动课件、电子教科书,从而丰富教学资源库。

  • 游戏与娱乐内容开发

image.png

游戏开发者可以借助文生图大模型快速生成游戏内的角色、道具和环境元素等美术资源,用于动态生成游戏NPC(非玩家角色)的外观或定制化玩家角色,从而增加游戏世界的多样性和沉浸感。

  • 时尚与服装设计

image.png

时尚设计师和电商平台利用文生图技术进行服装设计和虚拟试穿体验。电商平台可以结合用户身材数据,让用户输入文字描述想要的服装款式或风格,从而生成个性化虚拟试穿图片。

怎么做

在了解了方案是什么、方案有那些优势以及方案的应用场景后,该到了如何真正落地实施环节了,也就是实现上述功能,我要如何开展落地部署。这里方案提供了两种部署方式,有一键部署和手动部署。一键部署简化了底层基础环境的构建,可以大大节约部署时间;而手动部署却更加灵活,每一个环节都可以实现按需调整。下面将分别体验,这里就不做过多阐述。

需要啥

实施方案需要具备那些条件或者是需要提前准备那些必要服务呢,而如何以最经济的方式来获取这部分服务呢,这一部分就介绍了。实现方案的落地需要用到云服务器ECS、对象存储OSS以及接口API调用的灵积模型服务、生成模型通义万相。实现方案花费较大的就是云服务器ECS,方案也是很贴心地准备了优惠计划。如下:

image.png

如果你经常使用云服务器来部署或测试各类应用,还是建议购买这个99一年的套餐,它的好处是永久实现99一年。如果你是新用户,那恭喜你,你可以领取免费的ECS试用,而且规格还不错。如下:

image.png

部署实践

前提准备

在正式开始部署前,需要提前准备基础实施和云服务。如下:

  • 1个专有网络VPC:云服务器ECS创建于此VPC下。
  • 1台交换机:云服务器ECS创建于此交换机下。
  • 1台云服务器ECS:用于部署示例应用程序。
  • 1个对象存储OSS Bucket:用户存储用户上传的图片,并生成签名的URL提供给大模型进行下载。建议使用和ECS同地域下的OSS Bucket。
  • DashScope灵积模型服务:用于示例应用程序调用通义万相的服务。

接下来将按照方案提供的两种部署方式分别体验,先体验一键部署。点击方案的“一键部署”即可直达。如下:

对于如上的基础实施和云服务不知道如何选择的,尤其是针对云服务器ECS,可以参考如何选购ECS实例

第一步是你得有一个阿里云实名认证过的账号,这个这里就不展开阐述了,你可以通过手机号,邮箱进行注册并完成实名认证即可。如果你有账号且不是ECS的新用户,还需要确保账户余额不小于100元。这里着重演示如何开通灵积服务模型并获取API-KEY。

首次进入灵积服务控制台,会出现如下图的页面,显示未开通服务。

image.png

你只需点击页面上的"未开通",前往开通页面进行开通即可。如下:

image.png

开通之后再次返回控制台首页,就不会再显示未开通了。如果你之前使用过模型服务,还会在此进行显示。如下:

image.png

接下来需要创建API-KEY。在左侧导航栏单击管理中心 > API-KEY管理。单击创建新的API-KEY。如下:

image.png

在弹出的API-KEY详情页面,单击复制,将API-KEY妥善保存至本地后,单击我已保存,关闭。如下:

image.png

很多小机灵看到这里就会发问了,我不复制保存,我点击"查看"不就行了吗?是的,你确实可以点击"查看"进行查阅,但你会面临安全认证,看到这是不是觉得还不如保存到本地呢。如下:

image.png

那还有的宝子们会说了,我可以再申请一个啊,免得认证这么麻烦。这里要注意的是主账号,有且只能同时拥有三个有效的API-KEY,而不是越多越好哟,还是复制保存本地为妥。

一键部署

有了上述准备的这些基础服务,接下来就可以通过ROS编排一键部署了,只需点击文案的"一键部署"直达ROS控制台。在ROS控制台,我们需要输入的是应用的登录密码,API-KEY以及ECS的规格和密码。如下:

image.png

image.png

点击下一步,确认信息,点击创建。如下:

image.png

可以通过编排详情清楚地看到整个部署过程。如下:

image.png

大概4分钟后,整个部署完成。如下:

image.png

点击输出,就可以访问到本次部署的服务了。如下:

image.png

服务体验

输入ROS编排中定义的用户名和密码进行登录。如下:

image.png

如果此处你忘记了设置的是啥,可以通过编排的参数进行查看。如下:

image.png

但有粗心的小伙伴要问了,我密码也不晓得咋整。你可单击命令执行,选择查看,跳转到ECS控制台,在ECS云助手的执行信息中可查看到密码。如下:

image.png

完成登录后,你就完成了AI绘画创作Web服务的部署。如下:

image.png

到这整个部署就结束了,你可以尽情把玩了。比如我输入一个“乌云密布、雷鸣闪电”,其他默认,看能生成啥。如下:

image.png

效果是这样的,还是不错的。从图片URL来看,是存放在OSS对象存储的,非常高效便捷。

image.png

涂鸦作画再来一张。风格选择3D卡通,输入"比卡丘",而后在画板上随意一画,如下:

image.png

生成效果如下,不得不说,这效果连我都没想到,还真不错。

image.png

人物风格重绘。挑选一张本地的图片,选择复古漫画。如下

image.png

原图是这样的。如下:

image.png

复古漫画的生成效果如下:这漫画中的小天使加的妙啊。

image.png

3D童话生成效果如下:还是简单风格比较容易实现。

image.png

二次元的生成效果如下:最大程度地还原了。

image.png

小清新的生成效果如下:画风很奇怪,这个一点也不清新。

image.png

未来科技的生成效果如下:这个风格整体还可以。

image.png

国画古风的生成效果如下:我很好奇图上的小姐姐是怎么加进来的。

image.png

将军圣战的生成效果如下:这个效果就特立独行了。

image.png

炫彩卡通的生成效果如下:画本身没问题,但当你看到原图时还是有点诧异的。

image.png

清雅国风的生成效果如下:虽然画风很符合,但这转变也太大了。

image.png

喜迎新年的生成效果如下:这效果有点让人意外啊,好好的小精灵变成了小姑娘,还有这鼻子也是很独特。

image.png

至于手动部署这里就不过多演示了,除了基础环境需要自己动手构建外,其余同一键部署,感兴趣的朋友可以点击前往了解更多详情。以下是手动部署相较于一键部署的差异项:

1、部署应用涉及的有关资源和服务

image.png

2、安装应用程序

image.png

释放资源

完成上述体验后,一定要记得释放资源,避免产生额外费用。释放资源非常简单,只需要在ROS控制台,找到对应的资源栈,点击操作列的删除即可。如下:

image.png

在弹出的窗口中,选择释放资源,点击确定。如下:

image.png

体验总结

1)整个部署过程非常丝滑顺畅。非常推荐通过一键部署来完成应用的构建。通过ROS编排可以非常高效地完成基础环境的搭建及应用的部署。此外,API调用体验也相当顺畅,通过灵积模型服务,你只需创建一个API-KEY即可实现调用,真正做到了快速集成。

整个部署过程都有非常好用的文档参照,即使是小白用户也可以轻松完成部署。每一个填空都有文字和链接指引,极大地方便了用户。比如:

image.png

image.png

2)通过ROS编排和灵积模型服务,我可以非常快捷方便地构建一套AI绘画web应用。在实际测试中,通义万相的服务响应时间表现良好,能够快速地响应用户的请求,保持稳定的性能。在模型泛化能力方面表现良好,基本能够准确理解不同领域的文本,并生成相应的图片。支持多种图片风格,包括但不限于卡通、国风、复古等,满足了用户多样化的需求。生成的图片质量高,细节丰富,色彩还原度高,除小清新和国画古风外,其他风格与预期效果基本相符。无论是清晰度还是美观度,都达到了较高的水平。

虽然应用提供的风格较多,但这里不得不提一嘴的是,如果支持用户自定义就更好了,可以让用户自定义,将常用的放置在前台,其他的折叠或隐藏到更多中。

image.png

此外这里的图片规格竟然没有标准1080P的,如果按照尺寸,那就提供更多尺寸让用户来选择。非常建议按照照片比例来,比如1:1、16:9。比如通义万相官网的这种:

image.png

还有就是风格重绘中,小清新、国画古风这两个风格是很难生成用户预期图片的,不晓得是底层模型应用的问题还是其他适配问题,用人物图和玩偶图都达不到预期效果。

3)改进和提升方面:

  • 希望能够强化对图像细节的捕捉和生成,特别是在复杂场景和纹理丰富的物体上。

  • 期待扩大可生成的图像风格和主题范围,比如更多样化的艺术风格、历史时期、文化背景、热点新闻等。

    期待的新功能:

  • 允许用户自定义和上传自己的风格或主题模板,来满足特定需求。

  • 提供一个实时互动的界面,允许用户在生成过程中进行实时编辑和调整,如改变颜色、添加元素、调整构图等。

  • 可以根据用户的历史记录和偏好,提供智能的图片生成建议或推荐。

  • 除了静态图片外,支持生成动态图像、视频甚至3D模型。

  • 允许用户通过语音、手势等多模态输入来控制图像的生成和编辑。

我所期待的通义万相不是一个简单的AI工具,而是一个实实在在可以帮助用户创造价值的AI助手。

4)我使用过百度的文心一格、腾讯的元宝、美图的WHEE,以及现在的通义万相。他们的首页界面如下:

image.png

image.png

image.png

image.png

从成本上来讲,各家都有免费的额度供用户日常使用,除元宝外,美图每日提供80个美豆、文心一格提供40格电量、通义万相提供50个灵感值。腾讯元宝的AI作画没发现有VIP模式,美图的WHEE和百度的文心一格都是创作一幅画耗费两个额度,阿里的通义万相是一个额度生成一副作品。单从数量上来看,通义万相是最划算的,相比其他家按数量消耗额度,它可以用一个额度同时生成四张图片。

从易用性上来看,腾讯元宝的界面是最简洁的,但可玩性也是最弱的。其他家均提供高级或更多模式,这里文心一格的把玩性是最强的,但也意味着它功能性是分散的,美图作为老派的图片编辑工具,在WHEE上主打一个WEB版的图片编辑风格,通义万相算是中规中矩,基本能满足用户创作需求。

从应用场景上来看,百度的问心一格算是最丰富的,它不仅可以选择的图片风格更多,功能性上也是最多的。腾讯元宝和美图WHEE的应用场景和功能是最少的,也就满足个基本创作。通义万相虽然选择性不是很多,模板提供的也有限,但好在创作质量很高,很大程度上可以满足用户的创作需求。通义万相在应用场景上的广泛性可能是一个重要的竞争优势,因为它能够覆盖更多的市场和用户群体。

综上,我愿意推荐团队使用通义万相来进行AI绘画创作。通义万相作为阿里云推出的AI大模型服务,其背后有强大的技术支持和丰富的资源。在服务质量上具有较高的保障。其服务可用性≥99%,能够为用户提供稳定可靠的服务体验。界面设计简洁清爽,操作流程直观易懂,无需复杂的技术背景即可快速上手,大大降低了用户的学习成本,提高了创作效率。在应用场景上具有广泛的适用性,能够覆盖广告、设计、游戏、电影等多个领域。对于需要高效、便捷地进行图像创作的团队来说,通义万相无疑是一个值得推荐的选择。

相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
4天前
|
数据采集 人工智能 算法
AI 大模型助力客户对话分析评测
【10月更文挑战第22天】《AI大模型助力客户对话分析》解决方案清晰地概述了从客户对话数据中提取洞察的流程,包括数据收集、预处理、模型训练、意图识别、质量评估和决策支持等环节。然而,方案在具体实施方法、模型选择、性能评估和业务决策转化等方面描述较为简略,缺乏详细的操作步骤和工具推荐。此外,示例代码较为简略,部署过程中存在多渠道数据整合、模型训练参数设置等困惑。建议增加具体实施步骤、示例代码和注释,并加强与客户的沟通和反馈机制,以提高方案的可操作性和实际应用能力。
|
1天前
|
存储 人工智能 Serverless
AI大模型助力客户对话分析评测文章
在数字化时代,企业面临客户对话数据处理的挑战。阿里云推出的AI大模型助力客户对话分析方案,通过整合多种云服务,实现对话数据的自动化分析,提升服务质量和客户体验。本文将详细介绍该方案的优势与实际应用效果。
|
2天前
|
人工智能 Serverless
参与评测「AI 大模型助力客户对话分析」
本文介绍了作者参与《AI大模型助力客户对话分析》项目的实践与感受,通过阿里云提供的解决方案,从架构设计到具体实施,最终成功部署了AI质检应用,感受到了AI技术的魅力和便捷性。项目分为四步执行,虽然过程中遇到了一些小挑战,但总体上顺利完成了部署,实现了对话记录的质检与分析,有助于提高企业客户的服务效率。
|
3天前
|
人工智能 弹性计算 运维
触手可及:阿里云函数计算助力AI大模型的评测
阿里云推出的面向AI服务器的功能计算(Functional Computing, FC),专为AI应用提供弹性计算资源。该服务支持无服务器部署、自动资源管理和多语言支持,极大简化了AI应用的开发和维护。本文全面评测了FC for AI Server的功能特性、使用体验和成本效益,展示了其在高效部署、成本控制和安全性方面的优势,并通过具体应用案例和改进建议,展望了其未来发展方向。
33 4
|
1天前
|
机器学习/深度学习 数据采集 人工智能
文档智能 & RAG 让AI大模型更懂业务 —— 阿里云LLM知识库解决方案评测
随着数字化转型的深入,企业对文档管理和知识提取的需求日益增长。阿里云推出的文档智能 & RAG(Retrieval-Augmented Generation)解决方案,通过高效的内容清洗、向量化处理、精准的问答召回和灵活的Prompt设计,帮助企业构建强大的LLM知识库,显著提升企业级文档管理的效率和准确性。
|
2天前
|
人工智能 弹性计算 运维
《触手可及,函数计算玩转 AI 大模型》解决方案深度评测
本次评测全面评估了《触手可及,函数计算玩转 AI 大模型》解决方案,涵盖实践原理理解、文档清晰度、部署体验、优势展现及生产环境适用性。方案通过函数计算实现AI大模型的高效部署,但模型加载、性能指标和示例代码等方面需进一步细化。文档需增加步骤细化、FAQ、性能指标和示例代码,以提升用户体验。部署体验方面,建议明确依赖库、权限配置和配置文件模板。优势展现方面,建议增加性能对比、案例研究和成本分析。此外,为满足实际生产需求,建议增强高可用性、监控与日志、安全性和扩展性。
9 2
|
1天前
|
人工智能 数据挖掘 API
评测报告:AI大模型助力客户对话分析
《AI大模型助力客户对话分析》解决方案详细介绍了如何利用AI大模型进行语音识别、情感分析和关键词提取,帮助企业提升服务质量。方案内容清晰,但部分技术细节和环境配置说明有待完善。示例代码基本可用,但在特定配置和行业术语方面需进一步优化。总体而言,该方案在实际业务场景中表现出色,但仍需改进以提升用户体验。
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
AI 大模型助力客户对话分析评测
《AI大模型助力客户对话分析》解决方案通过先进的AI技术实现高效客服对话分析。方案详细阐述了利用自然语言处理和机器学习技术解析客户对话的方法,并提供了具体实施步骤。然而,在技术细节、案例研究和定制化指导方面仍有改进空间,建议增强技术文档、增加案例研究并提供更多的定制化支持。
11 1
|
3天前
|
人工智能 弹性计算 自然语言处理
《触手可及,函数计算玩转 AI 大模型》解决方案体验与部署评测
在AI技术快速发展的背景下,大模型正推动各行业的智能化转型。企业为抓住机遇,纷纷寻求部署AI大模型以满足特定业务需求。阿里云函数计算凭借按量付费、卓越弹性和快速交付等优势,为企业提供了高效、安全的AI大模型部署方案。本文将详细介绍阿里云函数计算的技术解决方案及其在文生文、图像生成和语音生成等领域的应用实例,展示其在降低成本、提高效率和增强灵活性方面的显著优势。
|
4天前
|
数据采集 人工智能 监控
文档智能 & RAG让AI大模型更懂业务评测
【10月更文挑战第22天】《文档智能 & RAG让AI大模型更懂业务》解决方案通过文档内容清洗、向量化、问答内容召回、Prompt设计和LLM问答处理等步骤,实现了高效精准的问答系统。方案描述清晰,但在某些技术细节上略显简略。部署过程顺利,未遇明显问题。该方案适用于企业知识库、法律文档库等场景,但在数据安全、可扩展性等方面仍有改进空间。

热门文章

最新文章