通义万相AIGC快速生成图像体验测评

简介: 通义万相AI绘画创作部署与体验。

在这个数字化飞速发展的时代,AI技术正以前所未有的速度渗透进我们生活的每一个角落,而图像生成领域无疑是其中最引人注目的亮点之一。近日,我有幸体验了基于自研通义万相AIGC技术的Web服务,这款服务以其强大的文本到图像、涂鸦转换、人像风格重塑及人物写真创建等功能,为艺术创作与数字内容开发带来了革命性的变革。以下是我对这次测试体验的详细报告。


1、资源准备

本次需要的云产品包括ECS、对象存储OSS、DashScope灵积模型服务

image.png

开通DashScope服务并获取API-KEY,后面在云资源配置时需要。


image.png

image.png

单击创建新的API-KEY。在弹出的API-KEY详情页面,单击复制,将API-KEY妥善保存至本地后,单击我已保存,关闭。

image.png


2、一键部署


如下图所示,资源栈的名称是自动生成的,配置应用登录的用户名和密码。输入之前创建的DashScope API-KEY,选择ecs.g8a规格的ECS,输入实例密码,点击下一步开始创建。

image.png


image.png


可以在状态处查看创建的进度。

image.png

大概5-6分钟之后就创建完成了。在“输出”中点击体验的URL网址。

image.png


在“参数”的菜单中找到DemoUserName。


image.png

在体验的网址上输入上一步中的用户名和之前部署时设置的密码,即可登录。

image.png

3、功能体验

登录之后可以看到有“文本生成图像”、“涂鸦作画”、“人像风格重绘”。


体验文本生成图像,输入提示词:香港回归27年纪念日。提示需要15-30秒,但等了5分钟也没有出图。难道是这些关键词敏感?

image.png


把提示词换成“蓝天白云”,很快就出图了。也可以切换生成图片的风格包括:3D卡通、动画、中国话、扁平插画、油画、素描、水彩。

image.png

涂鸦作画,风格选择水彩,内容描述向日葵,进行涂鸦作画,生成的画要比涂鸦更丰富。

image.png

image.png


人像风格重绘,需要上传一张人像图片,这里选择使用国画古风的风格。


image.png


4、资源释放


登录ROS控制台在左侧导航栏,选择资源栈。在资源栈页面的顶部选择部署的资源栈所在地域,找到资源栈,然后在其右侧操作列,单击删除。



image.png

在删除资源栈对话框,选择删除方式为释放资源,然后单击确定,根据提示完成资源释放。


image.png

删除完成。

image.png


此外,针对API-KEY若长期不再使用,建议删除。注意保密。


image.png


5、测评体验


以下是针对测试体验中的一些问题及想法:


  • 测试过程中针对使用的ECS资源都有价格评估,方便使用者进行成本管理及成本预期。不知道图像生成的张数多少是否和计费有关系,还是只需要支付ECS和OSS的费用即可?
  • 部署过程比较简单,在文本生成图像时使用的提示词可能有敏感词,等了很长时间也没有出图。希望这个有敏感词的时候可以做标红提示。
  • 目前可选的图片风格还是比较有限,希望后面可以能自定义图片风格。
  • 针对生成的图像希望以后还可以根据提示词来局部调整。
  • 是否可以增加以图生图和图片合成两种场景。
  • 提示词反向学习,是否能上传一种照片来生成提示词,再修改这些提示词之后,重新生成自己想要的图片。


整体来说通义万相AIGC技术的Web服务无疑是一次成功的尝试,它以其强大的图像生成能力和丰富的功能选项,为艺术家、设计师以及广大用户提供了一个高效、便捷的创作平台。无论是专业人士还是业余爱好者,都能在这个平台上找到属于自己的创作乐趣和灵感。同时,该服务在广告营销、教育、游戏开发等多个领域的应用潜力巨大,有望为这些行业带来更加丰富的视觉内容和更优秀的用户体验。


相关实践学习
2分钟自动化部署人生模拟器
本场景将带你借助云效流水线Flow实现人生模拟器小游戏的自动化部署
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
30天前
|
编解码 物联网 API
"揭秘SD文生图的神秘面纱:从选择模型到生成图像,一键解锁你的创意图像世界,你敢来挑战吗?"
【10月更文挑战第14天】Stable Diffusion(SD)文生图功能让用户通过文字描述生成复杂图像。过程包括:选择合适的SD模型(如二次元、2.5D、写实等),编写精准的提示词(正向和反向提示词),设置参数(迭代步数、采样方法、分辨率等),并调用API生成图像。示例代码展示了如何使用Python实现这一过程。
62 4
|
3月前
|
数据采集 机器学习/深度学习 人工智能
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记
这段内容介绍了一个使用Stable Diffusion与LoRA技术创建定制化二次元图像生成模型的全流程。首先,通过安装必要的软件包如Data-Juicer和DiffSynth-Studio准备开发环境。接着,下载并处理二次元图像数据集,利用Data-Juicer进行数据清洗和筛选,确保图像质量和尺寸的一致性。随后,训练一个针对二次元风格优化的LoRA模型,并调整参数以控制模型复杂度。完成训练后,加载模型并通过精心设计的提示词(prompt)生成一系列高质量的二次元图像,展示模型对细节和艺术风格的理解与再现能力。整个过程展示了从数据准备到模型训练及结果生成的完整步骤,为定制化图像提供了方向。
|
4月前
|
存储 自然语言处理 API
通义万相AIGC技术Web服务体验评测
随着人工智能技术的不断进步,图像生成技术已成为创意产业的一大助力。通义万相AIGC技术,作为阿里云推出的一项先进技术,旨在通过文本到图像、涂鸦转换、人像风格重塑及人物写真创建等功能,加速艺术家和设计师的创作流程。本文将详细评测这一技术的实际应用体验。
189 4
|
3月前
|
前端开发 API C#
使用Unity 接入 Stable-Diffusion-WebUI的 文生图api 并生成图像
本文介绍了如何将Unity游戏引擎与Stable-Diffusion-WebUI的文生图API相结合,实现在Unity中生成图像的功能。内容包括启动Stable Diffusion的API设置、在Unity中创建脚本与UI配置,以及通过按钮点击事件触发图像生成的详细步骤和测试过程。
使用Unity 接入 Stable-Diffusion-WebUI的 文生图api 并生成图像
|
2月前
|
JSON Serverless 数据格式
函数计算生成冰冻风格的AIGC图像
【9月更文挑战第05天】
49 3
|
3月前
|
数据采集 机器学习/深度学习 人工智能
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记
这段内容介绍了一个使用LoRA技术定制Stable Diffusion模型的工作流程。首先定义了提示词的结构,接着概述了LoRA作为轻量级微调方法的角色。ComfyUI作为一个图形化工具,简化了AI模型的配置与操作。示例脚本展示了如何通过Data-Juicer和DiffSynth-Studio进行数据准备、模型训练,并最终生成特定风格的二次元图像。通过不同的种子和提示词,生成了一系列具有一致风格但内容各异的高质量二次元角色图像。
|
4月前
|
存储 人工智能 弹性计算
解决方案评测|通义万相AI绘画创作测评
解决方案评测|通义万相AI绘画创作测评
297 12
|
4月前
|
人工智能 编解码 API
通义万相AIGC技术测评报告
**摘要:** 通义万相是阿里云的AI绘画模型,提供清晰的部署指南和易用的API,适合新手。资源部署耗时约10分钟,API响应快,支持多种风格图片生成,适用于广告、媒体等领域。产品性价比高,功能包括文本到图像转换等,但仍有改进空间,如增加服装纹理选项、互动功能和更多API接口。建议完善功能、加强推广和降低成本以吸引更多用户。[链接](https://developer.aliyun.com/topic/tongyi-wanxiang?spm=a2c6h.27063436.J_6978680750.5.3a774f461hv8qD)
221 6
|
3月前
|
算法 物联网 Serverless
一键打造你的定制化AIGC文生图工具
【8月更文挑战第2天】一键打造你的定制化AIGC文生图工具
135 0
|
6月前
|
机器学习/深度学习 自然语言处理
文生图模型-Stable Diffusion | AIGC
所谓的生成式模型就是通过文本或者随机采样的方式来得到一张图或者一段话的模型,比如文生图,顾名思义通过文本描述来生成图像的过程。当前流行的文生图模型,如DALE-2, midjourney以及今天要介绍的Stable Diffusion,这3种都是基于Diffusion扩散模型【1月更文挑战第6天】
834 0

热门文章

最新文章