通义万相AIGC快速生成图像体验测评

简介: 通义万相AI绘画创作部署与体验。

在这个数字化飞速发展的时代,AI技术正以前所未有的速度渗透进我们生活的每一个角落,而图像生成领域无疑是其中最引人注目的亮点之一。近日,我有幸体验了基于自研通义万相AIGC技术的Web服务,这款服务以其强大的文本到图像、涂鸦转换、人像风格重塑及人物写真创建等功能,为艺术创作与数字内容开发带来了革命性的变革。以下是我对这次测试体验的详细报告。


1、资源准备

本次需要的云产品包括ECS、对象存储OSS、DashScope灵积模型服务

image.png

开通DashScope服务并获取API-KEY,后面在云资源配置时需要。


image.png

image.png

单击创建新的API-KEY。在弹出的API-KEY详情页面,单击复制,将API-KEY妥善保存至本地后,单击我已保存,关闭。

image.png


2、一键部署


如下图所示,资源栈的名称是自动生成的,配置应用登录的用户名和密码。输入之前创建的DashScope API-KEY,选择ecs.g8a规格的ECS,输入实例密码,点击下一步开始创建。

image.png


image.png


可以在状态处查看创建的进度。

image.png

大概5-6分钟之后就创建完成了。在“输出”中点击体验的URL网址。

image.png


在“参数”的菜单中找到DemoUserName。


image.png

在体验的网址上输入上一步中的用户名和之前部署时设置的密码,即可登录。

image.png

3、功能体验

登录之后可以看到有“文本生成图像”、“涂鸦作画”、“人像风格重绘”。


体验文本生成图像,输入提示词:香港回归27年纪念日。提示需要15-30秒,但等了5分钟也没有出图。难道是这些关键词敏感?

image.png


把提示词换成“蓝天白云”,很快就出图了。也可以切换生成图片的风格包括:3D卡通、动画、中国话、扁平插画、油画、素描、水彩。

image.png

涂鸦作画,风格选择水彩,内容描述向日葵,进行涂鸦作画,生成的画要比涂鸦更丰富。

image.png

image.png


人像风格重绘,需要上传一张人像图片,这里选择使用国画古风的风格。


image.png


4、资源释放


登录ROS控制台在左侧导航栏,选择资源栈。在资源栈页面的顶部选择部署的资源栈所在地域,找到资源栈,然后在其右侧操作列,单击删除。



image.png

在删除资源栈对话框,选择删除方式为释放资源,然后单击确定,根据提示完成资源释放。


image.png

删除完成。

image.png


此外,针对API-KEY若长期不再使用,建议删除。注意保密。


image.png


5、测评体验


以下是针对测试体验中的一些问题及想法:


  • 测试过程中针对使用的ECS资源都有价格评估,方便使用者进行成本管理及成本预期。不知道图像生成的张数多少是否和计费有关系,还是只需要支付ECS和OSS的费用即可?
  • 部署过程比较简单,在文本生成图像时使用的提示词可能有敏感词,等了很长时间也没有出图。希望这个有敏感词的时候可以做标红提示。
  • 目前可选的图片风格还是比较有限,希望后面可以能自定义图片风格。
  • 针对生成的图像希望以后还可以根据提示词来局部调整。
  • 是否可以增加以图生图和图片合成两种场景。
  • 提示词反向学习,是否能上传一种照片来生成提示词,再修改这些提示词之后,重新生成自己想要的图片。


整体来说通义万相AIGC技术的Web服务无疑是一次成功的尝试,它以其强大的图像生成能力和丰富的功能选项,为艺术家、设计师以及广大用户提供了一个高效、便捷的创作平台。无论是专业人士还是业余爱好者,都能在这个平台上找到属于自己的创作乐趣和灵感。同时,该服务在广告营销、教育、游戏开发等多个领域的应用潜力巨大,有望为这些行业带来更加丰富的视觉内容和更优秀的用户体验。


相关实践学习
2分钟自动化部署人生模拟器
本场景将带你借助云效流水线Flow实现人生模拟器小游戏的自动化部署
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
2月前
|
编解码 物联网 API
"揭秘SD文生图的神秘面纱:从选择模型到生成图像,一键解锁你的创意图像世界,你敢来挑战吗?"
【10月更文挑战第14天】Stable Diffusion(SD)文生图功能让用户通过文字描述生成复杂图像。过程包括:选择合适的SD模型(如二次元、2.5D、写实等),编写精准的提示词(正向和反向提示词),设置参数(迭代步数、采样方法、分辨率等),并调用API生成图像。示例代码展示了如何使用Python实现这一过程。
107 4
|
29天前
|
算法 Serverless
通过函数计算部署ComfyUI以实现一个AIGC图像生成系统
快来报名参与ComfyUI活动,体验一键部署模型,生成粘土风格作品赢取体脂秤。活动时间从即日起至2024年12月13日24:00:00,每个工作日限量50个,先到先得!访问活动页面了解更多详情。
151 54
|
4月前
|
数据采集 机器学习/深度学习 人工智能
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记
这段内容介绍了一个使用Stable Diffusion与LoRA技术创建定制化二次元图像生成模型的全流程。首先,通过安装必要的软件包如Data-Juicer和DiffSynth-Studio准备开发环境。接着,下载并处理二次元图像数据集,利用Data-Juicer进行数据清洗和筛选,确保图像质量和尺寸的一致性。随后,训练一个针对二次元风格优化的LoRA模型,并调整参数以控制模型复杂度。完成训练后,加载模型并通过精心设计的提示词(prompt)生成一系列高质量的二次元图像,展示模型对细节和艺术风格的理解与再现能力。整个过程展示了从数据准备到模型训练及结果生成的完整步骤,为定制化图像提供了方向。
|
5月前
|
存储 自然语言处理 API
通义万相AIGC技术Web服务体验评测
随着人工智能技术的不断进步,图像生成技术已成为创意产业的一大助力。通义万相AIGC技术,作为阿里云推出的一项先进技术,旨在通过文本到图像、涂鸦转换、人像风格重塑及人物写真创建等功能,加速艺术家和设计师的创作流程。本文将详细评测这一技术的实际应用体验。
203 4
|
29天前
|
弹性计算 算法 搜索推荐
活动实践 | 通过函数计算部署ComfyUI以实现一个AIGC图像生成系统
ComfyUI是基于节点工作流稳定扩散算法的新一代WebUI,支持高质量图像生成。用户可通过阿里云函数计算快速部署ComfyUI应用模板,实现个性化定制与高效服务。首次生成图像因冷启动需稍长时间,之后将显著加速。此外,ComfyUI允许自定义模型和插件,满足多样化创作需求。
|
4月前
|
前端开发 API C#
使用Unity 接入 Stable-Diffusion-WebUI的 文生图api 并生成图像
本文介绍了如何将Unity游戏引擎与Stable-Diffusion-WebUI的文生图API相结合,实现在Unity中生成图像的功能。内容包括启动Stable Diffusion的API设置、在Unity中创建脚本与UI配置,以及通过按钮点击事件触发图像生成的详细步骤和测试过程。
|
3月前
|
JSON Serverless 数据格式
函数计算生成冰冻风格的AIGC图像
【9月更文挑战第05天】
58 3
|
4月前
|
数据采集 机器学习/深度学习 人工智能
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记
这段内容介绍了一个使用LoRA技术定制Stable Diffusion模型的工作流程。首先定义了提示词的结构,接着概述了LoRA作为轻量级微调方法的角色。ComfyUI作为一个图形化工具,简化了AI模型的配置与操作。示例脚本展示了如何通过Data-Juicer和DiffSynth-Studio进行数据准备、模型训练,并最终生成特定风格的二次元图像。通过不同的种子和提示词,生成了一系列具有一致风格但内容各异的高质量二次元角色图像。
|
5月前
|
存储 人工智能 弹性计算
解决方案评测|通义万相AI绘画创作测评
解决方案评测|通义万相AI绘画创作测评
330 12
|
5月前
|
人工智能 编解码 API
通义万相AIGC技术测评报告
**摘要:** 通义万相是阿里云的AI绘画模型,提供清晰的部署指南和易用的API,适合新手。资源部署耗时约10分钟,API响应快,支持多种风格图片生成,适用于广告、媒体等领域。产品性价比高,功能包括文本到图像转换等,但仍有改进空间,如增加服装纹理选项、互动功能和更多API接口。建议完善功能、加强推广和降低成本以吸引更多用户。[链接](https://developer.aliyun.com/topic/tongyi-wanxiang?spm=a2c6h.27063436.J_6978680750.5.3a774f461hv8qD)
249 6

热门文章

最新文章