在这个数字化飞速发展的时代,AI技术正以前所未有的速度渗透进我们生活的每一个角落,而图像生成领域无疑是其中最引人注目的亮点之一。近日,我有幸体验了基于自研通义万相AIGC技术的Web服务,这款服务以其强大的文本到图像、涂鸦转换、人像风格重塑及人物写真创建等功能,为艺术创作与数字内容开发带来了革命性的变革。以下是我对这次测试体验的详细报告。
1、资源准备
本次需要的云产品包括ECS、对象存储OSS、DashScope灵积模型服务。
开通DashScope服务并获取API-KEY,后面在云资源配置时需要。
单击创建新的API-KEY。在弹出的API-KEY详情页面,单击复制,将API-KEY妥善保存至本地后,单击我已保存,关闭。
2、一键部署
如下图所示,资源栈的名称是自动生成的,配置应用登录的用户名和密码。输入之前创建的DashScope API-KEY,选择ecs.g8a规格的ECS,输入实例密码,点击下一步开始创建。
可以在状态处查看创建的进度。
大概5-6分钟之后就创建完成了。在“输出”中点击体验的URL网址。
在“参数”的菜单中找到DemoUserName。
在体验的网址上输入上一步中的用户名和之前部署时设置的密码,即可登录。
3、功能体验
登录之后可以看到有“文本生成图像”、“涂鸦作画”、“人像风格重绘”。
体验文本生成图像,输入提示词:香港回归27年纪念日。提示需要15-30秒,但等了5分钟也没有出图。难道是这些关键词敏感?
把提示词换成“蓝天白云”,很快就出图了。也可以切换生成图片的风格包括:3D卡通、动画、中国话、扁平插画、油画、素描、水彩。
涂鸦作画,风格选择水彩,内容描述向日葵,进行涂鸦作画,生成的画要比涂鸦更丰富。
人像风格重绘,需要上传一张人像图片,这里选择使用国画古风的风格。
4、资源释放
登录ROS控制台。在左侧导航栏,选择资源栈。在资源栈页面的顶部选择部署的资源栈所在地域,找到资源栈,然后在其右侧操作列,单击删除。
在删除资源栈对话框,选择删除方式为释放资源,然后单击确定,根据提示完成资源释放。
删除完成。
此外,针对API-KEY若长期不再使用,建议删除。注意保密。
5、测评体验
以下是针对测试体验中的一些问题及想法:
- 测试过程中针对使用的ECS资源都有价格评估,方便使用者进行成本管理及成本预期。不知道图像生成的张数多少是否和计费有关系,还是只需要支付ECS和OSS的费用即可?
- 部署过程比较简单,在文本生成图像时使用的提示词可能有敏感词,等了很长时间也没有出图。希望这个有敏感词的时候可以做标红提示。
- 目前可选的图片风格还是比较有限,希望后面可以能自定义图片风格。
- 针对生成的图像希望以后还可以根据提示词来局部调整。
- 是否可以增加以图生图和图片合成两种场景。
- 提示词反向学习,是否能上传一种照片来生成提示词,再修改这些提示词之后,重新生成自己想要的图片。
整体来说通义万相AIGC技术的Web服务无疑是一次成功的尝试,它以其强大的图像生成能力和丰富的功能选项,为艺术家、设计师以及广大用户提供了一个高效、便捷的创作平台。无论是专业人士还是业余爱好者,都能在这个平台上找到属于自己的创作乐趣和灵感。同时,该服务在广告营销、教育、游戏开发等多个领域的应用潜力巨大,有望为这些行业带来更加丰富的视觉内容和更优秀的用户体验。