使用 PAI-DSW x Free Prompt Editing图像编辑算法,开发个人AIGC绘图小助理

简介: 使用 PAI-DSW x Free Prompt Editing图像编辑算法,开发个人AIGC绘图小助理

教程简述


本教程中,您将学习在阿里云交互式建模平台PAI-DSW x Free Prompt Editing(CVPR2024中选论文算法)图像编辑算法,开发个人AIGC绘图小助理,实现文本驱动的图像编辑功能单卡即可完成AIGC图片风格变化、背景变化和主体变化等功能让我们一同开启这场旅程,为您的图像编辑添上无限可能性的翅膀吧。


FreePromptEditing是一个基于文本驱动的Stable Diffusion图像编辑算法,用户可以直接通过输入Edit Prompt对生成图像或者真实图像进行编辑。


教程使用Free Prompt Editing图像编辑算法,实现的图片风格变化对比:


image.png


基于本教程可以体验:


👍
新用户可免费领取价值万元的人工智能平台PAI试用资源
👍
学会如何快速在阿里云上创建一个交互式训练开发环境
👍
学会如何在DSW中编译代码、启动WebUI
👍
学会如何在DSW开发个人AIGC绘图小助理


答疑交流群


如需技术支持,请在钉钉搜索群号「」,加入群聊


使用PAI-DSW开发AIGC绘图小助理



准备环境和资源

1.领取交互式建模PAI-DSW免费试用权益


前往活动页面,领取交互式建模PAI-DSW产品免费试用资源包

image.png

  • 对于交互式建模 PAI-DSW 的新用户,阿里云提供了5000CU*H 的免费试用资源,可以在活动页面中直接领取(试用规则请参照阿里云免费试用:https://free.aliyun.com/);或可以购买交互式建模 PAI-DSW 资源包参与活动,购买链接:PAI-DSW 100CU*H资源包,价格 59 元起;如不购买资源包,PAI-DSW 会按量进行计费,计费标准详见阿里云产品定价。

2. 创建PAI-DSW实例

image.png

  • 点击新建实例(如上图)
  • 自定义输入实例名称(如下图)
  • 选择实例机型,GPU推荐使用A10或者V100(16GB)及以上配置,GPU分类-ecs.gn6v-c8g1.2xlarge(支持资源包抵扣),若无此机型库存可更换地域尝试;

image.png

  • 选择镜像:pytorch-develop:1.12-gpu-py39-cu113-ubuntu20.04

image.png

  • 点击“下一步”

image.png

  • 确认【资源配置】及【镜像】如图所示,点击创建实例

image.png

  • 约等到3-5分钟,实例状态变为「运行中」,实例创建完成;

image.png

3. 在DSW中打开教程文件

  • 单击需要打开的实例操作列下的打开,进入PAI-DSW实例开发环境。
  • Notebook页签的Launcher页面,单击前往浏览 Gallery,打开Gallery页面

image.png

  • 在DSW Gallery页面中,搜索并找到AI美术师:图像编辑的无限可能教程,单击教程卡片中的在DSW中打开。

image.png

  • 完成以上步骤,顺利打开AI美术师:图像编辑的无限可能Notebook最佳实践

image.png

4. 运行教程文件

  • 您可以直接看到教程文本,您可以在教程文件中直接运行每个代码片段。当成功运行结束一个步骤命令后,再顺次运行下个步骤的命令。

image.png

  • 本教程一共3个运行步骤:
  1. 准备工做
  2. 下载和安装环境
  3. 运行WebUI
  • 当第3步运行WebUI运行完成后,在返回的运行详情结果中单击URL链接,进入WebUI页面。请发挥你的创意,生成您想要得到的图像吧!

image.png

完成部署,开始体验AI图像编辑的无限可能


运行成功后打开链接,请发挥你的创意,修改您想要得到的图像吧!

WebUI 界面可调参数说明


-- Attention map Replacing Scale ratio of Editing 取值0.0-1.0,越大保留原图细节越多,建议值0.4-0.8-- DDIM Steps 去噪步数-- Layers to Edit 编辑的层数,建议值 32,16-- Image Resolution 图像分辨率,建议值512-- CFG Scale 文本提示控制强度,建议值 7.5-- Seed 随机种子


我们已经在WebUI 预置了上述的可调参数,并提供了示例图像,编辑文本,以及负文本,您可以直接点击一键运行。

1. 进入WebUI界面

点击运行,稍等片刻后,在下方区域会输出原图像和编辑结果图像。

2. 更改图像背景

可以看到,基于FreePromptEditing,算法很好地理解了输入的编辑指导文本,将图像的背景转移到了森林中。

Edit Prompt(编辑文本):a Chinese building on the forest

Negative Prompt(负文本): nsfw, worst quality, low quality, normal quality, lowres, watermark

image.png

您也可以将示例的建筑搬到纽约,示例如下:

Edit Prompt(编辑文本):a Chinese building in New York City

Negative Prompt(负文本): nsfw, worst quality, low quality, normal quality, lowres, watermark

image.png

3. 更改图像风格

除了使用修改之外,我们也可以随意发挥想象力,通过设计编辑提示词,来改变原图的图像风格。下面展示些创意示例,仅仅修改了提示词,其他配置参数跟上文一致.

编辑文本:a kids drawing of a cat (儿童画的一只猫)

image.png

编辑文本:Van Gogh style architectural picture (梵高风格建筑图片)

image.png

成为无拘无束的创意画师,让您的幻想遨游色彩的世界,现在就启程,为您的图像添加无限的可能吧。


♥♥ 您可以自由发挥AI绘画新创作,本次活动要求:任意上传一张照片,变为梵高风格,分享前后对比图

🎁🎁作品完成上传活动页面,邀请好友一起参与活动,有机会赢取小度智能屏X9、米家小白摄像头、天猫魔投等好礼


image.png

资源清理及后续

1. 清理

  • 在实验完成后,可前往对应产品控制台,停止或删除实例(两个操作均可),避免实例持续处于运行中,在超出免费试用额度后,带来额外的扣费

image.png

  • 后续仍考虑使用该实例>>停止;后续不再使用该实例>>删除,成功停止后即停止资源消耗。

2. 后续

在试用有效期期间,您还可以继续使用DSW实例进行模型训练和推理验证。


相关文章
|
存储 人工智能 云栖大会
【云栖大会】阿里云设计中心 × 教育部协同育人项目成果展,PAI ArtLab助力高校AIGC教育新路径
【云栖大会】阿里云设计中心 × 教育部协同育人项目成果展,PAI ArtLab助力高校AIGC教育新路径
|
机器学习/深度学习 人工智能 自然语言处理
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
阿里云人工智能平台 PAI 团队发表的图像编辑算法论文在 MM2024 上正式亮相发表。ACM MM(ACM国际多媒体会议)是国际多媒体领域的顶级会议,旨在为研究人员、工程师和行业专家提供一个交流平台,以展示在多媒体领域的最新研究成果、技术进展和应用案例。其主题涵盖了图像处理、视频分析、音频处理、社交媒体和多媒体系统等广泛领域。此次入选标志着阿里云人工智能平台 PAI 在图像编辑算法方面的研究获得了学术界的充分认可。
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
|
机器学习/深度学习 人工智能 算法
【MM2024】面向 StableDiffusion 的多目标图像编辑算法 VICTORIA
阿里云人工智能平台 PAI 团队与华南理工大学合作在国际多媒体顶级会议 ACM MM2024 上发表 VICTORIA 算法,这是一种面向 StableDiffusion 的多目标图像编辑算法。VICTORIA 通过文本依存关系来修正图像编辑过程中的交叉注意力图,从而确保关系对象的一致性,支持用户通过修改描述性提示一次性编辑多个目标。
|
人工智能 编解码 算法
使用PAI-DSW x Free Prompt Editing开发个人AIGC绘图小助理
本文介绍如何借助阿里云PAI-DSW及Free Prompt Editing算法开发个性化AIGC绘图助手,实现图像智能编辑与生成。首先需领取PAI-DSW免费试用资源并创建实例;随后通过运行教程文件完成环境搭建。WebUI界面预设了多种参数供调整,如图像分辨率、编辑层数量等,支持更改图像背景与风格等功能演示。完成实验后应及时清理资源以避免额外费用。此外,参与阿里云开发者社区的“AIGC绘图小助手”活动,不仅可获得免费云资源试用,还有机会赢得桌面折叠风扇、小度智能屏X9等礼品。
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
AIGC技术深度解析:生成式AI的革命性突破与产业应用实战
蒋星熠Jaxonic,AI技术探索者,深耕生成式AI领域。本文系统解析AIGC核心技术,涵盖Transformer架构、主流模型对比与实战应用,分享文本生成、图像创作等场景的实践经验,展望技术趋势与产业前景,助力开发者构建完整认知体系,共赴AI原生时代。
1414 2
|
机器学习/深度学习 人工智能 自然语言处理
AIGC技术发展与应用实践(一文读懂AIGC)
AIGC(人工智能生成内容)是利用AI技术生成文本、图像、音频、视频等内容的重要领域。其发展历程包括初期探索、应用拓展和深度融合三大阶段,核心技术涵盖数据收集、模型训练、内容生成、质量评估及应用部署。AIGC在内容创作、教育、医疗、游戏、商业等领域广泛应用,未来将向更大规模、多模态融合和个性化方向发展。但同时也面临伦理法律和技术瓶颈等挑战,需在推动技术进步的同时加强规范与监管,以实现健康可持续发展。
|
机器学习/深度学习 人工智能 自然语言处理
技术创新领域,AI(AIGC)是否会让TRIZ“下岗”?
法思诺创新直播间探讨了AI(AIGC)是否将取代TRIZ的问题。专家赵敏认为,AI与TRIZ在技术创新领域具有互补性,结合两者更务实。TRIZ提供结构化分析框架,AI加速数据处理和方案生成。DeepSeek、Gemini等AI也指出,二者各有优劣,应在复杂创新中协同使用。企业应建立双轨知识库,重构人机混合创新流程,实现全面升级。结论显示,AI与TRIZ互补远超竞争,结合二者是未来技术创新的关键。
494 0
|
人工智能 搜索推荐 数据库
实时云渲染技术赋能AIGC,开启3D内容生态黄金时代
在AIGC技术革命的推动下,3D内容生态将迎来巨大变革。实时云渲染与Cloud XR技术将在三维数字资产的上云、交互及传播中扮演关键角色,大幅提升生产效率并降低门槛。作为云基础设施厂商,抓住这一机遇将加速元宇宙的构建与繁荣。AIGC不仅改变3D内容的生成方式,从手工转向自动生成,还将催生更多3D创作工具和基础设施,进一步丰富虚拟世界的构建。未来,通过文本输入即可生成引人注目的3D环境,多模态模型的应用将极大拓展创作的可能性。
|
人工智能 自然语言处理 数据可视化
什么是AIGC?如何使用AIGC技术辅助办公?
2分钟了解AIGC技术及其如何提高日常办公效率!
4487 4
什么是AIGC?如何使用AIGC技术辅助办公?
|
编解码 人工智能 算法
国家扶持超高清产业背景下:视频云AIGC的超高清技术实践
本次分享由阿里云视频云高级产品解决方案架构师陈震主讲,聚焦国家扶持超高清产业背景下,视频云AIGC的超高清技术实践。内容涵盖超高清产业发展趋势与挑战、阿里视频云的应对方案及应用案例。通过全链路超高清解决方案,结合AI、云计算等技术,提供从内容生产、传输到播放的完整支持,助力行业应对超高清视频带来的技术与市场挑战。
679 0

热门文章

最新文章