使用 PAI-DSW x Free Prompt Editing图像编辑算法,开发个人AIGC绘图小助理

简介: 在本教程中,您将学习在阿里云交互式建模平台PAI-DSW x Free Prompt Editing图像编辑算法,开发个人AIGC绘图小助理,实现文本驱动的图像编辑功能单卡即可完成AIGC图片风格变化、背景变化和主体变化等功能。让我们一同开启这场旅程,为您的图像编辑添上无限可能性的翅膀吧。

image.png

活动地址:https://developer.aliyun.com/topic/aigc_pai/paintingagent

前往参与活动,根据教程完成场景体验,使用PAI-DSW生成生成梵高风格的AIGC图像,上传前后对比图,得桌面折叠风扇限量350个,先到先得!)


教程简述

在本教程中,您将学习在阿里云交互式建模平台PAI-DSW x Free Prompt Editing图像编辑算法,开发个人AIGC绘图小助理,实现文本驱动的图像编辑功能单卡即可完成AIGC图片风格变化、背景变化和主体变化等功能让我们一同开启这场旅程,为您的图像编辑添上无限可能性的翅膀吧。

FreePromptEditing是一个基于文本驱动的Stable Diffusion图像编辑算法,用户可以直接通过输入Edit Prompt对生成图像或者真实图像进行编辑。

本教程使用Free Prompt Editing图像编辑算法,实现的图片风格变化对比:

image.png

image.png


基于本教程可以体验:
👍新用户可免费领取价值万元的人工智能平台PAI试用资源
👍 学会如何快速在阿里云上创建一个交互式训练开发环境
👍 学会如何在DSW中启动WebUI
👍 学会如何在DSW开发个人AIGC绘图小助理


答疑交流群

如需技术支持,请在钉钉搜索群号「 52485000325」,加入群聊


使用 PAI-DSW 开发AIGC绘图小助理

1. 准备环境和资源

1.1. 领取交互式建模PAI-DSW免费试用权益


前往活动页面,领取交互式建模PAI-DSW产品免费试用资源包

image.png

  • 对于交互式建模 PAI-DSW 的新用户,阿里云提供了5000CU*H 的免费试用资源,可以在活动页面中直接领取(试用规则请参照阿里云免费试用:https://free.aliyun.com/);或可以购买交互式建模 PAI-DSW 资源包参与活动,购买链接:PAI-DSW 100CU*H资源包,价格 59 元起;如不购买资源包,PAI-DSW 会按量进行计费,计费标准详见阿里云产品定价。


1.2. 创建PAI-DSW实例

  1. 前往人工智能平台PAI控制台,链接:https://pai.console.aliyun.com/
  2. 开通人工智能PAI并创建默认工作空间。请参见开通并创建默认工作空间
  3. 在人工智能平台PAI控制台内,选择交互式建模PAI-DSW

image.png

  1. 点击新建实例(如上图)
  2. 自定义输入实例名称(如下图)
  3. 选择实例机型,GPU推荐使用A10或者V100(16GB)及以上配置,GPU分类-ecs.gn6v-c8g1.2xlarge(支持资源包抵扣),若无此机型库存可更换地域尝试;

image.png

  1. 选择镜像:pytorch-develop:1.12-gpu-py39-cu113-ubuntu20.04

7393D631-1040-46e8-B141-F93DB358D6CE.png

  1. 点击“下一步”

image.png

  1. 确认【资源配置】及【镜像】如图所示,点击创建实例

955C6BC4-D3C2-492d-8F0B-BB50545EA6D7.png

  1. 约等到3-5分钟,实例状态变为「运行中」,实例创建完成;

image.png


1.3. 在DSW中打开教程文件

  1. 单击需要打开的实例操作列下的打开,进入PAI-DSW实例开发环境。
  2. Notebook页签的Launcher页面,单击前往浏览 Gallery,打开Gallery页面

image.png

  1. 在DSW Gallery页面中,搜索并找到AI美术师:图像编辑的无限可能教程,单击教程卡片中的在DSW中打开。

image.png

  1. 完成以上步骤,顺利打开AI美术师:图像编辑的无限可能Notebook最佳实践



1.4. 运行教程文件

  1. 您可以直接看到教程文本,您可以在教程文件中直接运行每个代码片段。当成功运行结束一个步骤命令后,再顺次运行下个步骤的命令。

image.png

  1. 本教程一共3个运行步骤:
  1. 准备工作
  2. 下载和安装环境
  3. 运行WebUI
  1. 当第3步运行WebUI运行完成后,在返回的运行详情结果中单击URL链接,进入WebUI页面。请发挥你的创意,生成您想要得到的图像吧!

image.png

2. 完成部署,开始体验AI图像编辑的无限可能

运行成功后打开链接,请发挥你的创意,修改您想要得到的图像吧!

WebUI 界面可调参数说明

-- Attention map Replacing Scale ratio of Editing 取值0.0-1.0,越大保留原图细节越多,建议值0.4-0.8

-- DDIM Steps 去噪步数

-- Layers to Edit 编辑的层数,建议值 32,16

-- Image Resolution 图像分辨率,建议值512

-- CFG Scale 文本提示控制强度,建议值 7.5

-- Seed 随机种子

我们已经在WebUI 预置了上述的可调参数,并提供了示例图像,编辑文本,以及负文本,您可以直接点击一键运行。


2.1. 进入WebUI界面

点击运行,稍等片刻后,在下方区域会输出原图像和编辑结果图像。


2.2. 更改图像背景

可以看到,基于FreePromptEditing,算法很好地理解了输入的编辑指导文本,将图像的背景转移到了森林中。

Edit Prompt(编辑文本):a Chinese building on the forest

Negative Prompt(负文本): nsfw, worst quality, low quality, normal quality, lowres, watermark

image.png

您也可以将示例的建筑搬到纽约,示例如下:

Edit Prompt(编辑文本):a Chinese building in New York City

Negative Prompt(负文本): nsfw, worst quality, low quality, normal quality, lowres, watermark

image.png


2.3. 更改图像风格

除了使用修改之外,我们也可以随意发挥想象力,通过设计编辑提示词,来改变原图的图像风格。下面展示些创意示例,仅仅修改了提示词,其他配置参数跟上文一致.

编辑文本:a kids drawing of a cat (儿童画的一只猫)

image.png

编辑文本:Van Gogh style architectural picture (梵高风格建筑图片)

image.png

成为无拘无束的创意画师,让您的幻想遨游色彩的世界,现在就启程,为您的图像添加无限的可能吧。

♥♥ 您可以自由发挥AI绘画新创作,本次活动要求:任意上传一张照片,变为梵高风格,分享前后对比图

🎁🎁作品完成上传活动页面,邀请好友一起参与活动,有机会赢取小度智能屏X9、米家小白摄像头、天猫魔投等好礼

image.png


3. 资源清理及后续

3.1. 清理

  • 在实验完成后,可前往对应产品控制台,停止或删除实例(两个操作均可),避免实例持续处于运行中,在超出免费试用额度后,带来额外的扣费

image.png

  • 后续仍考虑使用该实例>>停止;后续不再使用该实例>>删除,成功停止后即停止资源消耗。

3.2. 后续

在试用有效期期间,您还可以继续使用DSW实例进行模型训练和推理验证。

相关实践学习
使用PAI+LLaMA Factory微调Qwen2-VL模型,搭建文旅领域知识问答机器人
使用PAI和LLaMA Factory框架,基于全参方法微调 Qwen2-VL模型,使其能够进行文旅领域知识问答,同时通过人工测试验证了微调的效果。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
人工智能 编解码 算法
DeepSeek加持的通义灵码2.0 AI程序员实战案例:助力嵌入式开发中的算法生成革新
本文介绍了通义灵码2.0 AI程序员在嵌入式开发中的实战应用。通过安装VS Code插件并登录阿里云账号,用户可切换至DeepSeek V3模型,利用其强大的代码生成能力。实战案例中,AI程序员根据自然语言描述快速生成了C语言的base64编解码算法,包括源代码、头文件、测试代码和CMake编译脚本。即使在编译错误和需求迭代的情况下,AI程序员也能迅速分析问题并修复代码,最终成功实现功能。作者认为,通义灵码2.0显著提升了开发效率,打破了编程语言限制,是AI编程从辅助工具向工程级协同开发转变的重要标志,值得开发者广泛使用。
9799 71
DeepSeek加持的通义灵码2.0 AI程序员实战案例:助力嵌入式开发中的算法生成革新
|
机器学习/深度学习 人工智能 自然语言处理
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
阿里云人工智能平台 PAI 团队发表的图像编辑算法论文在 MM2024 上正式亮相发表。ACM MM(ACM国际多媒体会议)是国际多媒体领域的顶级会议,旨在为研究人员、工程师和行业专家提供一个交流平台,以展示在多媒体领域的最新研究成果、技术进展和应用案例。其主题涵盖了图像处理、视频分析、音频处理、社交媒体和多媒体系统等广泛领域。此次入选标志着阿里云人工智能平台 PAI 在图像编辑算法方面的研究获得了学术界的充分认可。
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
|
人工智能 编解码 算法
使用 PAI-DSW x Free Prompt Editing图像编辑算法,开发个人AIGC绘图小助理
使用 PAI-DSW x Free Prompt Editing图像编辑算法,开发个人AIGC绘图小助理
686 0
|
机器学习/深度学习 前端开发 算法
婚恋交友系统平台 相亲交友平台系统 婚恋交友系统APP 婚恋系统源码 婚恋交友平台开发流程 婚恋交友系统架构设计 婚恋交友系统前端/后端开发 婚恋交友系统匹配推荐算法优化
婚恋交友系统平台通过线上互动帮助单身男女找到合适伴侣,提供用户注册、个人资料填写、匹配推荐、实时聊天、社区互动等功能。开发流程包括需求分析、技术选型、系统架构设计、功能实现、测试优化和上线运维。匹配推荐算法优化是核心,通过用户行为数据分析和机器学习提高匹配准确性。
1295 4
|
算法
PAI下面的gbdt、xgboost、ps-smart 算法如何优化?
设置gbdt 、xgboost等算法的样本和特征的采样率
703 2
|
机器学习/深度学习 算法 数据挖掘
C语言在机器学习中的应用及其重要性。C语言以其高效性、灵活性和可移植性,适合开发高性能的机器学习算法,尤其在底层算法实现、嵌入式系统和高性能计算中表现突出
本文探讨了C语言在机器学习中的应用及其重要性。C语言以其高效性、灵活性和可移植性,适合开发高性能的机器学习算法,尤其在底层算法实现、嵌入式系统和高性能计算中表现突出。文章还介绍了C语言在知名机器学习库中的作用,以及与Python等语言结合使用的案例,展望了其未来发展的挑战与机遇。
581 1
|
算法 测试技术 开发者
在Python开发中,性能优化和代码审查至关重要。性能优化通过改进代码结构和算法提高程序运行速度,减少资源消耗
在Python开发中,性能优化和代码审查至关重要。性能优化通过改进代码结构和算法提高程序运行速度,减少资源消耗;代码审查通过检查源代码发现潜在问题,提高代码质量和团队协作效率。本文介绍了一些实用的技巧和工具,帮助开发者提升开发效率。
287 3
|
人工智能 编解码 算法
使用PAI-DSW x Free Prompt Editing开发个人AIGC绘图小助理
本文介绍如何借助阿里云PAI-DSW及Free Prompt Editing算法开发个性化AIGC绘图助手,实现图像智能编辑与生成。首先需领取PAI-DSW免费试用资源并创建实例;随后通过运行教程文件完成环境搭建。WebUI界面预设了多种参数供调整,如图像分辨率、编辑层数量等,支持更改图像背景与风格等功能演示。完成实验后应及时清理资源以避免额外费用。此外,参与阿里云开发者社区的“AIGC绘图小助手”活动,不仅可获得免费云资源试用,还有机会赢得桌面折叠风扇、小度智能屏X9等礼品。
|
9月前
|
机器学习/深度学习 算法 机器人
【水下图像增强融合算法】基于融合的水下图像与视频增强研究(Matlab代码实现)
【水下图像增强融合算法】基于融合的水下图像与视频增强研究(Matlab代码实现)
753 0
|
9月前
|
数据采集 分布式计算 并行计算
mRMR算法实现特征选择-MATLAB
mRMR算法实现特征选择-MATLAB
480 2

热门文章

最新文章

相关产品

  • 人工智能平台 PAI