用AI实现涂鸦变精美画作

本文涉及的产品
模型训练 PAI-DLC,100CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 您将学习如何在阿里云交互式建模(PAI-DSW)中,使用Stable Diffusion XL Turbo模型和DiffSynth UI实现AI作画,涂鸦也能生成精美画作。

教程简述

在本教程中,您将学习如何在阿里云交互式建模(PAI-DSW)中,使用Stable Diffusion XL Turbo模型和DiffSynth UI实现AI作画,涂鸦也能生成精美画作。

基于开源Stable Diffusion XL Turbo模型和DiffSynth UI,我们支持文图生成的基础上,也支持交互式的图像到图像生成,实现图像编辑功能,用户可以上传草图或通过WebUI提供的绘图工具绘制草图。本文将以Stable Diffusion XL Turbo为基模型,为您介绍如何在PAI-DSW中使用单卡实现交互式的图像编辑和生成功能。

本教程使用Stable Diffusion XL Turbo实现AI作画效果展示如下:

image.png


基于本教程可以体验:
👍新用户可免费领取价值万元的人工智能平台PAI试用资源
👍 学会如何快速在阿里云上创建一个交互式训练开发环境。
👍 学会如何在DSW中启动WebUI。
👍 学会如何在DSW实现交互式的图像编辑与生成功能。


答疑交流群

如需技术支持,请在钉钉搜索群号「 52485000325」,加入群聊


使用PAI-DSW快速启动SD WebUI

1. 准备环境和资源

1.1. 领取交互式建模PAI-DSW免费试用权益

前往活动页面,领取交互式建模PAI-DSW产品免费试用资源包

image.png

  • 对于交互式建模 PAI-DSW 的新用户,阿里云提供了5000CU*H 的免费试用资源,可以在活动页面中直接领取(试用规则请参照阿里云免费试用:https://free.aliyun.com/);或可以购买交互式建模 PAI-DSW 资源包参与活动,购买链接:PAI-DSW 100CU*H资源包,价格 59 元起;如不购买资源包,PAI-DSW 会按量进行计费,计费标准详见阿里云产品定价。

1.2. 创建PAI-DSW实例

  1. 前往人工智能平台PAI控制台,链接:https://pai.console.aliyun.com/
  2. 开通人工智能PAI并创建默认工作空间。请参见开通并创建默认工作空间
  3. 在人工智能平台PAI控制台内,选择交互式建模PAI-DSW

image.png

  1. 点击创建实例(如上图)
  2. 自定义输入实例名称(如下图)
  3. 选择实例机型,GPU分类-ecs.gn6v-c8g1.2xlarge(支持资源包抵扣),若无此机型库存可更换地域尝试;(如下图)

image.png

  1. 选择镜像,modelscope:1.11.0-pytorch2.1.2tensorflow2.14.0-gpu-py310-cu121-ubuntu22.04

image.png

  1. 点击“下一步”

image.png

  1. 确认【资源配置】及【镜像】如图所示,点击创建实例;

image.png

  1. 大约等到3-5分钟,实例状态变为「运行中」,实例创建完成;

image.png

1.3. 在DSW中打开教程文件

  1. 单击需要打开的实例操作列下的打开,进入PAI-DSW实例开发环境。
  2. Notebook页签的Launcher页面,单击前往浏览 Gallery,打开Gallery页面

image.png

  1. 在DSW Gallery页面中,搜索并找到基于Stable Diffusion XL Turbo的交互式图像编辑教程,单击教程卡片中的在DSW中打开。

image.png

  1. 完成以上步骤,顺利打开Stable Diffusion XL Turbo的交互式图像编辑Notebook最佳实践

image.png

1.4. 运行教程文件

  1. 在打开的教程文件DiffSynthWebUI文件中,您可以直接看到教程文本,您可以在教程文件中直接运行每个代码片段。当成功运行结束一个步骤命令后,再顺次运行下个步骤的命令。

image.png

image.png


  1. 本教程一共3个运行步骤:
  1. 下载模型文件
  2. 下载和安装所需要的环境
  3. 启动WebUI
  1. 当第3步启动WebUI运行完成后,在返回的运行详情结果中单击URL链接,进入WebUI页面。请发挥你的创意,生成您想要得到的图像吧!

image.png

2. 完成部署开始体验AI作画,体验简笔画变精美画作

您可以使用已经写好的UI启动脚本,进行图像创作。示例使用的参数解释如下,请您根据实际情况进行修改:

UI 界面说明

-- Model path: Stable Diffusion XL Turbo 模型。

-- Positive prompt: 目标生成图像的描述文本。

-- Number of images: 生成图像数量。

-- Create a drawing white board: 创建白色画布,用于草图绘制。

-- Stroke width: 笔画粗细

-- Denoising strength: 输入图像的保留程度,范围在0-1之间,值越小生成图像与输入图像越像, 如Denoising strength=0, 无变化; Denoising strength=1, 与输入图像完全无关.

-- Repetition: 图像重复次数.

-- Delete input image: 删除输入图像,建议在使用生成图像作为输入前将原输入图像删除。

2.1. 进入WebUI界面

进入WebUI界面,可以选择以上两种方式之一作为图片输入:1、打开在线画板绘制图片;2、本地上传图片

image.png

2.2. 在线画板绘制作为输入素材(推荐)

Step1、打开在线绘制白板;

Step2、绘制图片

Step3、输入Prompt(与图片元素相关);

Step4、生成图片;

image.png

image.png

2.3. 本地上传图片作为输入素材

Step1、上传图片;

Step2、输入Prompt;

Step3、生成图片;

image.png

2.4. 进阶玩法

image.png

image.png

image.png


您可以自由发挥基于您的涂鸦进行AIGC新创作!

🎁🎁作品完成上传【用AI实现涂鸦变大作】活动页面,Powerbeats Pro、台式升降桌、电脑支架等七重好礼等你来拿~

image.png

3. 资源清理及后续

3.1. 清理

  • 在实验完成后,可前往对应产品控制台,停止或删除实例(两个操作均可),避免实例持续处于运行中,在超出免费试用额度后,带来额外的扣费

image.png

  • 后续仍考虑使用该实例>>停止;后续不再使用该实例>>删除,成功停止后即停止资源消耗。

3.2. 后续

在试用有效期期间,您还可以继续使用DSW实例进行模型训练和推理验证。

相关实践学习
使用PAI+LLaMA Factory微调Qwen2-VL模型,搭建文旅领域知识问答机器人
使用PAI和LLaMA Factory框架,基于全参方法微调 Qwen2-VL模型,使其能够进行文旅领域知识问答,同时通过人工测试验证了微调的效果。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
人工智能 搜索推荐 开发者
Doodle一下,AI上作画!活动震撼来袭,个性画作等你挑战!
体验”通义万相-涂鸦作画“,晒出属于你的”灵魂画作“,在阿里云社区、微博/小红书提交作品,即有机会获得人气奖哦!
742 3
Doodle一下,AI上作画!活动震撼来袭,个性画作等你挑战!
|
人工智能 自然语言处理
最懂中国传统文化的AI绘画模型,画作有形更有神,传达儒释道思想
最懂中国传统文化的AI绘画模型,画作有形更有神,传达儒释道思想
794 0
|
1月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
413 29
|
2月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
809 44
|
1月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
471 28
|
1月前
|
设计模式 人工智能 自然语言处理
3个月圈粉百万,这个AI应用在海外火了
不知道大家还记不记得,我之前推荐过一个叫 Agnes 的 AI 应用,也是当时在 WAIC 了解到的。
326 1
|
1月前
|
消息中间件 人工智能 安全
构建企业级 AI 应用:为什么我们需要 AI 中间件?
阿里云发布AI中间件,涵盖AgentScope-Java、AI MQ、Higress、Nacos及可观测体系,全面开源核心技术,助力企业构建分布式多Agent架构,推动AI原生应用规模化落地。
235 0
构建企业级 AI 应用:为什么我们需要 AI 中间件?
|
1月前
|
人工智能 算法 Java
Java与AI驱动区块链:构建智能合约与去中心化AI应用
区块链技术和人工智能的融合正在开创去中心化智能应用的新纪元。本文深入探讨如何使用Java构建AI驱动的区块链应用,涵盖智能合约开发、去中心化AI模型训练与推理、数据隐私保护以及通证经济激励等核心主题。我们将完整展示从区块链基础集成、智能合约编写、AI模型上链到去中心化应用(DApp)开发的全流程,为构建下一代可信、透明的智能去中心化系统提供完整技术方案。
242 3
|
1月前
|
存储 人工智能 NoSQL
AI大模型应用实践 八:如何通过RAG数据库实现大模型的私有化定制与优化
RAG技术通过融合外部知识库与大模型,实现知识动态更新与私有化定制,解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型(向量库、图库、知识图谱、混合架构)及应用场景,助力企业高效构建安全、可解释的智能系统。
|
1月前
|
人工智能 缓存 运维
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
本文介绍联调造数场景下的AI应用演进:从单Agent模式到多Agent协同的架构升级。针对复杂指令执行不准、响应慢等问题,通过意图识别、工具引擎、推理执行等多Agent分工协作,结合工程化手段提升准确性与效率,并分享了关键设计思路与实践心得。
413 20
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀

热门文章

最新文章