用AI实现涂鸦变精美画作

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 您将学习如何在阿里云交互式建模(PAI-DSW)中,使用Stable Diffusion XL Turbo模型和DiffSynth UI实现AI作画,涂鸦也能生成精美画作。

教程简述

在本教程中,您将学习如何在阿里云交互式建模(PAI-DSW)中,使用Stable Diffusion XL Turbo模型和DiffSynth UI实现AI作画,涂鸦也能生成精美画作。

基于开源Stable Diffusion XL Turbo模型和DiffSynth UI,我们支持文图生成的基础上,也支持交互式的图像到图像生成,实现图像编辑功能,用户可以上传草图或通过WebUI提供的绘图工具绘制草图。本文将以Stable Diffusion XL Turbo为基模型,为您介绍如何在PAI-DSW中使用单卡实现交互式的图像编辑和生成功能。

本教程使用Stable Diffusion XL Turbo实现AI作画效果展示如下:

image.png


基于本教程可以体验:
👍新用户可免费领取价值万元的人工智能平台PAI试用资源
👍 学会如何快速在阿里云上创建一个交互式训练开发环境。
👍 学会如何在DSW中启动WebUI。
👍 学会如何在DSW实现交互式的图像编辑与生成功能。


答疑交流群

如需技术支持,请在钉钉搜索群号「 52485000325」,加入群聊


使用PAI-DSW快速启动SD WebUI

1. 准备环境和资源

1.1. 领取交互式建模PAI-DSW免费试用权益

前往活动页面,领取交互式建模PAI-DSW产品免费试用资源包

image.png

  • 对于交互式建模 PAI-DSW 的新用户,阿里云提供了5000CU*H 的免费试用资源,可以在活动页面中直接领取(试用规则请参照阿里云免费试用:https://free.aliyun.com/);或可以购买交互式建模 PAI-DSW 资源包参与活动,购买链接:PAI-DSW 100CU*H资源包,价格 59 元起;如不购买资源包,PAI-DSW 会按量进行计费,计费标准详见阿里云产品定价。

1.2. 创建PAI-DSW实例

  1. 前往人工智能平台PAI控制台,链接:https://pai.console.aliyun.com/
  2. 开通人工智能PAI并创建默认工作空间。请参见开通并创建默认工作空间
  3. 在人工智能平台PAI控制台内,选择交互式建模PAI-DSW

image.png

  1. 点击创建实例(如上图)
  2. 自定义输入实例名称(如下图)
  3. 选择实例机型,GPU分类-ecs.gn6v-c8g1.2xlarge(支持资源包抵扣),若无此机型库存可更换地域尝试;(如下图)

image.png

  1. 选择镜像,modelscope:1.11.0-pytorch2.1.2tensorflow2.14.0-gpu-py310-cu121-ubuntu22.04

image.png

  1. 点击“下一步”

image.png

  1. 确认【资源配置】及【镜像】如图所示,点击创建实例;

image.png

  1. 大约等到3-5分钟,实例状态变为「运行中」,实例创建完成;

image.png

1.3. 在DSW中打开教程文件

  1. 单击需要打开的实例操作列下的打开,进入PAI-DSW实例开发环境。
  2. Notebook页签的Launcher页面,单击前往浏览 Gallery,打开Gallery页面

image.png

  1. 在DSW Gallery页面中,搜索并找到基于Stable Diffusion XL Turbo的交互式图像编辑教程,单击教程卡片中的在DSW中打开。

image.png

  1. 完成以上步骤,顺利打开Stable Diffusion XL Turbo的交互式图像编辑Notebook最佳实践

image.png

1.4. 运行教程文件

  1. 在打开的教程文件DiffSynthWebUI文件中,您可以直接看到教程文本,您可以在教程文件中直接运行每个代码片段。当成功运行结束一个步骤命令后,再顺次运行下个步骤的命令。

image.png

image.png


  1. 本教程一共3个运行步骤:
  1. 下载模型文件
  2. 下载和安装所需要的环境
  3. 启动WebUI
  1. 当第3步启动WebUI运行完成后,在返回的运行详情结果中单击URL链接,进入WebUI页面。请发挥你的创意,生成您想要得到的图像吧!

image.png

2. 完成部署开始体验AI作画,体验简笔画变精美画作

您可以使用已经写好的UI启动脚本,进行图像创作。示例使用的参数解释如下,请您根据实际情况进行修改:

UI 界面说明

-- Model path: Stable Diffusion XL Turbo 模型。

-- Positive prompt: 目标生成图像的描述文本。

-- Number of images: 生成图像数量。

-- Create a drawing white board: 创建白色画布,用于草图绘制。

-- Stroke width: 笔画粗细

-- Denoising strength: 输入图像的保留程度,范围在0-1之间,值越小生成图像与输入图像越像, 如Denoising strength=0, 无变化; Denoising strength=1, 与输入图像完全无关.

-- Repetition: 图像重复次数.

-- Delete input image: 删除输入图像,建议在使用生成图像作为输入前将原输入图像删除。

2.1. 进入WebUI界面

进入WebUI界面,可以选择以上两种方式之一作为图片输入:1、打开在线画板绘制图片;2、本地上传图片

image.png

2.2. 在线画板绘制作为输入素材(推荐)

Step1、打开在线绘制白板;

Step2、绘制图片

Step3、输入Prompt(与图片元素相关);

Step4、生成图片;

image.png

image.png

2.3. 本地上传图片作为输入素材

Step1、上传图片;

Step2、输入Prompt;

Step3、生成图片;

image.png

2.4. 进阶玩法

image.png

image.png

image.png


您可以自由发挥基于您的涂鸦进行AIGC新创作!

🎁🎁作品完成上传【用AI实现涂鸦变大作】活动页面,Powerbeats Pro、台式升降桌、电脑支架等七重好礼等你来拿~

image.png

3. 资源清理及后续

3.1. 清理

  • 在实验完成后,可前往对应产品控制台,停止或删除实例(两个操作均可),避免实例持续处于运行中,在超出免费试用额度后,带来额外的扣费

image.png

  • 后续仍考虑使用该实例>>停止;后续不再使用该实例>>删除,成功停止后即停止资源消耗。

3.2. 后续

在试用有效期期间,您还可以继续使用DSW实例进行模型训练和推理验证。

相关实践学习
使用PAI+LLaMA Factory微调Qwen2-VL模型,搭建文旅领域知识问答机器人
使用PAI和LLaMA Factory框架,基于全参方法微调 Qwen2-VL模型,使其能够进行文旅领域知识问答,同时通过人工测试验证了微调的效果。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
人工智能 搜索推荐 开发者
Doodle一下,AI上作画!活动震撼来袭,个性画作等你挑战!
体验”通义万相-涂鸦作画“,晒出属于你的”灵魂画作“,在阿里云社区、微博/小红书提交作品,即有机会获得人气奖哦!
714 3
Doodle一下,AI上作画!活动震撼来袭,个性画作等你挑战!
|
人工智能 自然语言处理
最懂中国传统文化的AI绘画模型,画作有形更有神,传达儒释道思想
最懂中国传统文化的AI绘画模型,画作有形更有神,传达儒释道思想
739 0
|
2天前
|
边缘计算 人工智能 算法
AI在智慧能源管理中的边缘计算应用
AI在智慧能源管理中的边缘计算应用
49 13
|
3天前
|
人工智能 Cloud Native 中间件
划重点|云栖大会「AI 原生应用架构论坛」看点梳理
本场论坛将系统性阐述 AI 原生应用架构的新范式、演进趋势与技术突破,并分享来自真实生产环境下的一线实践经验与思考。
|
3天前
|
存储 人工智能 Serverless
函数计算进化之路:AI 应用运行时的状态剖析
AI应用正从“请求-响应”迈向“对话式智能体”,推动Serverless架构向“会话原生”演进。阿里云函数计算引领云上 AI 应用 Serverless 运行时技术创新,实现性能、隔离与成本平衡,开启Serverless AI新范式。
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
AIGC技术深度解析:生成式AI的革命性突破与产业应用实战
蒋星熠Jaxonic,AI技术探索者,深耕生成式AI领域。本文系统解析AIGC核心技术,涵盖Transformer架构、主流模型对比与实战应用,分享文本生成、图像创作等场景的实践经验,展望技术趋势与产业前景,助力开发者构建完整认知体系,共赴AI原生时代。
65 1
|
6天前
|
人工智能 自然语言处理 算法
现代AI工具深度解析:从GPT到多模态的技术革命与实战应用
蒋星熠Jaxonic,AI技术探索者,深耕代码生成、多模态AI与提示词工程。分享AI工具架构、实战应用与优化策略,助力开发者提升效率,共赴智能编程新纪元。
33 4
|
9天前
|
人工智能 关系型数据库 OLAP
一键搞定本土认证难题,AnalyticDB版Supabase助力AI应用实现支付宝&微信登录
阿里云AnalyticDB PostgreSQL版推出全新第三方身份认证能力,原生支持微信、支付宝、GitHub、Google、Apple等主流平台登录,助力开发者快速构建本土化用户系统。相比传统开发方式,无需从零开发认证模块,5分钟即可完成集成,大幅降低开发成本。适用于AI应用、创业项目及企业级智能应用,提升用户增长效率,实现安全、便捷的身份管理。
|
9天前
|
人工智能 Kubernetes 安全
重塑云上 AI 应用“运行时”,函数计算进化之路
回顾历史,电网的修建,深刻地改变了世界的经济地理和创新格局。今天,一个 AI 原生的云端运行时的进化,其意义也远不止于技术本身。这是一次设计哲学的升华:从“让应用适应平台”到“让平台主动理解和适应智能应用”的转变。当一个强大、易用、经济且安全的 AI 运行时成为像水电一样的基础设施时,它将极大地降低创新的门槛。一个独立的开发者、一个小型创业团队,将有能力去创造和部署世界级的 AI 应用。这才是技术平权的真谛,是激发全社会创新潜能的关键。
|
9天前
|
人工智能 算法 数据挖掘
AI Agent工作流实用手册:5种常见模式的实现与应用,助力生产环境稳定性
本文介绍了五种AI Agent结构化工作流模式,帮助解决传统提示词方式在生产环境中输出不稳定、质量不可控的问题。通过串行链式处理、智能路由、并行处理、编排器-工作器架构和评估器-优化器循环,可提升任务执行效率、资源利用和输出质量,适用于复杂、高要求的AI应用。
150 0
AI Agent工作流实用手册:5种常见模式的实现与应用,助力生产环境稳定性