如何在阿里云快速启动Stable Diffusion轻松玩转AI绘画

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: 本文介绍如何如何在阿里云快速启动Stable Diffusion服务开启AI绘画

stable-diffusion服务快速启动文档(GPU版)

概述

Stable Diffusion Web UI 是一个基于 Stable Diffusion 的基础应用,利用 gradio 模块搭建出交互程序,可以在低代码 GUI 中立即访问 Stable Diffusion。它支持文字生成图片,图片转图片,使用各种各样的模型来达到你想要的效果,还能训练自己的专属模型。本文向您介绍如何在阿里云上快速的启动stable-diffusion服务进行AI绘画。

启动流程

步骤

1.登录阿里云控制台,进入Stable Confusuion服务创建界面,根据界面提示,填写相关参数(软件登录名及登录密码很重要,后面访问WebUI需要用到),填写完成点击确认订单(确保账号有余额,推荐选择按量付费方式,使用完将实例释放掉或到ECS控制台选择节省停机模式进行关机以节省成本)。
1.png
1.png
(可选项)若想要将生成图片的结果(包括参数及生成的图片)存储到RDS,可以开启RDS插件功能。

参数说明

您在创建服务实例的过程中,需要配置服务实例信息。下文介绍stable-diffusion服务实例输入参数的详细信息。

参数组 参数项 示例 说明
服务实例名称 test 实例的名称
地域 华东1(杭州) 选中服务实例的地域,建议就近选中,以获取更好的网络延时。
可用区配置 部署区域 可用区I 地域下的不同可用区域
付费类型配置 付费类型 按量付费 或 包年包月
ECS实例配置 实例类型 ecs.gn6i-c4g1.xlarge 实例规格,可以根据实际需求选择
ECS实例配置 实例密码 设置实例密码。长度8~30个字符,必须包含三项(大写字母、小写字母、数字、()`~!@#$%^&*-+={}[]:;'<>,.?/ 中的特殊符号)
登录信息 软件登录名 admin 设置软件登录名,默认为admin
登录信息 软件登录名密码 设置软件登录密码
网络配置 专有网络IPv4网段 192.168.0.0/16 VPC的ip地址段范围
网络配置 交换机子网网段 192.168.0.0/24 交换机子网网段

2.勾选我已阅读并同意《计算巢服务协议》,点击"立即创建"按钮。
2.png
1.png
3.查看部署进度。
点击去列表页查看,可以看到刚刚创建的服务实例以及服务部署进度。
1.png
4.访问stable-diffusion
等待状态变为"已部署"后,点击详情,进入到对应的服务实例后,可以在页面上获取到Endpoint以访问服务。
1.png
1.png
点击Endpoint后面的链接,输入第1步设置的软件登录名及密码

dwcoejrb2ugh4_b68347204adc4120870e85626306b102.png

完成验证后即可访问:
1.png

下载模型

  1. 以某模型网站提供的模型为例,首先登录此网站,找到自己想要下载的模型(预览图左上角显示模型的类型)

image.png

  1. 点击一个模型预览图进入详情页,找到Download按钮点击右键,复制链接地址:

image.png

  1. 在计算巢控制台点击运维管理,点击“下载模型”,输入相关参数(选择模型或预览图、模型类型、下载方式、文件类型,输入模型名称):

image.png
image.png
CHECKPOINT模型示例:
image.png
Lora模型示例:
image.png
注意:CHECKPOINT、LORA、VAE三种方式不需要输入存储目录,其他模型可在模型类型选择“OTHER”, 自行修改文件存储目录:
image.png
参数输入完成后,点击下一步
4.点击创建,开始下载
image.png
等待下载完成(等待过程中也可以继续下载其他模型),当执行状态变为成功,表示已经下载完成
image.png
5.此时可以登录到WebUI加载下载的模型

CHECKPOINT模型示例:
点击上面的刷新按钮,就可以看到我们刚刚下载的CHECKPOINT模型了
image.png
Lora模型:
点击右面Lora按钮,然后点击Refresh,此时就可以看到我们刚刚下载的Lora模型了
image.png
在这里我们可以看到,直接下载模型的没有预览图的,此时可以通过上述下载方式自行上传一张图片到模型文件中,这里以上传本地文件的Lora模型预览图为例。
image.png
点击确定、创建,等待执行状态变为成功。再次点击Refresh,可以看到,预览图也已经加载出来啦!image.png

高级功能

API访问

通过计算巢创建的Stable Diffusion默认开启了API访问,您可以通过API调用来更好地集成我们的服务。
通过上述步骤4中获取的Endpoint+/docs# 可以看到所有可访问的API列表,如访问 http://48.xxx.xx.163:8080/docs# 可以看到

以下是一个通过Python调用Stable Diffusion API的示例:

import requests
import io
import base64
from PIL import Image, PngImagePlugin

if __name__ == '__main__':
    url = "http://48.xxx.xx.163:8080"
    payload = {
        "prompt": "puppy dog",
        "steps": 5
    }
    token = "admin:password"
    encoded_token = base64.b64encode(token.encode("utf-8")).decode("utf-8")
    headers = {
        "Content-Type": "application/json",
        "Authorization": f'Basic {encoded_token}'
    }
    response = requests.post(url=f'{url}/sdapi/v1/txt2img', json=payload, headers=headers)
    r = response.json()
    for i in r['images']:
        image = Image.open(io.BytesIO(base64.b64decode(i.split(",", 1)[0])))
        png_payload = {
            "image": "data:image/png;base64," + i
        }
        response2 = requests.post(url=f'{url}/sdapi/v1/png-info', json=png_payload)
        pnginfo = PngImagePlugin.PngInfo()
        pnginfo.add_text("parameters", response2.json().get("info"))
        image.save('output.png', pnginfo=pnginfo)

更多API访问信息可查看API访问向导了解

通过RDS保存生成结果

前提:需要保证快速启动步骤1中开启了RDS插件

  1. 在webui界面勾选 Save to DB(勾选即代表需要将生成结果存储到RDS中)
  2. 指定数据库名 Database Name(默认值 stable_diffusion),指定表名 Table Name(默认 generated_images)
  3. 点击 Generate,图片生成完毕后,结果自动存储至 RDS

image.png
好了,现在可以开启你的AI绘画之旅了,祝大家绘图愉快!

其他

请访问stable-diffusion使用文档了解如何使用。

相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情:&nbsp;https://www.aliyun.com/product/ecs
相关文章
|
15天前
|
人工智能 测试技术
语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场
【9月更文挑战第20天】Meta研究人员提出了一种名为Transfusion的创新方法,通过融合Transformer和Diffusion模型,实现了能同时处理文本和图像数据的多模态模型。此模型结合了语言模型的预测能力和Diffusion模型的生成能力,能够在单一架构中处理混合模态数据,有效学习文本与图像间的复杂关系,提升跨模态理解和生成效果。经过大规模预训练,Transfusion模型在多种基准测试中表现出色,尤其在图像压缩和模态特定编码方面具有优势。然而,其训练所需的大量计算资源和数据、以及潜在的伦理和隐私问题仍需关注。
48 7
|
1月前
|
人工智能 计算机视觉 Python
AI计算机视觉笔记八:基于mediapipe的虚拟绘画
该项目利用MediaPipe手部关键点识别技术,实现了隔空绘画功能。用户可以通过手势控制绘画工具,选择颜色或橡皮擦。环境配置基于`mediapipe_env`,在PyCharm中运行。项目包括两个文件:`AiVirtualPainter.py`负责绘画逻辑,`HandTrackingModule.py`用于手部关键点检测。此项目展示了AI技术在互动应用中的潜力,适合初学者实践与学习。
50 10
|
3月前
|
机器学习/深度学习 人工智能 算法
解决方案评测:通义万相 AI 绘画创作
通义万相 AI 绘画创作工具在功能、使用体验等方面表现出色,为用户提供了一种便捷、高效的绘画创作方式。虽然存在一些不足之处,但随着技术的不断发展和优化,相信其性能和表现会不断提升。对于艺术家、设计师、创意工作者以及普通爱好者来说,通义万相都是一款值得尝试和探索的 AI 绘画工具。
283 4
解决方案评测:通义万相 AI 绘画创作
|
2月前
|
人工智能 自然语言处理 API
阿里云百炼平台上线首个最新文生图模型FLUX中文优化版
由Stable Diffusion团队推出的开源文生图模型FLUX风靡全球,其生成质量媲美Midjourney,被誉为“开源王者”。阿里云百炼平台首发FLUX中文优化版,提升了中文指令的理解与执行能力。开发者可直接在平台上体验并调用FLUX模型,且享有1000张图像的免费生成额度,有效期180天。无需额外部署,即可轻松利用这一先进模型创造高质量图像。
|
4月前
|
人工智能 API
阿里云的通义万相文本绘图与人像美化解决方案的体验感受
通义万相文本绘图与人像美化解决方案是一个非常有潜力的产品,它不仅能够提高设计师和艺术家的创作效率,也为AI图像生成领域带来了新的可能性。非常期待它未来的发展和应用。
148 40
|
3月前
|
人工智能 弹性计算 自然语言处理
通义万相AI创作绘画产品方案产品体验
本次我有幸接触并体验了阿里云通义万相这一创新的AI绘画工具方案。该方案它是在利用人工智能技术,为用户提供创新、便捷的绘画创作体验。在体验过程中,我主要关注了产品的易用性、功能性、创新性、用户体验及方案本身等方面。
137 3
|
2月前
|
人工智能 自然语言处理 API
阿里云百炼上线FLUX文生图模型中文优化版,可免费调用!
阿里云百炼上线FLUX文生图模型中文优化版,可免费调用!
261 0
|
3月前
|
弹性计算 人工智能 对象存储
来自通义万相的创意加速器:AI 绘画创作
【7月更文挑战第11天】来自通义万相的创意加速器:AI 绘画创作
|
4月前
|
机器学习/深度学习 人工智能 算法
Stable Diffusion AI绘画
Stable Diffusion是人工智能领域的文本到图像生成模型,基于概率的连续扩散过程,学习数据潜在分布并生成新样本。模型使用Web UI进行交互,提供不同采样器如Euler和DPM++,后者常配以Karras算法。提示词对生成效果至关重要,可以利用GPT等生成提示词。用户还能调整参数如高清修复和批处理次数来影响生成的图像。此外,模型文件(ckpt/safetensors)和Lora微调模型需存放在正确目录以确保功能正常。
|
8天前
|
机器学习/深度学习 数据采集 人工智能
探索AI技术在文本生成中的应用与挑战
【9月更文挑战第26天】本文深入探讨了AI技术在文本生成领域的应用,并分析了其面临的挑战。通过介绍AI文本生成的基本原理、应用场景以及未来发展趋势,帮助读者全面了解该技术的潜力和局限性。同时,文章还提供了代码示例,展示了如何使用Python和相关库实现简单的文本生成模型。
33 9

热门文章

最新文章

下一篇
无影云桌面