Stable Diffusion 本地安装
关于Stable Diffusion webUI
Stable Diffusion是Stability-AI出的文生图开源模型,DreamStudio是Stable Diffusion的官方操作界面(即调用和使用模型的web应用程序),有付费功能;最近Stability-AI也推出了DreamStudio的开源实现StableStudio。
今天要介绍Stable Diffusion webUI则第三方通过Gradio搭建的Stable Diffusion的web前端,功能丰富,而且所有功能都是开源的。
Stable Diffusion webUI安装和注意事项
Stable Diffusion webUI是通过gradio搭建的,同时运行Stable Diffusion模型需要python和pytorch环境,以及GPU硬件设备支持。
所以我们先来盘点下安装的前置条件:
安装依赖
- python环境:3.8以上,windows 推荐3.10.6
- git:为了下载软件包 git版本最好在2.x版本
- pytorch环境:可用最新的2.x
- GPU:支持Nvidia GPU和AMD GPU
- 操作系统:支持win10 、 linux 和 Apple
安装脚本
conda create -n sd_py38 python=3.8
source activate sd_py38
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
cd stable-diffusion-webui
pip install requirements.txt
sh webui.sh --listen --port 8081 --api --xformers --enable-insecure-extension-access --device-id 2
# http://x.x.x.x:8081/?__theme=dark
win 10
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
pip install requirements.txt
执行 webui-user.bat
http://127.0.0.1:7860/?__theme=dark
linux安装过程中可能会出现ERROR: This script must not be launched as root, aborting...
,可以webui.sh中注释掉root
webui界面介绍
webui重要目录:
- models # 涉及到所有模型文件
├── BLIP
├── Codeformer
├── ControlNet # ControlNet模型
├── deepbooru
├── deepdanbooru
├── Deforum
├── ESRGAN # 上采样超分模型
├── GFPGAN
├── hypernetworks
├── karlo
├── LDSR
├── Lora # Lora模型
├── RealESRGAN
├── Stable-diffusion # 主模型
├── SwinIR # 上采样超分模型
├── torch_deepdanbooru
├── VAE # VAE
└── VAE-approx
- embeddings # 词嵌入模型
- extensions # ui扩展
从界面功能上最主要的功能是:
- txt2img: 文生图
- img2img:图生图
- Extras: 主要是图片放大功能
- extensions:ui扩展管理
从模型上,我们可以结合Stable Diffusion模结构来看下:
- 左边为VAE模块,有的模型可以替换这个VAE的模块
- 中间的Diffusion生成模型:通常是主模型(Stable-diffusion目录,当然主模型也可以所有模型),或者主模型微调的部分参数Lora模型
- 右边为条件输入:如果输入是文本,可以是定制的embedding模型(embeddings目录),如果是想控制可以添加ControlNet
从Stable Diffusion的关键输入和参数来看:
- 正向提示词:你要生成图像的描述
- 负向提示词:不希望出现的情况,比如低质量,多个手指等
- 采样器:加速图像生成
- 采样步数
- CFG scale:图像和提示词之间的关联性,越大关联性越小,随机性越大
- batch:每次生图的数量
推荐安装视频指导
推荐一个B站的入门级学习视频,相信学习完可以有一个很好的入门。