Stable Diffusion 本地安装 | AIGC

简介: 今天要介绍Stable Diffusion webUI则第三方通过Gradio搭建的Stable Diffusion的web前端,功能丰富,而且所有功能都是开源的。 【1月更文挑战第7天】

Stable Diffusion 本地安装

关于Stable Diffusion webUI

Stable Diffusion是Stability-AI出的文生图开源模型,DreamStudio是Stable Diffusion的官方操作界面(即调用和使用模型的web应用程序),有付费功能;最近Stability-AI也推出了DreamStudio的开源实现StableStudio。

今天要介绍Stable Diffusion webUI则第三方通过Gradio搭建的Stable Diffusion的web前端,功能丰富,而且所有功能都是开源的。

image.png

Stable Diffusion webUI安装和注意事项

Stable Diffusion webUI是通过gradio搭建的,同时运行Stable Diffusion模型需要python和pytorch环境,以及GPU硬件设备支持。

所以我们先来盘点下安装的前置条件:

安装依赖

  • python环境:3.8以上,windows 推荐3.10.6
  • git:为了下载软件包 git版本最好在2.x版本
  • pytorch环境:可用最新的2.x
  • GPU:支持Nvidia GPU和AMD GPU
  • 操作系统:支持win10 、 linux 和 Apple

安装脚本

conda create -n sd_py38  python=3.8
source activate sd_py38
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

cd stable-diffusion-webui
pip install requirements.txt

sh webui.sh --listen --port 8081  --api --xformers --enable-insecure-extension-access --device-id 2

# http://x.x.x.x:8081/?__theme=dark

win 10


git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
pip install requirements.txt
执行 webui-user.bat

http://127.0.0.1:7860/?__theme=dark

linux安装过程中可能会出现ERROR: This script must not be launched as root, aborting...,可以webui.sh中注释掉root

webui界面介绍

webui重要目录:

- models # 涉及到所有模型文件
├── BLIP
├── Codeformer
├── ControlNet # ControlNet模型
├── deepbooru
├── deepdanbooru
├── Deforum
├── ESRGAN # 上采样超分模型
├── GFPGAN 
├── hypernetworks
├── karlo
├── LDSR
├── Lora   # Lora模型
├── RealESRGAN
├── Stable-diffusion # 主模型
├── SwinIR # 上采样超分模型
├── torch_deepdanbooru
├── VAE # VAE
└── VAE-approx
- embeddings # 词嵌入模型
- extensions # ui扩展

从界面功能上最主要的功能是:

  • txt2img: 文生图
  • img2img:图生图
  • Extras: 主要是图片放大功能
  • extensions:ui扩展管理

image.png

从模型上,我们可以结合Stable Diffusion模结构来看下:

  • 左边为VAE模块,有的模型可以替换这个VAE的模块
  • 中间的Diffusion生成模型:通常是主模型(Stable-diffusion目录,当然主模型也可以所有模型),或者主模型微调的部分参数Lora模型
  • 右边为条件输入:如果输入是文本,可以是定制的embedding模型(embeddings目录),如果是想控制可以添加ControlNet

image.png

从Stable Diffusion的关键输入和参数来看:

  • 正向提示词:你要生成图像的描述
  • 负向提示词:不希望出现的情况,比如低质量,多个手指等
  • 采样器:加速图像生成
  • 采样步数
  • CFG scale:图像和提示词之间的关联性,越大关联性越小,随机性越大
  • batch:每次生图的数量

image.png

推荐安装视频指导

推荐一个B站的入门级学习视频,相信学习完可以有一个很好的入门。

相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
目录
相关文章
|
人工智能 搜索推荐
AIGC工具——Stable Diffusion
【1月更文挑战第11天】AIGC工具——Stable Diffusion
545 2
AIGC工具——Stable Diffusion
|
机器学习/深度学习 自然语言处理
文生图模型-Stable Diffusion | AIGC
所谓的生成式模型就是通过文本或者随机采样的方式来得到一张图或者一段话的模型,比如文生图,顾名思义通过文本描述来生成图像的过程。当前流行的文生图模型,如DALE-2, midjourney以及今天要介绍的Stable Diffusion,这3种都是基于Diffusion扩散模型【1月更文挑战第6天】
1452 0
|
编解码 人工智能 自然语言处理
AIGC基础模型——扩散模型(Diffusion Model)
【1月更文挑战第23天】AIGC基础模型——扩散模型(Diffusion Model)
731 1
AIGC基础模型——扩散模型(Diffusion Model)
|
机器学习/深度学习 数据采集 人工智能
「AIGC」Stable Diffusion教程详解
**Stable Diffusion教程摘要:** Stable Diffusion是AI绘画工具,利用GAN学习艺术家风格。基础教程涵盖软件介绍、配置需求(NVIDIA GPU、Windows 10/11)、安装及基础操作,如模型切换、VAE使用、采样步数调整等。AI作画原理涉及U-net、Diffusion模型、文本映射(如CLIP)和条件生成。Stable Diffusion运用Latent Diffusion Model从潜在空间生成高清图像,开源且在艺术创作中广泛应用。
497 0
|
人工智能 运维 API
基于PAI-EAS一键部署Stable Diffusion AIGC绘画
教程中,您将学习如何使用阿里云模型在线服务(PAI-EAS)的预置镜像,快速部署AIGC Stable Diffusion SDWebUI绘画的AI-Web应用,以及启动WebUI进行模型推理。
|
10天前
|
机器学习/深度学习 人工智能 自然语言处理
AIGC技术深度解析:生成式AI的革命性突破与产业应用实战
蒋星熠Jaxonic,AI技术探索者,深耕生成式AI领域。本文系统解析AIGC核心技术,涵盖Transformer架构、主流模型对比与实战应用,分享文本生成、图像创作等场景的实践经验,展望技术趋势与产业前景,助力开发者构建完整认知体系,共赴AI原生时代。
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
AIGC技术发展与应用实践(一文读懂AIGC)
AIGC(人工智能生成内容)是利用AI技术生成文本、图像、音频、视频等内容的重要领域。其发展历程包括初期探索、应用拓展和深度融合三大阶段,核心技术涵盖数据收集、模型训练、内容生成、质量评估及应用部署。AIGC在内容创作、教育、医疗、游戏、商业等领域广泛应用,未来将向更大规模、多模态融合和个性化方向发展。但同时也面临伦理法律和技术瓶颈等挑战,需在推动技术进步的同时加强规范与监管,以实现健康可持续发展。
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
技术创新领域,AI(AIGC)是否会让TRIZ“下岗”?
法思诺创新直播间探讨了AI(AIGC)是否将取代TRIZ的问题。专家赵敏认为,AI与TRIZ在技术创新领域具有互补性,结合两者更务实。TRIZ提供结构化分析框架,AI加速数据处理和方案生成。DeepSeek、Gemini等AI也指出,二者各有优劣,应在复杂创新中协同使用。企业应建立双轨知识库,重构人机混合创新流程,实现全面升级。结论显示,AI与TRIZ互补远超竞争,结合二者是未来技术创新的关键。
188 0
|
9月前
|
人工智能 搜索推荐 数据库
实时云渲染技术赋能AIGC,开启3D内容生态黄金时代
在AIGC技术革命的推动下,3D内容生态将迎来巨大变革。实时云渲染与Cloud XR技术将在三维数字资产的上云、交互及传播中扮演关键角色,大幅提升生产效率并降低门槛。作为云基础设施厂商,抓住这一机遇将加速元宇宙的构建与繁荣。AIGC不仅改变3D内容的生成方式,从手工转向自动生成,还将催生更多3D创作工具和基础设施,进一步丰富虚拟世界的构建。未来,通过文本输入即可生成引人注目的3D环境,多模态模型的应用将极大拓展创作的可能性。
|
11月前
|
人工智能 自然语言处理 数据可视化
什么是AIGC?如何使用AIGC技术辅助办公?
2分钟了解AIGC技术及其如何提高日常办公效率!
3563 4
什么是AIGC?如何使用AIGC技术辅助办公?