Fooocus:一个简单且功能强大的Stable Diffusion webUI

简介: Stable Diffusion是一个强大的图像生成AI模型,但它通常需要大量调整和提示工程。Fooocus的目标是改变这种状况。

Stable Diffusion是一个强大的图像生成AI模型,但它通常需要大量调整和提示工程。Fooocus的目标是改变这种状况。

Fooocus的创始人Lvmin Zhang(也是 ControlNet论文的作者)将这个项目描述为对“Stable Diffusion”和“ Midjourney”设计的重新设计。Fooocus就像是Midjourney的免费离线版本,但是它使用SDXL模型。或者说它将Stable Diffusion的出图过程做了非常好的优化,没有那么多繁琐的配置。

Fooocus内置和自动化了许多优化和质量改进,将其他页面的手动设置变为了自动配置,这样就和Midjourney一样,这将在每次尝试中获得良好的结果。如果你想做更多,你可以使用Fooocus的Advanced选项卡。比如说设置清晰度过滤器或自定义lora。

在这篇文章中,我们将介绍如何在本地和Colab上使用Fooocus

在Windows上运行

只需要在下载文件,解压缩,然后运行run.bat,就是这么简单

在第一次运行时,它会自动下载模型,如果你已经有这些文件,你可以把它们复制到上面的位置,以加快安装速度。

  • sd_xl_base_1.0_0.9vae.safetensors
  • sd_xl_refiner_1.0_0.9vae.safetensors

Fooocus可以在16gb RAM和6GB VRAM的系统上运行,性能非常好,下面图片来自的Github。

最低要求是4GB Nvidia GPU内存(4GB VRAM)和8GB系统内存(8GB RAM)。

在Linux上运行

Linux上会更加简单:

 git clone https://github.com/lllyasviel/Fooocus.git
 cd Fooocus
 conda env create -f environment.yaml
 conda activate fooocus
 pip install -r requirements_versions.txt

与Windows类似下载模型以加快过程,但是他的启动命令变为:

 python launch.py

或者如果想打开远程端口,需要使用listen参数

 python launch.py --listen

在Google Colab上运行

因为需要使用GPU,所以我们这里选择T4 GPU,因为它已经够用了

然后使用下面命令,由于下载和安装,该操作可能需要一些时间才能完成,但是Colab的下载速度很快,我们不需要传输模型了

 %cd /content
 !git clone https://github.com/lllyasviel/Fooocus

 !apt -y update -qq
 !wget https://github.com/camenduru/gperftools/releases/download/v1.0/libtcmalloc_minimal.so.4 -O /content/libtcmalloc_minimal.so.4
 %env LD_PRELOAD=/content/libtcmalloc_minimal.so.4

 !pip install torchsde==0.2.5 einops==0.4.1 transformers==4.30.2 safetensors==0.3.1 accelerate==0.21.0
 !pip install pytorch_lightning==1.9.4 omegaconf==2.2.3 gradio==3.39.0 xformers==0.0.20 triton==2.0.0 pygit2==1.12.2

 !apt -y install -qq aria2
 !aria2c --console-log-level=error -c -x 16 -s 16 -k 1M https://huggingface.co/ckpt/sd_xl_base_1.0/resolve/main/sd_xl_base_1.0_0.9vae.safetensors -d /content/Fooocus/models/checkpoints -o sd_xl_base_1.0_0.9vae.safetensors
 !aria2c --console-log-level=error -c -x 16 -s 16 -k 1M https://huggingface.co/ckpt/sd_xl_refiner_1.0/resolve/main/sd_xl_refiner_1.0_0.9vae.safetensors -d /content/Fooocus/models/checkpoints -o sd_xl_refiner_1.0_0.9vae.safetensors
 !aria2c --console-log-level=error -c -x 16 -s 16 -k 1M https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/resolve/main/sd_xl_offset_example-lora_1.0.safetensors -d /content/Fooocus/models/loras -o sd_xl_offset_example-lora_1.0.safetensors

 %cd /content/Fooocus
 !git pull
 !python launch.py --share

当它完成时,会看到一个连接,类似下图

点击右边的gradio.live链接,就可以看到界面了,如果要进行高级设置,可以在advanced 选项中看到更多的高级设置

总结

Fooocus的操作要比AUTOMATIC1111方便很多,并且安装也简单,看看我生成的结果

最后Github更详细信息可以看这里

https://avoid.overfit.cn/post/7428cf29b9bd438e9948178252bf9ee5

目录
相关文章
|
存储 自然语言处理 物联网
StableDiffusion-02 LoRA上手使用实测 尝试生成图片 使用多个LoRA 调整LoRA效果 10分钟上手 多图
StableDiffusion-02 LoRA上手使用实测 尝试生成图片 使用多个LoRA 调整LoRA效果 10分钟上手 多图
631 1
|
人工智能 编解码
CogVideoX-Flash:智谱首个免费AI视频生成模型,支持文生视频、图生视频,分辨率最高可达4K
CogVideoX-Flash 是智谱推出的首个免费AI视频生成模型,支持文生视频、图生视频,最高支持4K分辨率,广泛应用于内容创作、教育、广告等领域。
1314 5
CogVideoX-Flash:智谱首个免费AI视频生成模型,支持文生视频、图生视频,分辨率最高可达4K
|
机器学习/深度学习 人工智能 自然语言处理
MetaGPT开源自动生成智能体工作流,4.55%成本超GPT-4o
AFlow是由Jiayi Zhang等学者提出的一项新研究,发表于arXiv。它通过将工作流优化问题转化为代码表示空间中的搜索,并引入蒙特卡洛树搜索(MCTS)算法,实现了高效的工作流自动化生成与优化。在六个基准数据集上,AFlow性能比现有基线平均提高5.7%,并使小模型以较低成本超越GPT-4。尽管存在一些局限性,如通用性和计算复杂度,AFlow为降低大型语言模型应用成本提供了新思路,推动了人工智能技术的进步。论文地址:https://arxiv.org/abs/2410.10762。
479 27
|
机器学习/深度学习 人工智能 并行计算
StableDiffusion-01本地服务器部署服务 10分钟上手 底显存 中等显存机器 加载模型测试效果 附带安装指令 多显卡 2070Super 8GB*2
StableDiffusion-01本地服务器部署服务 10分钟上手 底显存 中等显存机器 加载模型测试效果 附带安装指令 多显卡 2070Super 8GB*2
400 0
7-9|Python如何安装ruamel.yaml
7-9|Python如何安装ruamel.yaml
|
安全 前端开发 Android开发
鸿蒙开发|鸿蒙系统的介绍(为什么要学习鸿蒙开发|鸿蒙系统的官方定义|鸿蒙和安卓、ios的对比)
鸿蒙开发学习是一项探索性的工作,旨在开发一个全场景分布式操作系统,覆盖所有设备,让消费者能够更方便、更直观地使用各种设备。
1636 6
鸿蒙开发|鸿蒙系统的介绍(为什么要学习鸿蒙开发|鸿蒙系统的官方定义|鸿蒙和安卓、ios的对比)
|
机器学习/深度学习 人工智能 算法
Stable Diffusion中的常用术语解析
在使用stable diffusion的过程中,你会听到很多术语,是不是很迷茫这些词到底是做什么的?不用怕,看这篇文件就够了。
|
编解码 缓存 前端开发
【专栏:HTML与CSS移动端开发篇】移动端网页布局与适配
【4月更文挑战第30天】本文探讨了如何使用HTML和CSS优化移动端网页布局与适配,强调响应式设计、灵活布局和媒体查询的重要性。针对移动设备的屏幕尺寸、操作方式、网络速度和性能差异,提出了断点选择、触摸优化、图像和性能优化等最佳实践。测试和调试、框架工具的应用也是关键步骤,以确保在多设备上提供优秀用户体验。开发者需持续学习新趋势和工具,以适应移动端发展。
744 2
|
开发框架 监控 NoSQL
.NET开源的实时应用监控系统 - WatchDog
.NET开源的实时应用监控系统 - WatchDog
239 0

热门文章

最新文章