Fooocus 超过 180 种风格的傻瓜式 AI 图片生成工具

简介: Fooocus 超过 180 种风格的傻瓜式 AI 图片生成工具

Fooocus 对 Stable Diffusion 和 Midjourney 设计的重新思考,提供超过 180 种风格的插图,展示了丰富多样的艺术表现形式。

image.png

什么是Fooocus?

虽然 StableDiffusionWebUI 拥有强大的功能,但很多用户更喜欢在 Midjourney 中使用提示的简单方法。受到 Stable Diffusion 和 StableDiffusionWebUI 的 ControlNet 等扩展的启发,ControlNet 的作者 lllyasviel 推出了一款名为 Fooocus 的新软件。

简化的交互

Fooocus 的目的是让用户只关注提示,而无需了解数百个设置。Fooocus 从 StableDiffusionWebUI、ComfyUI 和 Midjourney 的仅提示图像生成方法中汲取灵感,是 Stable Diffusion 的重新设计版本,以提示使用为中心,自动处理其他设置。目标是成为简单易用、高质量的图像生成软件。

image.png

上面为主界面,如 StableDiffusionWebUI,是使用Gradio构建的。而 Fooocus 仅由一个提示输入框和一个Generate按钮组成,保持界面简约、整洁。

减少内存使用

Fooocus 的另一个值得注意的功能是成功生成 SDXL 图像所需的内存VRAM极少。官方声明称,即使只有 6GB VRAM,该软件也能有效运行。这是一项重大改进,与之前一样,使用 SD 1.5 生成 SDXL 图像需要更多的内存VRAM。现在,即使内存VRAM有限的用户也可以顺利创建 SDXL 图像。

image.png

安装Fooocus

从这里开始介绍如何安装。

项目的github地址github.com/lllyasviel/…

Windows版本

  1. 从 Github 下载 zip 文件:github.com/lllyasviel/…
  2. 解压并运行 run.bat 来进行安装

image.png

  1. 首次运行时,软件会自动下载 sd_xl_base_1.0_0.9vae.safetensorssd_xl_refiner_1.0_0.9vae.safetensors等大文件,大小均超过 6GB。这个过程可能需要一些时间。

MacOS / Linux 版本

在继续之前,可以参阅 StableDiffusionWebUI 和 Python 设置的安装指南。如果已经安装了Python,则可以跳过这些步骤。

  1. 创建目录,使用 Git 将 Fooocus 文件下载到文件夹

bash

复制代码

git clone https://github.com/lllyasviel/Fooocus.git
  1. 设置虚拟环境(venv)python3 -m venv env
  2. 激活虚拟环境 source env/bin/activate
  3. 安装所需的Python包 pip install pygit2==1.12.2
  4. 安装完成后,使用以下命令启动 Fooocus python3 entry_with_update.py --share
  5. 首次运行时,软件会自动下载 sd_xl_base_1.0_0.9vae.safetensorssd_xl_refiner_1.0_0.9vae.safetensors等大文件,大小均超过 6GB。这个过程可能需要一些时间。

成功之后会生成一个零时的URL。

基本用法

使用 Fooocus 非常简单,只需在提示框中输入提示,然后单击Generate 生成即可。默认情况下,软件会生成两张具有电影风格的 1152 x 896 图像。

image.png

高级设置

会注意到提示输入框下方有一个高级按钮,可引导进行高级设置。

Setting 设置

image.png

  • Performance 性能:默认 Speed 选项使用30步骤生成图像,Quality 需要更长的时间,但使用60步骤可以获得更好的结果。
  • Aspect Ratios width × height 宽高比:默认设置为 1152 x 896
  • Image Number 图像数量:生成的图像数量(最多32)。
  • Negative Prompt 否定提示:不希望出现在生成的图像中的元素或概念。它允许指定应从图像输出中排除的内容。
  • Random 随机种子:默认是随机的,也可以使用自定义 Seed 种子数。

Style 风格

此部分设置生成的图像样式,默认设置为样式 cinematic-default 。有超过 100 种不同的款式可供选择。

image.png

虽然名称可能会对这种风格有一个大概的了解,但如果没有视觉参考,要完全理解通常是很困难的。为了更加直观的感受Style的效果,这里将使用提示 1 beautiful girl 为每种样式生成分辨率为 1024 x 960 的图像。这些参考图像提供了一种比较风格的实用方法。

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

总结

虽然仍处于早期开发阶段,Fooocus 已经带来了相当大的兴奋。其简单的操作和资源节省功能是 Stable Diffusion 的用户友好增强功能,Stable Diffusion 是一种以其最初陡峭的学习曲线而闻名的工具。希望 Fooocus 能够不断发展成为一款功能强大且用户友好的软件,让更多的人能够参与到人工智能驱动的艺术创作中。


相关文章
|
19天前
|
机器学习/深度学习 人工智能 自然语言处理
Sketch2Lineart:AI绘画工具,自动将手绘草图转换成清晰的线条画
Sketch2Lineart是一款基于人工智能的绘画工具,能够自动将手绘草图转换成清晰的线条画。该工具支持多种功能,如草图转线稿、自动描述生成、细节调整和风格定制等,适用于艺术创作、产品设计、教育培训等多个领域。
131 60
Sketch2Lineart:AI绘画工具,自动将手绘草图转换成清晰的线条画
|
1天前
|
人工智能 自然语言处理 搜索推荐
你用过最好用的AI工具是什么?
2023年AI革命风起云涌,众多产品令人振奋。我体验了OpenAI的ChatGPT、微软New Bing、Anthropic Claude等多款AI产品。特别推荐微软New Bing,它集成了强大的搜索引擎和语言模型,回答问题精准,提供最新信息,还能免费进行创意绘图。此外,New Bing还集成了Copilot网页助手,帮助用户高效提取和总结内容。
48 27
你用过最好用的AI工具是什么?
|
1天前
|
机器学习/深度学习 人工智能 算法
X-AnyLabeling:开源的 AI 图像标注工具,支持多种标注样式,适于目标检测、图像分割等不同场景
X-AnyLabeling是一款集成了多种深度学习算法的图像标注工具,支持图像和视频的多样化标注样式,适用于多种AI训练场景。本文将详细介绍X-AnyLabeling的功能、技术原理以及如何运行该工具。
18 2
X-AnyLabeling:开源的 AI 图像标注工具,支持多种标注样式,适于目标检测、图像分割等不同场景
|
9天前
|
编解码 人工智能 监控
VISION XL:支持四倍超分辨率的 AI 视频修复处理工具,提供去除模糊、修复缺失等功能
VISION XL是一款基于潜在扩散模型的高效视频修复和超分辨率工具,能够修复视频缺失部分、去除模糊,并支持四倍超分辨率。该工具优化了处理效率,适合快速处理视频的应用场景。
55 6
VISION XL:支持四倍超分辨率的 AI 视频修复处理工具,提供去除模糊、修复缺失等功能
|
16天前
|
存储 人工智能 数据库
Codel:AI代理工具,支持在终端、浏览器、编辑器执行复杂任务和项目
Codel是一款全自主AI代理工具,支持在终端、浏览器和编辑器中执行复杂任务和项目。它运行在沙盒化的Docker环境中,具备自主操作能力,内置浏览器和文本编辑器,所有操作记录存储于PostgreSQL数据库。Codel能够自动完成复杂任务,如创建项目结构、进行网络搜索等,适用于自动化编程、研究与开发、教育与培训以及数据科学与分析等多个领域。
55 11
Codel:AI代理工具,支持在终端、浏览器、编辑器执行复杂任务和项目
|
18天前
|
机器学习/深度学习 人工智能 自然语言处理
Voice-Pro:开源AI音频处理工具,集成转录、翻译、TTS等一站式服务
Voice-Pro是一款开源的多功能音频处理工具,集成了语音转文字、文本转语音、实时翻译、YouTube视频下载和人声分离等多种功能。它支持超过100种语言,适用于教育、娱乐和商业等多个领域,为用户提供一站式的音频处理解决方案,极大地提高工作效率和音频处理的便捷性。
89 10
Voice-Pro:开源AI音频处理工具,集成转录、翻译、TTS等一站式服务
|
17天前
|
Web App开发 机器学习/深度学习 人工智能
Magic Copy:开源的 AI 抠图工具,在浏览器中自动识别图像进行抠图
Magic Copy 是一款开源的 AI 抠图工具,支持 Chrome 浏览器扩展。它基于 Meta 的 Segment Anything Model 技术,能够自动识别图像中的前景对象并提取出来,简化用户从图片中提取特定元素的过程,提高工作效率。
58 7
Magic Copy:开源的 AI 抠图工具,在浏览器中自动识别图像进行抠图
|
19天前
|
人工智能 自然语言处理 算法
Devika AI:开源的 AI 软件开发工具,理解和执行复杂的人类指令
Devika AI 是一款开源的 AI 软件开发工具,能够理解和执行复杂的人类指令。它通过分解任务、信息搜集和代码生成,帮助开发者提高效率,减少人工干预。本文将详细介绍 Devika AI 的功能、技术原理以及如何运行和配置该工具。
45 9
Devika AI:开源的 AI 软件开发工具,理解和执行复杂的人类指令
|
22天前
|
人工智能 Ubuntu 语音技术
ebook2audiobookXTTS:开源电子书转有声书 AI 工具,支持 16 种语言
ebook2audiobookXTTS 是一款开源的 AI 工具,能够将电子书转换为有声书,支持多种电子书格式和 16 种语言。该工具利用 Coqui XTTS 技术实现高质量的文本到语音转换,并提供命令行、Web 界面和 Docker 容器等多种使用方式。
54 3
ebook2audiobookXTTS:开源电子书转有声书 AI 工具,支持 16 种语言
|
22天前
|
人工智能 小程序 IDE
【一步步开发AI运动小程序】九、姿态辅助调试桌面工具的使用
随着AI技术的发展,各大厂商推出的AI运动APP如“乐动力”、“天天跳绳”等,使云上运动会、线上健身等概念大热。本文将指导你如何利用“云智AI运动识别小程序插件”,在微信小程序中实现类似功能,包括工具搭建、服务启动及数据回传等步骤,助力开发者高效开发AI运动小程序。
【一步步开发AI运动小程序】九、姿态辅助调试桌面工具的使用