Fooocus 超过 180 种风格的傻瓜式 AI 图片生成工具

简介: Fooocus 超过 180 种风格的傻瓜式 AI 图片生成工具

Fooocus 对 Stable Diffusion 和 Midjourney 设计的重新思考,提供超过 180 种风格的插图,展示了丰富多样的艺术表现形式。

image.png

什么是Fooocus?

虽然 StableDiffusionWebUI 拥有强大的功能,但很多用户更喜欢在 Midjourney 中使用提示的简单方法。受到 Stable Diffusion 和 StableDiffusionWebUI 的 ControlNet 等扩展的启发,ControlNet 的作者 lllyasviel 推出了一款名为 Fooocus 的新软件。

简化的交互

Fooocus 的目的是让用户只关注提示,而无需了解数百个设置。Fooocus 从 StableDiffusionWebUI、ComfyUI 和 Midjourney 的仅提示图像生成方法中汲取灵感,是 Stable Diffusion 的重新设计版本,以提示使用为中心,自动处理其他设置。目标是成为简单易用、高质量的图像生成软件。

image.png

上面为主界面,如 StableDiffusionWebUI,是使用Gradio构建的。而 Fooocus 仅由一个提示输入框和一个Generate按钮组成,保持界面简约、整洁。

减少内存使用

Fooocus 的另一个值得注意的功能是成功生成 SDXL 图像所需的内存VRAM极少。官方声明称,即使只有 6GB VRAM,该软件也能有效运行。这是一项重大改进,与之前一样,使用 SD 1.5 生成 SDXL 图像需要更多的内存VRAM。现在,即使内存VRAM有限的用户也可以顺利创建 SDXL 图像。

image.png

安装Fooocus

从这里开始介绍如何安装。

项目的github地址github.com/lllyasviel/…

Windows版本

  1. 从 Github 下载 zip 文件:github.com/lllyasviel/…
  2. 解压并运行 run.bat 来进行安装

image.png

  1. 首次运行时,软件会自动下载 sd_xl_base_1.0_0.9vae.safetensorssd_xl_refiner_1.0_0.9vae.safetensors等大文件,大小均超过 6GB。这个过程可能需要一些时间。

MacOS / Linux 版本

在继续之前,可以参阅 StableDiffusionWebUI 和 Python 设置的安装指南。如果已经安装了Python,则可以跳过这些步骤。

  1. 创建目录,使用 Git 将 Fooocus 文件下载到文件夹

bash

复制代码

git clone https://github.com/lllyasviel/Fooocus.git
  1. 设置虚拟环境(venv)python3 -m venv env
  2. 激活虚拟环境 source env/bin/activate
  3. 安装所需的Python包 pip install pygit2==1.12.2
  4. 安装完成后,使用以下命令启动 Fooocus python3 entry_with_update.py --share
  5. 首次运行时,软件会自动下载 sd_xl_base_1.0_0.9vae.safetensorssd_xl_refiner_1.0_0.9vae.safetensors等大文件,大小均超过 6GB。这个过程可能需要一些时间。

成功之后会生成一个零时的URL。

基本用法

使用 Fooocus 非常简单,只需在提示框中输入提示,然后单击Generate 生成即可。默认情况下,软件会生成两张具有电影风格的 1152 x 896 图像。

image.png

高级设置

会注意到提示输入框下方有一个高级按钮,可引导进行高级设置。

Setting 设置

image.png

  • Performance 性能:默认 Speed 选项使用30步骤生成图像,Quality 需要更长的时间,但使用60步骤可以获得更好的结果。
  • Aspect Ratios width × height 宽高比:默认设置为 1152 x 896
  • Image Number 图像数量:生成的图像数量(最多32)。
  • Negative Prompt 否定提示:不希望出现在生成的图像中的元素或概念。它允许指定应从图像输出中排除的内容。
  • Random 随机种子:默认是随机的,也可以使用自定义 Seed 种子数。

Style 风格

此部分设置生成的图像样式,默认设置为样式 cinematic-default 。有超过 100 种不同的款式可供选择。

image.png

虽然名称可能会对这种风格有一个大概的了解,但如果没有视觉参考,要完全理解通常是很困难的。为了更加直观的感受Style的效果,这里将使用提示 1 beautiful girl 为每种样式生成分辨率为 1024 x 960 的图像。这些参考图像提供了一种比较风格的实用方法。

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

总结

虽然仍处于早期开发阶段,Fooocus 已经带来了相当大的兴奋。其简单的操作和资源节省功能是 Stable Diffusion 的用户友好增强功能,Stable Diffusion 是一种以其最初陡峭的学习曲线而闻名的工具。希望 Fooocus 能够不断发展成为一款功能强大且用户友好的软件,让更多的人能够参与到人工智能驱动的艺术创作中。


相关文章
|
27天前
|
人工智能 自然语言处理 API
Mathtutor on Groq:AI 数学辅导工具,实时计算并展示解题过程,支持通过语音提出数学问题
Mathtutor on Groq 是一款基于 Groq 架构的 AI 数学辅导工具,支持语音输入数学问题,实时计算并渲染解题过程,适用于代数、微积分等领域的学习和教学辅助。
98 5
Mathtutor on Groq:AI 数学辅导工具,实时计算并展示解题过程,支持通过语音提出数学问题
|
24天前
|
人工智能 移动开发 JavaScript
如何用uniapp打包桌面客户端exe包,vue或者uni项目如何打包桌面客户端之electron开发-优雅草央千澈以开源蜻蜓AI工具为例子演示完整教程-开源代码附上
如何用uniapp打包桌面客户端exe包,vue或者uni项目如何打包桌面客户端之electron开发-优雅草央千澈以开源蜻蜓AI工具为例子演示完整教程-开源代码附上
134 18
|
14天前
|
机器学习/深度学习 人工智能 自然语言处理
DeepSeek Artifacts:在线实时预览的前端 AI 编程工具,基于DeepSeek V3快速生成React App
DeepSeek Artifacts是Hugging Face推出的免费AI编程工具,基于DeepSeek V3,支持快速生成React和Tailwind CSS代码,适合快速原型开发和前端组件构建。
244 28
DeepSeek Artifacts:在线实时预览的前端 AI 编程工具,基于DeepSeek V3快速生成React App
|
19天前
|
人工智能 安全 API
OpenHands:能自主检索外部知识的 AI 编程工具,自动执行命令、网页浏览和生成代码等操作
OpenHands 是一款基于 AI 的编程工具,支持多智能体协作,能够自动生成代码、执行命令、浏览网页等,显著提升开发效率。
131 26
OpenHands:能自主检索外部知识的 AI 编程工具,自动执行命令、网页浏览和生成代码等操作
|
12天前
|
人工智能 资源调度 JavaScript
PPTAgent:中科院开源AI工具,自动将文档转化为高质量PPT
PPTAgent 是中科院推出的自动生成演示文稿框架,基于两阶段编辑方法,支持智能分析、大纲生成、幻灯片生成与评估,适用于教育、企业培训等多种场景。
209 18
PPTAgent:中科院开源AI工具,自动将文档转化为高质量PPT
|
26天前
|
人工智能 前端开发 小程序
2024年12月30日蜻蜓蜻蜓AI工具系统v1.0.0发布-优雅草科技本产品前端源代码已对外开源可免费商用-优雅草老八
2024年12月30日蜻蜓蜻蜓AI工具系统v1.0.0发布-优雅草科技本产品前端源代码已对外开源可免费商用-优雅草老八
2024年12月30日蜻蜓蜻蜓AI工具系统v1.0.0发布-优雅草科技本产品前端源代码已对外开源可免费商用-优雅草老八
|
4天前
|
机器学习/深度学习 人工智能 文字识别
Zerox:AI驱动的万能OCR工具,精准识别复杂布局并输出Markdown格式,支持PDF、DOCX、图片等多种文件格式
Zerox 是一款开源的本地化高精度OCR工具,基于GPT-4o-mini模型,支持PDF、DOCX、图片等多种格式文件,能够零样本识别复杂布局文档,输出Markdown格式结果。
37 4
Zerox:AI驱动的万能OCR工具,精准识别复杂布局并输出Markdown格式,支持PDF、DOCX、图片等多种文件格式
|
18天前
|
存储 人工智能 自然语言处理
AI Agent与SaaS工具协同发展的未来:企业智能化的全新范式
AI Agent以自主性和智能化为核心,适合复杂任务的动态执行;而SaaS工具则注重服务的完整性和易用性,适合标准化业务需求。
83 14
AI Agent与SaaS工具协同发展的未来:企业智能化的全新范式
|
24天前
|
数据采集 人工智能 自然语言处理
FireCrawl:开源 AI 网络爬虫工具,自动爬取网站及子页面内容,预处理为结构化数据
FireCrawl 是一款开源的 AI 网络爬虫工具,专为处理动态网页内容、自动爬取网站及子页面而设计,支持多种数据提取和输出格式。
150 18
FireCrawl:开源 AI 网络爬虫工具,自动爬取网站及子页面内容,预处理为结构化数据
|
1月前
|
人工智能 自然语言处理 语音技术
AI 工具导航网站分享
一个致力于成为您在 AI 世界探索旅程中的可靠伙伴,为您搭建起一座通往便捷与高效的桥梁的网站。
AI 工具导航网站分享

热门文章

最新文章