Stable Diffusion XL:更快,更强

简介: 总的来说,新模型并没有给我留下深刻印象。MidJourney、Leonardo AI 和 Microsoft Image Generator 仍然有更好看的生成效果。尽管 Stable Diffusion XL 与之前的 AI 模型相比似乎没有显着进步,但它仍然向前迈进了一步,并且肯定还有进一步改进的空间。我期待Stability AI官方能够公布更多细节,而且我坚信最终正式发布的产品会比预览模型更好。

Stable Diffusion XL:更快,更强

4月4日,Stability AI 的创始人兼首席执行官 Emad Mostaque 发推宣布,Stable Diffusion XL 进入公测阶段。

核心信息总结起来有2点:

  1. “XL”不是新模型的官方名称,Stability AI后面会官宣正式名称;
  2. 图片生成质量得到了进一步提升;
  3. 图像生成速度比之前版本快很多。

实际效果到底怎么样,我给大家做了一个对比。

5ce8490d4368d5c585efaa06eb858256.png

效果对比

Prompt: Luxury sports car with aerodynamic curves, shot in a high contrast, high key lighting with shallow depth of field, exotic, detailed, sporty, studio lighting, HQ, 4k

Stable Diffusion 2.1 Stable Diffusion XL
sd1.png sd2.png

$$
\ast\ast\ast
$$

Prompt: Bowl of steaming hot ramen with a perfect egg in the center, surrounded by thin slices of meat, green onions, and nori, with a flavorful broth and perfect noodles, high detail, focused on texture and steam

Stable Diffusion 2.1 Stable Diffusion XL
sd3.png sd4.png

$$
\ast\ast\ast
$$

Prompt: Enchanting waterfall in a lush jungle, surrounded by exotic plants and wildlife, tranquil, serene, high detail, tropical landscape

Stable Diffusion 2.1 Stable Diffusion XL
sd5.png sd6.png

坦白说,我真的没有看到新模型有在图像生成质量上有令人眼前一亮的改进。 在某些情况下,XL生成的图片整体上会更好看一些,但这见仁见智,没有显著的差异。也许需要在设置中进行一些调整才能产生令人惊叹的效果。

在生成速度方面,确实有所提高,但不像Emad Mostaque说的那样“大幅提高”,可能与硬件环境有关。

上面图片你认为哪个更好,可以评论区点评,或文章末尾参与投票。

如何获取

Stable Diffusion XL(测试版)可在新的 Dreamstudio 网站上访问。

fbf68920167f9b34eb18c9c81edaf230.png

旧版网站上似乎现在也可以访问了:

c09eeed10c8daad0d61d9a8207b9a674.png

价格分析

官网依然是根据点数向你收费。

$10 = 1000 点

具体消耗多少点数取决于图像的大小和生成步数,下表是Stability AI的价格模型:

步数 512×512 512×768 512×1024 768×768 768×1024 1024×1024
15 0.1 0.3 0.4 0.5 0.7 1.0
30 0.2 0.5 0.8 1.0 1.4 1.9
50 0.4 0.9 1.3 1.6 2.3 3.2
100 0.7 1.7 2.6 3.1 4.5 6.4
150 1.0 2.5 3.9 4.6 6.7 9.5

如果将所有设置设为默认值,那么 1000 点大约可生成 5000 张图片。

总结

总的来说,新模型并没有给我留下深刻印象。 MidJourney、Leonardo AI 和 Microsoft Image Generator 仍然有更好看的生成效果。

尽管 Stable Diffusion XL 与之前的 AI 模型相比似乎没有显着进步,但它仍然向前迈进了一步,并且肯定还有进一步改进的空间。

我期待Stability AI官方能够公布更多细节,而且我坚信最终正式发布的产品会比预览模型更好。

目录
相关文章
|
存储 物联网 Serverless
玩转AIGC,基于函数计算一键部署 Stable Diffusion
玩转AIGC,基于函数计算一键部署 Stable Diffusion
904 0
|
Serverless
使用ControlNet控制Stable Diffusion时
使用ControlNet控制Stable Diffusion时
151 3
|
2月前
|
机器学习/深度学习 算法 测试技术
3天把Llama训成Mamba,性能不降,推理更快!
【10月更文挑战第7天】论文《Distilling and Accelerating Hybrid Models》提出了一种将大型Transformer模型高效转化为线性RNN模型的新方法,通过重用注意力层中的线性投影权重,实现性能不降甚至提升。研究通过多阶段蒸馏方法训练模型,包括渐进蒸馏、监督微调和定向偏好优化,确保了模型在标准聊天基准测试中的优异表现。实验结果表明,蒸馏后的混合模型在多个任务上与原模型及同类模型相比,表现出色或更优。然而,该方法仍需大量计算资源,并在特定任务上可能存在性能差距。
47 1
|
6月前
|
弹性计算 运维 监控
函数计算产品使用问题之如何在阿里云端stable-diffusion训练lora
函数计算产品作为一种事件驱动的全托管计算服务,让用户能够专注于业务逻辑的编写,而无需关心底层服务器的管理与运维。你可以有效地利用函数计算产品来支撑各类应用场景,从简单的数据处理到复杂的业务逻辑,实现快速、高效、低成本的云上部署与运维。以下是一些关于使用函数计算产品的合集和要点,帮助你更好地理解和应用这一服务。
|
6月前
|
人工智能 监控 异构计算
Stable Diffusion XL 优化终极指南
【6月更文挑战第9天】Stable Diffusion XL 图像生成模型的优化涉及硬件(强GPU)、软件参数调整、数据增强、混合精度使用、模型压缩、性能监控、可解释性和持续学习。通过综合优化这些方面,可提升模型速度和图像质量。示例代码展示模型应用,并强调了根据应用场景定制参数的重要性。不断探索新技术和策略,以优化模型并适应变化需求。
185 10
|
7月前
|
运维 自然语言处理 算法
使用NVIDIA TensorRT-LLM支持CodeFuse-CodeLlama-34B上的int4量化和推理优化实践
CodeFuse是由蚂蚁集团开发的代码语言大模型,旨在支持整个软件开发生命周期,涵盖设计、需求、编码、测试、部署、运维等关键阶段。为了在下游任务上获得更好的精度,CodeFuse 提出了多任务微调框架(MFTCoder),能够解决数据不平衡和不同收敛速度的问题。通过对比多个预训练基座模型的精度表现,我们发现利用 MFTCoder 微调后的模型显著优于原始基座模型。其中,尤为值得关注的是采用了 MFTCoder 框架,并利用多任务数据集进行微调的 CodeFuse-CodeLlama-34B模型,在HumanEval 评估数据集中取得了当时的最好结果。
240 0
使用NVIDIA TensorRT-LLM支持CodeFuse-CodeLlama-34B上的int4量化和推理优化实践
|
7月前
|
机器学习/深度学习 人工智能 计算机视觉
OpenVINO异步Stable Diffusion推理优化方案
OpenVINO异步Stable Diffusion推理优化方案
152 0
|
7月前
|
机器学习/深度学习 自然语言处理 测试技术
Stable Diffusion——外挂VAE模型
Stable Diffusion——外挂VAE模型
622 0
|
Serverless
ControlNet控制Stable Diffusion
ControlNet控制Stable Diffusion
83 3
|
机器学习/深度学习 算法 自动驾驶
YOLOX-PAI:加速YOLOX,比YOLOV6更快更强
本文,我们将逐一介绍所探索的相关改进与消融实验结果,如何基于PAI-EasyCV使用PAI-Blade优化模型推理过程,及如何使用PAI-EasyCV进行模型训练、验证、部署和端到端推理。欢迎大家关注和使用PAI-EasyCV和PAI-Blade,进行简单高效的视觉算法开发及部署任务。