AI绘画提示词创作指南:DALL·E 2、Midjourney和 Stable Diffusion最全大比拼 ⛵

简介: 随着Diffusion Model的普及,AI绘画只需要你输入文本描述,模型就能在几分钟内生成精准匹配的精美图像。本文从使用步骤、费用和商用等角度对3个主流平台进行比较:DALL·E2、Midjourney、Stable Diffusion。
3c280949c91a5c12faa61ee2afbe2db9.png
💡 作者: 韩信子@ ShowMeAI
📘 深度学习实战系列https://www.showmeai.tech/tutorials/42
📘 自然语言处理实战系列https://www.showmeai.tech/tutorials/45
📘 计算机视觉实战系列https://www.showmeai.tech/tutorials/46
📘 本文地址https://www.showmeai.tech/article-detail/392
📢 声明:版权所有,转载请联系平台与作者并注明出处
📢 收藏 ShowMeAI查看更多精彩内容
a4fe316ac0d412a6b44ec64d28d9dc6a.png

随着 Diffusion Model 的普及,大家可能注意到互联网上有着铺天盖地的人工智能 (AI) 生成的图像,这些图像都是使用『文本到图像』的生成模型生成的:只需要输入一个文本描述(prompt/提示),AI 模型就可以在几秒几分钟内生成一个或多个精准匹配提示的精美图像

ShowMeAI在前序的文章中也做了一些相关的介绍:

3c68e734cb73054e7c48df5f0445d2c7.png
📘 你给文字描述,AI艺术作画,精美无比!附源码,快来试试!
5cc08cb686a8a79986d3378e6c312c4d.png
📘 使用Hugging Face发布的diffuser模型快速绘画

截止目前为止,三个最流行的AI作画产品是 📘Stable Diffusion、📘Midjourney和 📘DALL·E 2

2bfce2c3ec333e131c34fa38fbde4166.png

在本文中,ShowMeAI将对这3种模型进行比较,我们不会介绍这些 AI 模型后面的复杂数学原理,而聚焦在使用方法和效果对比。

💡 DALL·E2

📘DALL·E2由 📘OpenAI开发,目前产品版本处于 beta 阶段。

8d9b666f67acfb3632d92abaa5c3d6a8.png

💦 如何使用

① 文本提示作图

在 DALL·E2 中,可以使用 『文本到图像』和『文本引导的图像到图像』生成算法生成图像。 使用『文本引导的图像到图像』生成算法,您可以上传图像,AI会以你上传的图像为初始图,根据提示来作图。

c0026633a4bfe4c8ce96cc268c2fc4b4.png
上图 DALL·E 作画提示词:A stop-motion animation still of a cute robot standing in the forest (一个可爱的机器人站在森林里的定格动画)。
83a44d6dd3e89899de7c3bd6e94b5d36.png

② 文本提示的图到图

它还有『编辑生成的图像』功能,使用『文本引导图像到图像』生成算法,我们可以在已生成的图像之上生成另一个图像来扩展生成的图像,或者对有遮蔽的图像进行补全创作。

ced92a142ddb5cbbf840740e200a5d91.png
b14d0452ed150c17c4e8e7dc797014c9.png

③ 分辨率和格式

在 DALL·E2 中,所有生成的图像都具有 1024 x 1024 的固定图像大小

💦 使用注意事项

首次访问 DALL·E 可以获得 50 个免✦费积分(要求在第一个月内用完)。 在接下来的每个月中,都会获得 15 个免✦费积分(对,同样的道理,免✦费积分不会累加)。每1个提示默认会创建4个图像,消耗大约1个积分,你也可以付费花 15 美元购买 115 次作图。

DALL·E2 生成的图像可以用于任何合法目的,包括商✦业用途。

💡 Midjourney

📘Midjourney 由同名研究实验室开发,目前处于公测阶段。

c6be7bd8fe06785cfeaf86207e1a3231.png

💦 如何使用

生成图像 Midjourney ,您可以使用 📘Midjourney Discord 服务器

6ff124dbf5b3e48a85e9021128c9fb39.png

① 文本提示作图

Midjourney的『文本提示做图』也非常简单,也同样是提交提示文本,就可以生成对应的结果。

bd8869f674e0ad34d950e559aed5f2d2.png
上面的截图,是在 Midjourney Discord Server 上提交提示 A stop-motion animation still of a cute robot standing in the forest (一个可爱的机器人站在森林里的定格动画) 的运行结果。

② 图像变体&高分辨率

此外,您可以创建生成图像的其他变体或将生成的图像放大到更高分辨率。

42683d0301a00f2d00fb1232b6f1a89e.png

我们也可以输入一个或多个图像的 URL,以其作为初始,配以提示文本引导作图。

c7ba78776617357286f960e8ee28cd4f.png

分辨率和格式

Midjourney支持创建各种格式的图像,图像分辨率高达 2048 x 2048

💦 使用注意事项

首次加入 Midjourney Discord 服务器,我们可以获得 25 分钟的免✦费 GPU 时间,大致可以支撑 25 次免✦费生成(1次生成大概需要1 GPU 分钟)。单次请求将根据提示生成4个候选画作。

Midjourney允许付费会员将 Midjourney 生成的图像用于商✦业用途。

💡 Stable Diffusion

Stable Diffusion 由 📘CompVis、 📘Stability AI和 📘LAION开源,于 2022 年 8 月发布,大家都可以使用(但需要一些服务器计算资源支撑)。

689d71cc92cbca85f1aa5990e8de06f4.png

💦 如何使用

如果要本地运行 Stable Diffusion,至少需要 10GB VRAM 的 GPU。 Huggingface 提供了有关如何使用 📘Stable Diffusion 教程

如果您不想编写和触碰任何代码,也可以使用 📘Dream Studio Web 应用程序,只需要注册一个帐户即可。

066e3354a5739b9b67bf7e9950a5b297.png

① 文本提示做图

Dream Studio 提供 『文本到图像』,它具有各种选项,例如设置生成图像的步骤数或设置随机种子,可以设置单次生成的图像数量(1 到 9 之间)。

169d19b006f3649eab3bca4ddc5a6ce3.png
上图为 Dream Studio 提示词 A stop-motion animation still of a cute robot standing in the forest (一个可爱的机器人站在森林里的定格动画) 的运行结果。

一个快捷尝试的方式是在 📘HuggingFace的 📘Diffuse the Rest应用里尝试,如下图所示:

34166429ff20c3a50cf981aceeca29d0.png

② 分辨率和格式

使用 Stable Diffusion,您可以创建各种格式的图像,图像分辨率高达 1024 x 1024

💦 使用注意事项

首次注册 DreamStudio beta 将获得价值 2 英镑的积分。 这大约相当于 200 次单张图免✦费生成的额度。 免✦费试用后可以按 10 英镑的增量购买额外的积分。
随意使用来自 DreamStudio Beta 和 Stable Diffusion beta Discord 服务的图像用于任何用途, 包括商✦业目的

💡 总结

在本文中,我们比较了目前最流行的3个图像生成平台 DALL·E2、Midjourney、Stable Diffusion。对比的结果汇总如下表:

不过请大家注意,下表可能会发生变化,因为这三个模型正在 积极开发中,功能也在不断完善。下方的信息来源时间点为2022年9月。
1315a58dce8089d22318d867b45b893d.png

参考资料

推荐阅读

e9190f41b8de4af38c8a1a0c96f0513b~tplv-k3u1fbpfcp-zoom-1.image

目录
打赏
0
3
2
0
2388
分享
相关文章
MidJourney 替代品:为什么 FLUX.1 是终极 AI 图像生成工具
MidJourney 是目前流行的 AI 驱动图像生成工具,以其艺术风格和易用性闻名。然而,随着技术进步,其他模型如 FLUX.1、DALL·E 3 和 Stable Diffusion 3 也崭露头角,提供了更多定制选项和高质量输出。其中,FLUX.1 以其开源性质、卓越图像质量和开发者友好性脱颖而出,成为 MidJourney 的有力替代品。选择合适的工具应基于具体需求,FLUX.1 在灵活性和高性能方面表现优异。
VidSketch:手残党逆袭!浙大AI神器草图秒变4K动画,三连提示词玩转影视级特效
VidSketch 是浙江大学推出的创新视频生成框架,通过手绘草图和简单文本提示生成高质量视频动画,降低视频创作的技术门槛,满足多样化的艺术需求。
69 6
VidSketch:手残党逆袭!浙大AI神器草图秒变4K动画,三连提示词玩转影视级特效
🎨 设计师必备!AI Stable Diffusion 提示词神器,让你秒变创意大师!
AI绘图新时代来临,设计师必备工具——**白盒子AI绘图提示词生成器**助你轻松跨越提示词难题。该工具操作简便,支持中英文切换,涵盖近1000个精选提示词,适用于各种风格创作。无论是新手还是专业设计师,都能大幅提升工作效率,快速实现创意构想。网址:[https://www.baihezi.com/ai-painting-prompt](https://www.baihezi.com/ai-painting-prompt)
142 19
🎨  设计师必备!AI Stable Diffusion 提示词神器,让你秒变创意大师!
SPO:如何优化提示词?大模型最懂如何优化自己!开源自监督提示词优化工具,让AI自主优化提示词
本文介绍由DeepWisdom与香港科技大学联合研发的SPO框架,通过自我监督机制实现大语言模型提示优化,仅需3个样本即可达到SOTA效果,优化成本降低至传统方法的1.1%-5.6%。
85 0
SPO:如何优化提示词?大模型最懂如何优化自己!开源自监督提示词优化工具,让AI自主优化提示词
AI助理精准匹配------助力快速搭建Stable Difussion图像生成应用
【10月更文挑战第7天】过去在阿里云社区搭建Stable Diffusion图像生成应用需查阅在线实验室或官方文档,耗时且不便。现阿里云AI助理提供精准匹配服务,直接在首页询问AI助理即可获取详细部署步骤,简化了操作流程,提高了效率。用户可按AI助理提供的步骤快速完成应用创建、参数设置、应用部署及资源释放等操作,轻松体验Stable Diffusion图像生成功能。
PromptWizard:微软开源 AI 提示词自动化优化框架,能够迭代优化提示指令和上下文示例,提升 LLMs 特定任务的表现
PromptWizard 是微软开源的 AI 提示词自动化优化框架,通过自我演变和自我适应机制,迭代优化提示指令和上下文示例,提升大型语言模型(LLMs)在特定任务中的表现。本文详细介绍了 PromptWizard 的主要功能、技术原理以及如何运行该框架。
320 8
PromptWizard:微软开源 AI 提示词自动化优化框架,能够迭代优化提示指令和上下文示例,提升 LLMs 特定任务的表现
关于AI绘画优雅草央千澈整理的一份咒语(与AI对话提示词-应用于AI绘图和AI生成视频)-本文长期更新-本次更新2025年1月15日更新-长期更新建议点赞收藏
关于AI绘画优雅草央千澈整理的一份咒语(与AI对话提示词-应用于AI绘图和AI生成视频)-本文长期更新-本次更新2025年1月15日更新-长期更新建议点赞收藏
89 4
AI助理精准匹配,为您推荐方案——如何添加一个Stable Difussion图像生成应用
介绍了一种利用AI助手快速获取并搭建Stable Diffusion图像生成应用的方法。用户只需在阿里云官网向AI助手提出需求,即可获得详细的实施方案。随后,按照AI助手提供的方案,通过函数计算部署应用,并进行测试。此过程显著提升了开发效率。
882 2
AI助理精准匹配,为您推荐方案——如何添加一个Stable Difussion图像生成应用
Minstrel自动生成结构化提示,让AI为AI写提示词的多代理提示生成框架
在人工智能迅速发展的背景下,有效利用大型语言模型(LLMs)成为重要议题。9月发布的这篇论文提出了LangGPT结构化提示框架和Minstrel多代理提示生成系统,旨在帮助非AI专家更好地使用LLMs。LangGPT通过模块化设计提高提示的泛化能力和可重用性,Minstrel则通过多代理协作自动生成高质量提示。实验结果显示,这两种方法显著提升了LLMs的性能,特别是在大规模模型上效果显著。
205 2
Minstrel自动生成结构化提示,让AI为AI写提示词的多代理提示生成框架
添加一个Stable Difussion图像生成应用,通过向AI助手简单的提问,即可快速搭建Stable Diffusion应用至自己的网站中,大幅提升开发效率。
添加一个Stable Difussion图像生成应用,通过向AI助手简单的提问,即可快速搭建Stable Diffusion应用至自己的网站中,大幅提升开发效率。

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等