AI绘画提示词创作指南:DALL·E 2、Midjourney和 Stable Diffusion最全大比拼 ⛵

简介: 随着Diffusion Model的普及,AI绘画只需要你输入文本描述,模型就能在几分钟内生成精准匹配的精美图像。本文从使用步骤、费用和商用等角度对3个主流平台进行比较:DALL·E2、Midjourney、Stable Diffusion。
3c280949c91a5c12faa61ee2afbe2db9.png
💡 作者: 韩信子@ ShowMeAI
📘 深度学习实战系列https://www.showmeai.tech/tutorials/42
📘 自然语言处理实战系列https://www.showmeai.tech/tutorials/45
📘 计算机视觉实战系列https://www.showmeai.tech/tutorials/46
📘 本文地址https://www.showmeai.tech/article-detail/392
📢 声明:版权所有,转载请联系平台与作者并注明出处
📢 收藏 ShowMeAI查看更多精彩内容
a4fe316ac0d412a6b44ec64d28d9dc6a.png

随着 Diffusion Model 的普及,大家可能注意到互联网上有着铺天盖地的人工智能 (AI) 生成的图像,这些图像都是使用『文本到图像』的生成模型生成的:只需要输入一个文本描述(prompt/提示),AI 模型就可以在几秒几分钟内生成一个或多个精准匹配提示的精美图像

ShowMeAI在前序的文章中也做了一些相关的介绍:

3c68e734cb73054e7c48df5f0445d2c7.png
📘 你给文字描述,AI艺术作画,精美无比!附源码,快来试试!
5cc08cb686a8a79986d3378e6c312c4d.png
📘 使用Hugging Face发布的diffuser模型快速绘画

截止目前为止,三个最流行的AI作画产品是 📘Stable Diffusion、📘Midjourney和 📘DALL·E 2

2bfce2c3ec333e131c34fa38fbde4166.png

在本文中,ShowMeAI将对这3种模型进行比较,我们不会介绍这些 AI 模型后面的复杂数学原理,而聚焦在使用方法和效果对比。

💡 DALL·E2

📘DALL·E2由 📘OpenAI开发,目前产品版本处于 beta 阶段。

8d9b666f67acfb3632d92abaa5c3d6a8.png

💦 如何使用

① 文本提示作图

在 DALL·E2 中,可以使用 『文本到图像』和『文本引导的图像到图像』生成算法生成图像。 使用『文本引导的图像到图像』生成算法,您可以上传图像,AI会以你上传的图像为初始图,根据提示来作图。

c0026633a4bfe4c8ce96cc268c2fc4b4.png
上图 DALL·E 作画提示词:A stop-motion animation still of a cute robot standing in the forest (一个可爱的机器人站在森林里的定格动画)。
83a44d6dd3e89899de7c3bd6e94b5d36.png

② 文本提示的图到图

它还有『编辑生成的图像』功能,使用『文本引导图像到图像』生成算法,我们可以在已生成的图像之上生成另一个图像来扩展生成的图像,或者对有遮蔽的图像进行补全创作。

ced92a142ddb5cbbf840740e200a5d91.png
b14d0452ed150c17c4e8e7dc797014c9.png

③ 分辨率和格式

在 DALL·E2 中,所有生成的图像都具有 1024 x 1024 的固定图像大小

💦 使用注意事项

首次访问 DALL·E 可以获得 50 个免✦费积分(要求在第一个月内用完)。 在接下来的每个月中,都会获得 15 个免✦费积分(对,同样的道理,免✦费积分不会累加)。每1个提示默认会创建4个图像,消耗大约1个积分,你也可以付费花 15 美元购买 115 次作图。

DALL·E2 生成的图像可以用于任何合法目的,包括商✦业用途。

💡 Midjourney

📘Midjourney 由同名研究实验室开发,目前处于公测阶段。

c6be7bd8fe06785cfeaf86207e1a3231.png

💦 如何使用

生成图像 Midjourney ,您可以使用 📘Midjourney Discord 服务器

6ff124dbf5b3e48a85e9021128c9fb39.png

① 文本提示作图

Midjourney的『文本提示做图』也非常简单,也同样是提交提示文本,就可以生成对应的结果。

bd8869f674e0ad34d950e559aed5f2d2.png
上面的截图,是在 Midjourney Discord Server 上提交提示 A stop-motion animation still of a cute robot standing in the forest (一个可爱的机器人站在森林里的定格动画) 的运行结果。

② 图像变体&高分辨率

此外,您可以创建生成图像的其他变体或将生成的图像放大到更高分辨率。

42683d0301a00f2d00fb1232b6f1a89e.png

我们也可以输入一个或多个图像的 URL,以其作为初始,配以提示文本引导作图。

c7ba78776617357286f960e8ee28cd4f.png

分辨率和格式

Midjourney支持创建各种格式的图像,图像分辨率高达 2048 x 2048

💦 使用注意事项

首次加入 Midjourney Discord 服务器,我们可以获得 25 分钟的免✦费 GPU 时间,大致可以支撑 25 次免✦费生成(1次生成大概需要1 GPU 分钟)。单次请求将根据提示生成4个候选画作。

Midjourney允许付费会员将 Midjourney 生成的图像用于商✦业用途。

💡 Stable Diffusion

Stable Diffusion 由 📘CompVis、 📘Stability AI和 📘LAION开源,于 2022 年 8 月发布,大家都可以使用(但需要一些服务器计算资源支撑)。

689d71cc92cbca85f1aa5990e8de06f4.png

💦 如何使用

如果要本地运行 Stable Diffusion,至少需要 10GB VRAM 的 GPU。 Huggingface 提供了有关如何使用 📘Stable Diffusion 教程

如果您不想编写和触碰任何代码,也可以使用 📘Dream Studio Web 应用程序,只需要注册一个帐户即可。

066e3354a5739b9b67bf7e9950a5b297.png

① 文本提示做图

Dream Studio 提供 『文本到图像』,它具有各种选项,例如设置生成图像的步骤数或设置随机种子,可以设置单次生成的图像数量(1 到 9 之间)。

169d19b006f3649eab3bca4ddc5a6ce3.png
上图为 Dream Studio 提示词 A stop-motion animation still of a cute robot standing in the forest (一个可爱的机器人站在森林里的定格动画) 的运行结果。

一个快捷尝试的方式是在 📘HuggingFace的 📘Diffuse the Rest应用里尝试,如下图所示:

34166429ff20c3a50cf981aceeca29d0.png

② 分辨率和格式

使用 Stable Diffusion,您可以创建各种格式的图像,图像分辨率高达 1024 x 1024

💦 使用注意事项

首次注册 DreamStudio beta 将获得价值 2 英镑的积分。 这大约相当于 200 次单张图免✦费生成的额度。 免✦费试用后可以按 10 英镑的增量购买额外的积分。
随意使用来自 DreamStudio Beta 和 Stable Diffusion beta Discord 服务的图像用于任何用途, 包括商✦业目的

💡 总结

在本文中,我们比较了目前最流行的3个图像生成平台 DALL·E2、Midjourney、Stable Diffusion。对比的结果汇总如下表:

不过请大家注意,下表可能会发生变化,因为这三个模型正在 积极开发中,功能也在不断完善。下方的信息来源时间点为2022年9月。
1315a58dce8089d22318d867b45b893d.png

参考资料

推荐阅读

e9190f41b8de4af38c8a1a0c96f0513b~tplv-k3u1fbpfcp-zoom-1.image

目录
相关文章
|
1月前
|
人工智能 开发者
MidJourney 替代品:为什么 FLUX.1 是终极 AI 图像生成工具
MidJourney 是目前流行的 AI 驱动图像生成工具,以其艺术风格和易用性闻名。然而,随着技术进步,其他模型如 FLUX.1、DALL·E 3 和 Stable Diffusion 3 也崭露头角,提供了更多定制选项和高质量输出。其中,FLUX.1 以其开源性质、卓越图像质量和开发者友好性脱颖而出,成为 MidJourney 的有力替代品。选择合适的工具应基于具体需求,FLUX.1 在灵活性和高性能方面表现优异。
|
2月前
|
人工智能 测试技术
语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场
【9月更文挑战第20天】Meta研究人员提出了一种名为Transfusion的创新方法,通过融合Transformer和Diffusion模型,实现了能同时处理文本和图像数据的多模态模型。此模型结合了语言模型的预测能力和Diffusion模型的生成能力,能够在单一架构中处理混合模态数据,有效学习文本与图像间的复杂关系,提升跨模态理解和生成效果。经过大规模预训练,Transfusion模型在多种基准测试中表现出色,尤其在图像压缩和模态特定编码方面具有优势。然而,其训练所需的大量计算资源和数据、以及潜在的伦理和隐私问题仍需关注。
69 7
|
2月前
|
人工智能 计算机视觉 Python
AI计算机视觉笔记八:基于mediapipe的虚拟绘画
该项目利用MediaPipe手部关键点识别技术,实现了隔空绘画功能。用户可以通过手势控制绘画工具,选择颜色或橡皮擦。环境配置基于`mediapipe_env`,在PyCharm中运行。项目包括两个文件:`AiVirtualPainter.py`负责绘画逻辑,`HandTrackingModule.py`用于手部关键点检测。此项目展示了AI技术在互动应用中的潜力,适合初学者实践与学习。
66 10
|
4月前
|
机器学习/深度学习 人工智能 算法
解决方案评测:通义万相 AI 绘画创作
通义万相 AI 绘画创作工具在功能、使用体验等方面表现出色,为用户提供了一种便捷、高效的绘画创作方式。虽然存在一些不足之处,但随着技术的不断发展和优化,相信其性能和表现会不断提升。对于艺术家、设计师、创意工作者以及普通爱好者来说,通义万相都是一款值得尝试和探索的 AI 绘画工具。
400 4
解决方案评测:通义万相 AI 绘画创作
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
AICG驱动的叙事革命:AI在电影剧本创作中的角色
【7月更文第25天】随着人工智能技术的发展,尤其是自然语言处理(NLP)的进步,AI已经开始涉足创意写作领域。在电影行业中,AI不仅能够帮助创作概念和大纲,甚至还能生成完整的剧本草稿。本文将探讨AI如何改变电影剧本创作,并通过一个简单的Python示例展示如何利用AI模型生成剧本片段。
105 3
|
4月前
|
人工智能 弹性计算 自然语言处理
通义万相AI创作绘画产品方案产品体验
本次我有幸接触并体验了阿里云通义万相这一创新的AI绘画工具方案。该方案它是在利用人工智能技术,为用户提供创新、便捷的绘画创作体验。在体验过程中,我主要关注了产品的易用性、功能性、创新性、用户体验及方案本身等方面。
168 3
|
4月前
|
弹性计算 人工智能 对象存储
来自通义万相的创意加速器:AI 绘画创作
【7月更文挑战第11天】来自通义万相的创意加速器:AI 绘画创作
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
|
4月前
|
机器学习/深度学习 人工智能
AI 助力,歌词创作不再是难题
妙笔生词智能写歌词软件,借助AI技术,突破音乐创作难题。通过深度学习大量优秀歌词,理解词汇、句式和韵律,只需输入主题、风格和情感,即可快速生成创意歌词初稿,覆盖多种音乐风格。这款工具助你打破创作瓶颈,激发灵感,让歌词创作更高效、更具乐趣,聚焦音乐的情感表达。
|
3天前
|
机器学习/深度学习 人工智能 自然语言处理
当前AI大模型在软件开发中的创新应用与挑战
2024年,AI大模型在软件开发领域的应用正重塑传统流程,从自动化编码、智能协作到代码审查和测试,显著提升了开发效率和代码质量。然而,技术挑战、伦理安全及模型可解释性等问题仍需解决。未来,AI将继续推动软件开发向更高效、智能化方向发展。