Midjourney|文心一格prompt教程[进阶篇]:Midjourney Prompt 高级参数、各版本差异、官方提供常见问题

简介: Midjourney|文心一格prompt教程[进阶篇]:Midjourney Prompt 高级参数、各版本差异、官方提供常见问题

Midjourney|文心一格prompt教程[进阶篇]:Midjourney Prompt 高级参数、各版本差异、官方提供常见问题

midjourney.png

1.Midjourney Prompt 高级参数

Quality

图片质量是另一个我比较常用的属性,首先需要注意这个参数并不影响分辨率,并不改变分辨率,并不改变分辨率(重要的事情要说三遍)。

它改变的更多的是图片的细节,比如下面这个例子,下方第一张图是 0.25 ,你会发现最右边的图细节比第一张图多很多很多。

但低 Quality 也不是没有好处,它的好处是生成图片的时间会更快,换句话说,你可以花更少的 GPU 时间,我一般会用这个参数做一些探索性生成图,大方向没问题,再让模型丰富细节。

MJ61.png

除了在 prompt 里输入外,你也可以在设置里,调整默认的版本,相关教程请查阅 Midjourney 基础设置。

调用方法 使用案例 注意事项 V5 V4 V3 niji
在关键词后加空格带上参数:
  • --q 或者 —q
  • --quality 或者—quality
woodcut birch forest --q .25
  • 默认为 1
  • 仅支持 .25,.5 ,1 和 2,如果输入大于 2 会被降级到 2

Seed

你在使用 Midjourney 的时候,应该会发现,即使用相同的 prompt,每次生成的图片都会不一样。其实 Midjourney 会为每个生成的图片打上一个 seed 编号,你可以在 prompt 里加入这个 seed 参数,这样每次生成的图片就一样了,以下是官方的例子:

MJ026.png

调用方法很简单:

调用方法 使用案例 注意事项 V5 V4 V3 niji
在关键词后加空格带上参数:
  • --seed 或者 —seed
  • --sameseed 或者—sameseed
woodcut birch forest --seed 123
  • 输入完全一样的文字 prompt,并且加上 seed 参数,才能生成一样的图。
  • V1、2、3 还有 test、testp 版本即使加了这个 seed 也没法生成一模一样的图,只能生成近似的图。
✅ 但只能生成近似图

那如何获得这个 seed?

找到你想要获得 seed 的图片,然后在其消息右上角有个 emoji 按钮,点击后会出现一个 emoji 菜单,然后在 emoji 菜单里输入 envelope ,最后点击 ✉️ emoji ,然后在图片下方就会出现一个 envelope 的 emoji,最后你会收到 Midjourney Bot 的私信推送,该消息上面就会有 Seed 号码。

AnimatedImage.gif

Image Weight

这个翻译成中文是「图片权重」的意思。

当你同时用 img prompt 和文字 prompt 的时候,就可以通过这个参数设置到底更像图片还是更像文字,当这个参数越大,AI 生成的图片就越像原图,越小,就越像文字描述。

以下是 Midjourney 的官方案例,可以看到,数值越大,就越像原图:

MJ141.jpeg

调用方法 使用案例 注意事项 V5 V4 V3 niji
在关键词后加空格带上参数:
  • --iw 或者 —iw
flowers.jpg birthday cake --iw .5 这个参数在不同版本有不同的默认值(就是即使你不输入这个参数,AI 也会自己加这个参数进去)和区间 ✅ 默认为 1,区间是 0.5-2 ✅ 默认为 0.25,区间是 -10000-10000

Stop

这个参数跟 ChatGPT 里的 stop 类似,就是强制暂停模型。

调用方法 使用案例 注意事项 V5 V4 V3 niji
在关键词后加空格带上参数:
  • --stop 或者 —stop
splatter art painting of acorns --stop 90
  • 默认值是 100
  • 你可以输入 10 到 100

Style

这个参数主要是用于切换 V4 模型中的分支模型。

我个认为觉的这个不是很好用,且因为 V5 已经推出,大家都在用 V5 了,所以未来我认为会淘汰(这个我猜测其实是 V5 的其他分支版本,早放出是为了收集数据)。所以就不做介绍了。

Uplight

当 Midjourney Bot 图片生成完成后,图片下方都会有一排 U 按钮,这些按钮做的事情就是这个 Uplight 参数做的事情,一般人都会通过点击按钮来使用,比较少在 prompt 里添加。

而且现在 V5 版本,U 按钮已经不会影响分辨率了,只是做为一个裁切图片的功能。所以这个参数也是一个我认为要被淘汰的参数。大家不必关心。

Upbeta

另一个我认为会被淘汰的按钮。

Video

我觉得这个参数很有意思,这其实是个类似录 gif 的参数。在 prompt 里加入这个参数,升成图片的同时,还会记录升成的过程,但可惜这个参数只支持到 V3,估计官方未来也会放弃吧,主要是没啥用,就是好玩。

2. Midjourney 各版本差异

V1、V2、V3、V4、V5

我们都用相同的 prompt 来看看各版本的差异,我使用的是官方案例里的 prompt:

vibrant California poppies

MJ017.png

从上图里其实你就能看到 Midjourney 的进化方向:

  1. 越来越丰富的细节,生成的内容也越来越真实。V1 和 V2 基本上就是简笔画,看看 V2 第四张图前景和背景的处理就很粗暴,到了 V3 背景和透视都变得更加合理,然后到了 V4 基本就是一个可用的状态。
  2. 分辨率越来越高。V1~V3 单张图是 256 x 256,到了 V5 单图已经默认是 1024*1024。
  3. 参数更多,Prompt 更加重要。这个在 V5 版本更加明显,感觉以前的版本,并不太能理解一些词,比如材料词 marble 之类的。但到了 V5 理解能力变强了。
  4. 艺术风格词变得更重要。这个结论暂时没有得到官方的认证,甚至有很多人认为 V5 版本是个更「通用」的版本,我的理解是 V5 提高了整个基准线,不需要太多描述词,就能生成一个「可以看」的图片,但如果要生成一张你跟你预期完全一致的图,其实变难了,你需要了解更多的 prompt。

然后我们再来看看更复杂的 prompt 看看版本的差异:

21years chinese girl, in school, beauty, long black hair, sun light,insane detail, smooth light, real photography fujifilm superia, full HD, taken on a Canon EOS R5 F1.2 ISO100 35MM

看看生成的结果,是不是差距非常大,从 V1 到 V5 的进化,Midjourney 大约花了 1 年的时间,如果仅算研发时间,我觉得应该不到 1 年,非常了不起:

MJ018.png

Niji

最后再介绍一个 Midjourney 的特殊版本 Niji,这个版本其实是 Midjourney 跟 Spellbrush 一起开发的。「niji」是日语「にじ」,意思是「彩虹」 或者 「2D」。

它在生成动漫类的图片上,比较在行。举个例子,prompt 是 fancy peacock,左图是 v5 模型,右图是 niji v5模型,右图更偏向于漫画风格:

MJ127.png

3. Midjourney 官方 FAQ

本章节,主要是翻译官方的 Discord FAQ 文章,一些大家常见的问题进行翻译,各位可以在官方 Discord prompt-faqs 找到这些原稿。

4K、HD 等所谓的 Rendering 词有用吗?

官方解释 Rendering 词包括:

Rendering words include 4k, 6k, 8k, 16k, ultra 4k, octane, unreal, v-ray, lumion, renderman, hd, hdr, hdmi, high-resolution, dp, dpi, ppi, 1080p.

有用吗?官方的解释是:

Rendering words do something to your image. They may also be what's breaking your prompt. So, as part of troubleshooting, we recommend removing them. Removing them often fixes issues with blurring, focus, clarity, and coherence.

意思就是会影响,有一定作用,但弊大于利。加入这些词,反而会破坏你的 prompt,特别是一些摄影场景,比如你需要用到诸如背景虚化等效果,再加上 4K 可能就会破坏背景虚化。

所以官方建议去掉这些词。

Prompt 里的词语顺序会影响结果吗?

官方解释

Word order matters. Early words are generally more influential.

顺序会影响结果,越早出现的词,对结果影响越大。所以我设计的模版才会将「类型」放在最前面。因为这是我的最重要的目标。官方还建议:

  1. 避免列举词语:例举的意思是在 prompt 里写多个同一个意思的词。
  2. 使用具体的相关词语:越具体生成的图片越符合 prompt。
  3. 用句子片段:就是不要像写雅思作文那样,写定语从句、长难句,而是将这些词切开。
  4. 避免使用4K、8K、16K等安慰剂词汇。

为何 Seed 不生效?

官方对 Seed 的评价是:

  • Seeds can not transfer the style or appearance of images across jobs.
  • Seeds can not be used to 'bookmark' styles or appearance. (i.e. "Use seed XYZ for that!")
  • Seeds are the weakest force in Midjourney. In --v 5 they may not work as expected at all.

简单总结,就是这个功能在 V5 版本下非常不稳定,你不要预期它能跨图片传输 prompt。

相关文章
|
机器学习/深度学习 人工智能 搜索推荐
AIGC工具——文心一格
【1月更文挑战第12天】AIGC工具——文心一格
1081 3
AIGC工具——文心一格
|
人工智能 自然语言处理 运维
AIGC系列文章汇总
AIGC系列文章汇总(2024年3月8日更新)
3394 4
AIGC系列文章汇总
|
数据采集 消息中间件 监控
Flume数据采集系统设计与配置实战:面试经验与必备知识点解析
【4月更文挑战第9天】本文深入探讨Apache Flume的数据采集系统设计,涵盖Flume Agent、Source、Channel、Sink的核心概念及其配置实战。通过实例展示了文件日志收集、网络数据接收、命令行实时数据捕获等场景。此外,还讨论了Flume与同类工具的对比、实际项目挑战及解决方案,以及未来发展趋势。提供配置示例帮助理解Flume在数据集成、日志收集中的应用,为面试准备提供扎实的理论与实践支持。
570 1
|
Java 数据处理
【十二】springboot整合WebService
【十二】springboot整合WebService
960 0
|
9月前
|
人工智能 自然语言处理 API
Proxy Lite:仅3B参数的开源视觉模型!快速实现网页自动化,支持在消费级GPU上运行
Proxy Lite 是一款开源的轻量级视觉语言模型,支持自动化网页任务,能够像人类一样操作浏览器,完成网页交互、数据抓取、表单填写等重复性工作,显著降低自动化成本。
622 11
Proxy Lite:仅3B参数的开源视觉模型!快速实现网页自动化,支持在消费级GPU上运行
|
前端开发 JavaScript 开发者
前端开发中的组件化设计与性能优化
【10月更文挑战第7天】前端开发中的组件化设计与性能优化
270 0
|
9月前
|
人工智能 自然语言处理 算法
打造跨语言智能工具与应用,“万卷·丝路”专项课题开放申请
随着共建“一带一路”进入高质量发展阶段,全球开发者对于多语言模型训练的需求不断增长,上海AI实验室联合大模型语料数据联盟成员发布了“万卷·丝路”多语言预训练语料库,为多语言大模型训练提供高质量数据支撑,助力全球开发者构建跨语言智能工具与应用。
194 4
|
Kubernetes API Docker
跟着iLogtail学习容器运行时与K8s下日志采集方案
iLogtail 作为开源可观测数据采集器,对 Kubernetes 环境下日志采集有着非常好的支持,本文跟随 iLogtail 的脚步,了解容器运行时与 K8s 下日志数据采集原理。
|
运维 Kubernetes 监控
在K8S中,Kubernetes常见的部署方式有哪些?
在K8S中,Kubernetes常见的部署方式有哪些?
|
消息中间件 搜索推荐 UED
Elasticsearch 作为推荐系统后端的技术架构设计
【8月更文第28天】在现代互联网应用中,推荐系统已经成为提高用户体验和增加用户粘性的重要手段之一。Elasticsearch 作为一个高性能的搜索和分析引擎,不仅能够提供快速的全文检索能力,还可以通过其强大的数据处理和聚合功能来支持推荐系统的实现。本文将探讨如何利用 Elasticsearch 构建一个高效且可扩展的推荐系统后端架构,并提供一些具体的代码示例。
919 0