研究上百个小时,高手总结了这份 DALL-E 3 人物连续性公式(上)

简介: 研究上百个小时,高手总结了这份 DALL-E 3 人物连续性公式(上)

上篇 Dall-E 3 讲了常见的 20 个公式,今天单独来讲一下人物连续性公式,这个公式来自 @AshutoshShrivastava。

上篇回顾:

效果超好!全新 DALL-E 3 必须掌握的 20 种公式使用方法上周末,DALL-E 3 正式加入 ChatGpt,目前 Plus 用户和企业用户已经正式使用该功能,不仅是用户设计输出方面,也为科研项目输出相关的图片。阅读文章 >

研究了近百个小时,感谢这位伟大的作者,结尾附上该作者链接。

一、人物连续性公式

1. 公式总结

Prompt:

[Base Prompt] + [additional details / variationinformation]+identifer-1

提示:

[基本提示] +[额外细节/变量信息]+identifer-1

注意:

[基本提示] 可以描述人物的 年龄/性别/图像风格等。

[额外细节/变量信息] 可以描述发型/服装类型等。

identifer 为 “标识符变量”。

- 1 数字可变,作用是提供图像编号,为 Chat Gpt 理解。

2. 例子演示

①这篇文章的起始图片。

DALL-E Prompt for this image is :

illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, -0003

这张图片的 DALL-E 提示是:

描绘了一位名叫 Hope 的 30 岁美国女性,她的卷曲头发盘在发髻上,身穿一件绿色 T 恤 - 0003

②现在,我想让 Hope 微笑,那么我会告诉 DALL-E 3 ( My command: make Hope smile )

DALL-E Prompt for this image will be :

illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, smiling -0004

这张图片的 DALL-E 提示将是:

描绘了一位名叫 Hope 的 30 岁美国女性,她的卷曲头发盘在发髻上,身穿一件绿色 T 恤,微笑 - 0004

③现在,我想让 " Hope 把手指放在嘴唇上",那么我会告诉 DALL-E 3 ( My command: “now make Hope have a finger on her lips” )。

您会注意到她在微笑并把手指放在嘴唇上。为什么她微笑?因为默认情况下,DALL-E 3 会更新上一张图片,所以看看提示:

DALL-E Prompt for this image will be :

illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, smiling, and placing a finger on her lips -0005

DALL-E 这张图片的提示将是:

描绘了一位名叫 Hope 的 30 岁美国女性,她的卷曲头发盘在发髻上,身穿一件绿色 T 恤,微笑,并把手指放在嘴唇上 - 0005

④现在,我希望 Hope 把手指放在嘴唇上但不是微笑,我会告诉 DALL-E 3 (My command: “take -0003 as base and now make Hope have a finger on her lips”)。

我提到了 -0003,因为在那张特定的照片中,她没有笑。所以,请看提示:

DALL-E Prompt for this image will be :

illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, placing a finger on her lips -0006

DALL-E 这张图片的提示将是:

描绘了一位名叫 Hope 的 30 岁美国女性,她的卷曲头发盘在发髻上,身穿一件绿色 T 恤,把手指放在嘴唇上 - 0006

3. 增加变化

①根据公式,增加复杂的变化。

[Base Prompt] + [additional details / variationinformation]+identifer-1

您可以将这个简短的提示提供给 ChatGPT,让它按照这个结构进行操作。

<—提示开始—>

I have some instructions for you :

you can reframe the prompt in the following way:

Prompt Structure is : [Base Prompt] + [additional details / variation information] + identifer-1

我有一些指导信息要给你:

你可以将提示重新构建为以下方式:

提示结构是:[基本提示] +[额外细节/变量信息]+identifer-1

Base Prompt: “Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt”

If i say make Hope do something base prompt will be above one which i provided .

If I say now make Hope do some thing , the base prompt will be the current state of Hope with the last identifier.

For any additional details or variations that don’t involve hair, append them under the “additional details / variation information” category and then add an identifier at the end.

基础提示:“画一张描绘一个 30 岁的美国女性 Hope 的插画头像,她的卷曲波浪发型盘成发髻,穿着一件绿色 T 恤”

如果我说让 Hope 做某事,基础提示将是我提供的上述那个。

如果我说现在让 Hope 做某事,基础提示将是 Hope 的当前状态,也就是最后一个标识符所对应的提示。

对于不涉及发型的任何额外细节或变化,将它们附加在“额外细节/变化信息”类别下,然后在末尾添加一个标识符。

Example 1: Changing Hair Style

If I ask for make hope hair flow, you can change the prompt to:

“Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair flowing, wearing a green t-shirt. + identifier-1”

示例 1:更改发型

如果我要求让 Hope 的头发飘逸,你可以将提示更改为:

“画一张描绘一个 30 岁的美国女性 Hope 的插画头像,她的卷曲波浪发型飘逸,穿着一件绿色 T 恤。+标识符-1”

Example 2: Coffee

If i ask to make Hope drink coffee, then you can change the prompt to:

“Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt and drinking coffee. + identifier-1”

示例 2:喝咖啡

如果我要求让 Hope 喝咖啡,那么你可以将提示更改为:

“画一张描绘一个 30 岁的美国女性 Hope 的插画头像,她的卷曲波浪发型盘成发髻,穿着一件绿色 T 恤,喝咖啡。-标识符+1”

This approach keeps the Base Prompt intact while allowing for specific variations as needed. The identifier at the end can help keep track of variations.

Are you clear with this ?

这个方法保持了基础提示不变,同时允许根据需要进行具体的变化。末尾的标识符有助于跟踪各种变化。

你理解了吗?

<— 提示结束 —>

ChatGPT 的回应:

<–回应开始—>

  1. 是的,我清楚地理解了这些说明。
  2. 你设置了一个基础提示,并提供了一个结构,用于进行任何修改。
  3. 如果你使用词语“现在”,我将使用 Hope 的当前状态作为基础提示,并根据你的具体要求进行修改,将变化附加在“额外细节/变化信息”类别下。我还会为每个新请求递增标识符。
  4. 请提供 Hope 的下一个指令,我将相应地生成图像。

<—回应结束—>

②这是 Hope 的第五张图片,将把它用作现在的起始图片。目前,Hope 正在微笑,手指放在嘴唇上,发型是髻子。

DALL-E Prompt for this image is:

illustration portrait of a 30-year-old American woman named Hopewith her curly wavy hair styled in a bun, wearing a green t-shirt, smiling, and placing a finger on her lips -0005

这张图片的 DALL-E 提示是:

插图肖像,30 岁的美国女子,名叫 Hope,她卷曲的波浪发型梳成髻子,穿着一件绿色 T 恤,微笑着,手指放在嘴唇上 -0005

③如果我想基于先前的图像,让 Hope 的头发飘动,然后我会告诉 DALL-E 3(My command: now make Hope hair flow),我使用了“现在”,它将采用上一个图像并在其基础上构建。

DALL-E Prompt for this image will be :

Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair flowing, wearing a green t-shirt, smiling, and placing a finger on her lips -0006

这张图像的 DALL-E 提示将是:

插图肖像,30 岁的美国女子,名叫 Hope,她卷曲的波浪头发飘动,穿着一件绿色 T 恤,微笑着,手指放在嘴唇上 -0006

观察:您可以看到它在基本提示中更新了头发的细节,而 Hope 正在微笑,因为那是她的最后状态。

④现在,如果我想让 Hope 看书,但我想参考基本提示,然后我会告诉 DALL-E 3(My command: “Make Hope read book”)。

您会注意到我使用了“让”,她只是在读书,没有头发飘动,没有微笑或其他什么 - 这有助于我们不再一遍又一遍地引用基础图像,也有助于 ChatGPT 记住提示,因为我们在命令中已经给出。

DALL-E Prompt for this image will be :

Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, reading a book -0007

这张图像的 DALL-E 提示将是:

插图肖像,30 岁的美国女子,名叫 Hope,她卷曲的波浪头发盘在发髻上,穿着一件绿色 T 恤,正在看书 -0007

⑤现在我的当前状态是 -0007,但如果我想更新 -0006 并希望 Hope 喝咖啡,我会告诉 DALL-E(My command: take -0006 as base and now make Hope drink coffee)。

DALL-E Prompt for this image will be :

Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair flowing, wearing a green t-shirt, smiling, placing a finger on her lips, and drinking coffee -0008 (output image left side)

这张图像的 DALL-E 提示将是:

插图肖像,30 岁的美国女子,名叫 Hope,她卷曲的波浪头发飘逸,穿着一件绿色 T 恤,微笑着,把手指放在嘴唇上,喝咖啡 -0008(左侧为输出图像)

⑥如果我想要发髻发型和喝咖啡,那么我会告诉 DALL-E(My command: take -0006 as base and now make Hope drink coffee but in bun hairstyle)。

DALL-E Prompt for this image will be :

Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, smiling, placing a finger on her lips, and drinking coffee -0009 (output image right side)

这张图像的 DALL-E 提示将是:

插图肖像,30 岁的美国女子,名叫 Hope,她卷曲的波浪头发盘在发髻上,穿着一件绿色 T 恤,微笑着,把手指放在嘴唇上,喝咖啡 -0009(右侧为输出图像)

请注意:左边是命令 a 的输出图像,右边是命令 b 的输出图像。

参考地址: https://twitter.com/ai_for_success/status/1715734170708939094

今天上篇就到这里,关注公众号获取未来的更新信息,以及最佳的提示撰写方式。

目录
相关文章
|
2月前
|
机器学习/深度学习 人工智能 文字识别
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
【10月更文挑战第12天】多模态理解是人工智能的重要研究方向,华人团队改进了现有的MMMU基准,推出MMMU-Pro,以更严格地评估模型的多模态理解和推理能力。MMMU-Pro通过过滤纯文本问题、增加候选选项和引入纯视觉问答设置,提高了评估难度。实验结果显示,模型在MMMU-Pro上的性能明显下降,但CoT推理有助于提升表现。MMMU-Pro为多模态理解提供了更严格的评估工具,但也面临一些挑战。
49 1
|
3月前
|
测试技术
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
【9月更文挑战第14天】微软研究团队发布了一篇介绍新型框架&quot;AgentInstruct&quot;的论文,该框架旨在通过自动生成高质量合成数据,推动语言模型发展。AgentInstruct仅需原始数据源即可创建多样化的合成数据,减少人工工作量。研究团队基于此框架构建了含2500万训练对的数据集,展示了其在多种技能教学中的潜力。经微调后的Mistral-7b模型演进为Orca-3,在多个基准测试中显著超越同类模型。尽管如此,AgentInstruct仍面临创建流程耗时及合成数据复杂性不足等问题。论文详情见:https://arxiv.org/pdf/2407.03502
78 2
|
5月前
|
自然语言处理 前端开发
研究上百个小时,高手总结了这份 DALL-E 3 人物连续性公式(下)
研究上百个小时,高手总结了这份 DALL-E 3 人物连续性公式(下)
38 0
|
5月前
研究上百个小时,高手总结了这份 DALL-E 3 人物连续性公式(中)
研究上百个小时,高手总结了这份 DALL-E 3 人物连续性公式(中)
40 0
|
7月前
|
人工智能 自然语言处理 搜索推荐
DeepMind终结大模型幻觉?标注事实比人类靠谱、还便宜20倍,全开源
【4月更文挑战第5天】DeepMind推出开源工具SAFE,挑战大模型的幻觉,提升事实评估准确性和效率。通过自动化和搜索引擎验证,SAFE在成本上比人类标注便宜20倍,且在72%的时间与人类一致,显示了在大规模事实验证中的潜力。然而,依赖谷歌搜索和易受长文本信息过载影响是其局限性。
72 13
DeepMind终结大模型幻觉?标注事实比人类靠谱、还便宜20倍,全开源
|
7月前
|
编解码 人工智能 移动开发
气候变化和人类活动对中国植被固碳的贡献量化数据月度合成产品
气候变化和人类活动对中国植被固碳的贡献量化数据月度合成产品
40 0
|
算法
【项目实践】多人姿态估计实践(代码+权重=一键运行)(二)
【项目实践】多人姿态估计实践(代码+权重=一键运行)(二)
145 0
【项目实践】多人姿态估计实践(代码+权重=一键运行)(二)
|
机器学习/深度学习
大模型也有好玩的数学? 从麦克斯韦的最低势能问题到人机对齐
大模型也有好玩的数学? 从麦克斯韦的最低势能问题到人机对齐
|
机器学习/深度学习 人工智能 自然语言处理
ChatGPT要把数据标注行业干掉了?比人便宜20倍,而且还更准
ChatGPT要把数据标注行业干掉了?比人便宜20倍,而且还更准
219 0
|
传感器 算法 机器人
【项目实践】多人姿态估计实践(代码+权重=一键运行)(一)
【项目实践】多人姿态估计实践(代码+权重=一键运行)(一)
131 0

热门文章

最新文章