研究上百个小时,高手总结了这份 DALL-E 3 人物连续性公式(上)

简介: 研究上百个小时,高手总结了这份 DALL-E 3 人物连续性公式(上)

上篇 Dall-E 3 讲了常见的 20 个公式,今天单独来讲一下人物连续性公式,这个公式来自 @AshutoshShrivastava。

上篇回顾:

效果超好!全新 DALL-E 3 必须掌握的 20 种公式使用方法上周末,DALL-E 3 正式加入 ChatGpt,目前 Plus 用户和企业用户已经正式使用该功能,不仅是用户设计输出方面,也为科研项目输出相关的图片。阅读文章 >

研究了近百个小时,感谢这位伟大的作者,结尾附上该作者链接。

一、人物连续性公式

1. 公式总结

Prompt:

[Base Prompt] + [additional details / variationinformation]+identifer-1

提示:

[基本提示] +[额外细节/变量信息]+identifer-1

注意:

[基本提示] 可以描述人物的 年龄/性别/图像风格等。

[额外细节/变量信息] 可以描述发型/服装类型等。

identifer 为 “标识符变量”。

- 1 数字可变,作用是提供图像编号,为 Chat Gpt 理解。

2. 例子演示

①这篇文章的起始图片。

DALL-E Prompt for this image is :

illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, -0003

这张图片的 DALL-E 提示是:

描绘了一位名叫 Hope 的 30 岁美国女性,她的卷曲头发盘在发髻上,身穿一件绿色 T 恤 - 0003

②现在,我想让 Hope 微笑,那么我会告诉 DALL-E 3 ( My command: make Hope smile )

DALL-E Prompt for this image will be :

illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, smiling -0004

这张图片的 DALL-E 提示将是:

描绘了一位名叫 Hope 的 30 岁美国女性,她的卷曲头发盘在发髻上,身穿一件绿色 T 恤,微笑 - 0004

③现在,我想让 " Hope 把手指放在嘴唇上",那么我会告诉 DALL-E 3 ( My command: “now make Hope have a finger on her lips” )。

您会注意到她在微笑并把手指放在嘴唇上。为什么她微笑?因为默认情况下,DALL-E 3 会更新上一张图片,所以看看提示:

DALL-E Prompt for this image will be :

illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, smiling, and placing a finger on her lips -0005

DALL-E 这张图片的提示将是:

描绘了一位名叫 Hope 的 30 岁美国女性,她的卷曲头发盘在发髻上,身穿一件绿色 T 恤,微笑,并把手指放在嘴唇上 - 0005

④现在,我希望 Hope 把手指放在嘴唇上但不是微笑,我会告诉 DALL-E 3 (My command: “take -0003 as base and now make Hope have a finger on her lips”)。

我提到了 -0003,因为在那张特定的照片中,她没有笑。所以,请看提示:

DALL-E Prompt for this image will be :

illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, placing a finger on her lips -0006

DALL-E 这张图片的提示将是:

描绘了一位名叫 Hope 的 30 岁美国女性,她的卷曲头发盘在发髻上,身穿一件绿色 T 恤,把手指放在嘴唇上 - 0006

3. 增加变化

①根据公式,增加复杂的变化。

[Base Prompt] + [additional details / variationinformation]+identifer-1

您可以将这个简短的提示提供给 ChatGPT,让它按照这个结构进行操作。

<—提示开始—>

I have some instructions for you :

you can reframe the prompt in the following way:

Prompt Structure is : [Base Prompt] + [additional details / variation information] + identifer-1

我有一些指导信息要给你:

你可以将提示重新构建为以下方式:

提示结构是:[基本提示] +[额外细节/变量信息]+identifer-1

Base Prompt: “Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt”

If i say make Hope do something base prompt will be above one which i provided .

If I say now make Hope do some thing , the base prompt will be the current state of Hope with the last identifier.

For any additional details or variations that don’t involve hair, append them under the “additional details / variation information” category and then add an identifier at the end.

基础提示:“画一张描绘一个 30 岁的美国女性 Hope 的插画头像,她的卷曲波浪发型盘成发髻,穿着一件绿色 T 恤”

如果我说让 Hope 做某事,基础提示将是我提供的上述那个。

如果我说现在让 Hope 做某事,基础提示将是 Hope 的当前状态,也就是最后一个标识符所对应的提示。

对于不涉及发型的任何额外细节或变化,将它们附加在“额外细节/变化信息”类别下,然后在末尾添加一个标识符。

Example 1: Changing Hair Style

If I ask for make hope hair flow, you can change the prompt to:

“Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair flowing, wearing a green t-shirt. + identifier-1”

示例 1:更改发型

如果我要求让 Hope 的头发飘逸,你可以将提示更改为:

“画一张描绘一个 30 岁的美国女性 Hope 的插画头像,她的卷曲波浪发型飘逸,穿着一件绿色 T 恤。+标识符-1”

Example 2: Coffee

If i ask to make Hope drink coffee, then you can change the prompt to:

“Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt and drinking coffee. + identifier-1”

示例 2:喝咖啡

如果我要求让 Hope 喝咖啡,那么你可以将提示更改为:

“画一张描绘一个 30 岁的美国女性 Hope 的插画头像,她的卷曲波浪发型盘成发髻,穿着一件绿色 T 恤,喝咖啡。-标识符+1”

This approach keeps the Base Prompt intact while allowing for specific variations as needed. The identifier at the end can help keep track of variations.

Are you clear with this ?

这个方法保持了基础提示不变,同时允许根据需要进行具体的变化。末尾的标识符有助于跟踪各种变化。

你理解了吗?

<— 提示结束 —>

ChatGPT 的回应:

<–回应开始—>

  1. 是的,我清楚地理解了这些说明。
  2. 你设置了一个基础提示,并提供了一个结构,用于进行任何修改。
  3. 如果你使用词语“现在”,我将使用 Hope 的当前状态作为基础提示,并根据你的具体要求进行修改,将变化附加在“额外细节/变化信息”类别下。我还会为每个新请求递增标识符。
  4. 请提供 Hope 的下一个指令,我将相应地生成图像。

<—回应结束—>

②这是 Hope 的第五张图片,将把它用作现在的起始图片。目前,Hope 正在微笑,手指放在嘴唇上,发型是髻子。

DALL-E Prompt for this image is:

illustration portrait of a 30-year-old American woman named Hopewith her curly wavy hair styled in a bun, wearing a green t-shirt, smiling, and placing a finger on her lips -0005

这张图片的 DALL-E 提示是:

插图肖像,30 岁的美国女子,名叫 Hope,她卷曲的波浪发型梳成髻子,穿着一件绿色 T 恤,微笑着,手指放在嘴唇上 -0005

③如果我想基于先前的图像,让 Hope 的头发飘动,然后我会告诉 DALL-E 3(My command: now make Hope hair flow),我使用了“现在”,它将采用上一个图像并在其基础上构建。

DALL-E Prompt for this image will be :

Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair flowing, wearing a green t-shirt, smiling, and placing a finger on her lips -0006

这张图像的 DALL-E 提示将是:

插图肖像,30 岁的美国女子,名叫 Hope,她卷曲的波浪头发飘动,穿着一件绿色 T 恤,微笑着,手指放在嘴唇上 -0006

观察:您可以看到它在基本提示中更新了头发的细节,而 Hope 正在微笑,因为那是她的最后状态。

④现在,如果我想让 Hope 看书,但我想参考基本提示,然后我会告诉 DALL-E 3(My command: “Make Hope read book”)。

您会注意到我使用了“让”,她只是在读书,没有头发飘动,没有微笑或其他什么 - 这有助于我们不再一遍又一遍地引用基础图像,也有助于 ChatGPT 记住提示,因为我们在命令中已经给出。

DALL-E Prompt for this image will be :

Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, reading a book -0007

这张图像的 DALL-E 提示将是:

插图肖像,30 岁的美国女子,名叫 Hope,她卷曲的波浪头发盘在发髻上,穿着一件绿色 T 恤,正在看书 -0007

⑤现在我的当前状态是 -0007,但如果我想更新 -0006 并希望 Hope 喝咖啡,我会告诉 DALL-E(My command: take -0006 as base and now make Hope drink coffee)。

DALL-E Prompt for this image will be :

Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair flowing, wearing a green t-shirt, smiling, placing a finger on her lips, and drinking coffee -0008 (output image left side)

这张图像的 DALL-E 提示将是:

插图肖像,30 岁的美国女子,名叫 Hope,她卷曲的波浪头发飘逸,穿着一件绿色 T 恤,微笑着,把手指放在嘴唇上,喝咖啡 -0008(左侧为输出图像)

⑥如果我想要发髻发型和喝咖啡,那么我会告诉 DALL-E(My command: take -0006 as base and now make Hope drink coffee but in bun hairstyle)。

DALL-E Prompt for this image will be :

Illustration portrait of a 30-year-old American woman named Hope with her curly wavy hair styled in a bun, wearing a green t-shirt, smiling, placing a finger on her lips, and drinking coffee -0009 (output image right side)

这张图像的 DALL-E 提示将是:

插图肖像,30 岁的美国女子,名叫 Hope,她卷曲的波浪头发盘在发髻上,穿着一件绿色 T 恤,微笑着,把手指放在嘴唇上,喝咖啡 -0009(右侧为输出图像)

请注意:左边是命令 a 的输出图像,右边是命令 b 的输出图像。

参考地址: https://twitter.com/ai_for_success/status/1715734170708939094

今天上篇就到这里,关注公众号获取未来的更新信息,以及最佳的提示撰写方式。

目录
相关文章
|
2月前
|
数据采集 机器人 计算机视觉
一手训练,多手应用:国防科大提出灵巧手抓取策略迁移新方案
【10月更文挑战第24天】国防科技大学研究人员提出了一种新颖的机器人抓取方法,通过学习统一的策略模型,实现不同灵巧夹具之间的策略迁移。该方法分为两个阶段:与夹具无关的策略模型预测关键点位移,与夹具相关的适配模型将位移转换为关节调整。实验结果显示,该方法在抓取成功率、稳定性和速度方面显著优于基线方法。论文地址:https://arxiv.org/abs/2404.09150
39 1
|
3月前
|
机器学习/深度学习 人工智能 文字识别
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
【10月更文挑战第12天】多模态理解是人工智能的重要研究方向,华人团队改进了现有的MMMU基准,推出MMMU-Pro,以更严格地评估模型的多模态理解和推理能力。MMMU-Pro通过过滤纯文本问题、增加候选选项和引入纯视觉问答设置,提高了评估难度。实验结果显示,模型在MMMU-Pro上的性能明显下降,但CoT推理有助于提升表现。MMMU-Pro为多模态理解提供了更严格的评估工具,但也面临一些挑战。
50 1
|
4月前
|
测试技术
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
【9月更文挑战第14天】微软研究团队发布了一篇介绍新型框架&quot;AgentInstruct&quot;的论文,该框架旨在通过自动生成高质量合成数据,推动语言模型发展。AgentInstruct仅需原始数据源即可创建多样化的合成数据,减少人工工作量。研究团队基于此框架构建了含2500万训练对的数据集,展示了其在多种技能教学中的潜力。经微调后的Mistral-7b模型演进为Orca-3,在多个基准测试中显著超越同类模型。尽管如此,AgentInstruct仍面临创建流程耗时及合成数据复杂性不足等问题。论文详情见:https://arxiv.org/pdf/2407.03502
89 2
|
5月前
|
机器学习/深度学习 人工智能
高于临床测试3倍准确率!剑桥大学开发AI模型,提前6年预测阿尔茨海默症
【8月更文挑战第9天】剑桥大学研发的人工智能模型在预测阿尔茨海默症方面取得突破,准确率比传统临床测试高三倍,能提前六年预测疾病发生。该模型基于深度学习,利用大量临床及神经影像数据识别生物标志物,预测准确性达80%。这一成果有望促进早期干预,改善患者预后,但仍需更大规模研究验证,并解决隐私与公平性等问题。论文已发表于《The Lancet》子刊。
63 6
|
6月前
研究上百个小时,高手总结了这份 DALL-E 3 人物连续性公式(中)
研究上百个小时,高手总结了这份 DALL-E 3 人物连续性公式(中)
41 0
|
6月前
|
自然语言处理 前端开发
研究上百个小时,高手总结了这份 DALL-E 3 人物连续性公式(下)
研究上百个小时,高手总结了这份 DALL-E 3 人物连续性公式(下)
46 0
|
8月前
|
编解码 人工智能 移动开发
气候变化和人类活动对中国植被固碳的贡献量化数据月度合成产品
气候变化和人类活动对中国植被固碳的贡献量化数据月度合成产品
41 0
|
机器学习/深度学习 传感器 算法
北大&北航团队揭示电子转移规律,深度学习定量预测96种元素在任意压力下的电负性
北大&北航团队揭示电子转移规律,深度学习定量预测96种元素在任意压力下的电负性
172 0
|
人工智能 监控 机器人
OpenAI重磅研究:ChatGPT可能影响80%工作岗位,收入越高影响越大
OpenAI重磅研究:ChatGPT可能影响80%工作岗位,收入越高影响越大
123 0
|
机器学习/深度学习 算法 数据可视化
精准高效估计多人3D姿态,美图&北航分布感知式单阶段模型入选CVPR 2022
精准高效估计多人3D姿态,美图&北航分布感知式单阶段模型入选CVPR 2022
139 0