AI 绘画Stable Diffusion 研究(五)sd文生图功能详解(下)(1)

简介: AI 绘画Stable Diffusion 研究(五)sd文生图功能详解(下)

上一篇文章详细介绍了sd文生图的功能及使用注意事项,感兴趣的朋友可以前往查看:AI 绘画Stable Diffusion 研究(四)sd文生图功能详解(上)


那今天这篇文章,我们接着介绍 sd文生图功能,主要是 sd 提示词prompt 。


大家都知道,提示词是整个Stable Diffusion ai 绘画的灵魂,那么我们应该怎么来写提示词呢?什么样的提示词是优秀的提示词呢?


这篇文章给大家介绍的提示词,很有可能是以前没有听过的,只要大家跟着我的脚步,认认真真的看完这篇文章,你一定不会为写提示词而烦恼!也一定会让你的提示词更简洁有效!

这篇文章的干货非常多,那现在就正式开始吧~


提示词的内容主要包含2个部分:prompt 的格式、 修饰词。

相信大家在网上也看过其他博主有关提示词的知识介绍,一般主要讲解的是提示词的格式,如怎么提高权重、减少权重,以及少量的怎么让画面变得清晰这块。但是修饰词这块很少讲解,那这里就把这块内容进行补齐。


一、提示词 prompt 详解


1、从了解自己的需求开始理解提示词的要素


在写提示词之前,我们脑海里面就要过一下以下问题。

为了便于理解,这里做了中英文的对比,英文部分是直接可以使用的提示词。


(1)、 我想要一张照片(photo)还是一幅画(painting)?

尝试回答 ==》 照片(photo)


(2)、图片的主题是什么? 是人(Person)? 是动物(An animal)还是风景(landscape)?

尝试回答 ==》 一个女孩 (a girl)


(3)、我想添加哪些细节?

尝试回答 ==》 穿泳衣(Dress swimming)


我需要哪种特殊照明(Special Lighting)?自然光(naturalight)、柔光(Soft)、环境光(ambient)、环形光(ring light)、霓虹灯(neon)?

尝试回答 ==》 自然光(naturalight)


我需要在什么环境(Environment)下?室内(lndoor)、室外(outdoor)、水下(underwater)、太空(in space)?

尝试回答 ==》 水下(underwater)


我需要哪种配色方案(Color Scheme)?颜色鲜艳(with bright colors)、充满活力(Vibrant)、黑暗(dark)、柔和(pastel)?

尝试回答 ==》 柔和(pastel)


我需要哪种视角(Point of view)?正面(Front)、头顶(Overhead)、侧面(Side)?

尝试回答 ==》 正面(Front)


(4)、我需要哪种特定的艺术风格? 3D渲染(3D render),吉卜力工作室studio ghibli),电影海报(movie poster)?

尝试回答 ==》 电影海报(movie poster)


(5)、我需要哪种特定的照片类型? 微距(Macro)、长焦(telephoto)

尝试回答 ==》 微距(Macro)


根据以上问题,我们将其串联起来,就可以清晰的看见提示词涉及的元素。

如下:

photo,a girl,Dress swimming,Special Lighting naturalight,Environment underwater,with bright colors pastel,Front, 3D render movie poster,Macro


2、关于提示词权重增减


(1)、单词的顺序很重要

句子中的词,越早出现,权重越高,单词从做往右,从上往下,权重逐渐降低。

因此,我们写提示词的时候,要尽量将重要的核心的内容写在前面,次要的内容写在后面。


(2)、强制增减权重

在上一篇也有简单说明 ,这里再总结一下,感兴趣的朋友可以回头看看

AI 绘画Stable Diffusion 研究(四)sd文生图功能详解(上)-21、Tag 加权、减权用法简单说明


A、套英文半角()

每套一层,权重就乘以 1.1倍

例如:

(((a very beautiful girl )))

表示 1.1x1.1x1.1=1.331倍(增强)


B、英文半角()+数字

a very beautiful girl:1.5

表示权重变为原来的1.5倍

a very beautiful girl:0.8

表示权重变为原来的0.8倍


c、套大括号{}

每套一层,权重就乘以1.05倍

{{{a very beautiful girl}}}

表示 1.05x1.05x1.05 =1.157625倍(增强)


d、套方括号[]

每套一层,权重就乘以0.9倍

[[[a very beautiful girl]]]

表示 0.9x0.9x0.9 =0.729倍(减弱)


二、修饰词详解


修饰词可以改变图像风格、格式、视角的单词。

事实证明,某些单词或短语,有神奇的效果,可以提高图片的质量,下面我们来详细介绍不同类型的修饰词。


下表总结了常用的几类修饰词,在实际书写提示词时,可以搭配使用。


镜头类型 shot type 风格 style Subject 主体 灯光 Lighting 环境Environment 镜头 Lens
Long shot Polaroid Woman Soft Indoor Wide-angle
Close-up Monochrome Old man Ambient Outdoor Telephoto
Medium shot Long exposure Grey cat Ring At night 24mm
PoV Color splash Bunny Sun In the park EF 70mm
Extreme Close-up Tilt-shift Ferrari Cinematic Studio Bokeh


(1)、镜头类型 (shot type)

  • Long shot (远景): Long shot 是一种较远距离拍摄的镜头类型,用于展示被拍摄对象相对较远的位置和环境。远景镜头广泛用于展示整个场景、人物在广阔环境中的位置或活动,或者用于突出环境对故事的重要性。

  • Close-up(特写): Close-up 指的是对被拍摄对象进行近距离拍摄,使其填满画面或占据大部分画面。这种镜头类型用于强调被拍摄对象的细节、表情或情感。它通常用于人物特写或突出物体的细节。

  • Medium shot (中景): Medium shot 是介于远景和特写之间的一种镜头类型。它将被拍摄对象从腰部或膝盖处裁剪,并展示人物或物体的整体外貌和姿态。中景镜头适用于展示人物的动作、表情和环境背景。

  • POV(第一人称视角): POV 是“Point of View”(视角)的缩写,表示通过模拟角色或观察者的视觉角度来呈现场景或情节。POV 镜头旨在让观众体验到与角色或观察者更加身临其境的感觉,使其感受到与角色共享的视觉体验。

  • Extreme Close-up(极特写): Extreme Close-up 指的是对被拍摄对象的极度近距离拍摄。它将焦点限制在非常小的区域上,以突出显示物体的微小细节或部分。极特写常用于表达强烈的情感、揭示重要的细节或营造紧张的氛围。


(2)、风格(style)


  • Polaroid: Polaroid 指的是一种特殊的即时成像摄影技术。它使用一种叫做 Polaroid 的相机拍摄,照片在拍摄后几)钟内即可显影完成,无需进一步的冲洗或处理过程。Polaroid 照片通常具有独特的外观和色彩效果,给人一种复古怀旧的感觉。
still photo of a child sittine in the middle
of a wide empty city street, his back to the camera, symmetrical, polaroid photography, highly detailed, crisp qualit



  • Monochrome: Monochrome 指的是黑白摄影。这种摄影风格仅使用黑、白、灰三种色调,去除了彩色的元素,将照片呈现为单色调的画面。黑白摄影通常具有独特的表现力和艺术感,可以突出形式、纹理和光影效果。
Photo of staircase in abandoned building, symmetrical, monochrome
photography, highly detailed, crisp quality and light reflections, 100mm lens



  • Long exposure: Long exposure 指的是长时间曝光。在摄影中,当相机的快门打开并保持打开的时间较长时,允许更多的光线进入相机,从而在照片中捕捉到移动的物体或在场景中产生模糊效果。长时间曝光常用于拍摄流水、星轨、夜景等场景,创造出动态、流动或梦幻的效果。
An aerial view of a gty at night, long exposure, instagram contest



  • Color splash: Color splash 指的是色彩喷溅效果。这种效果通过将照片中的大部分部分转换为黑白或灰度,并突出显示其中的某些颜色,以产生强烈的色彩对比。通常,选择的颜色会在照片中显眼突出,而其他部分则变为单色或无彩色,营造出一种引人注目的效果。
color splash wide photo of red phone booth in the middle of empty street
detailed, mist soft vignette




相关文章
|
3月前
|
人工智能 测试技术
语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场
【9月更文挑战第20天】Meta研究人员提出了一种名为Transfusion的创新方法,通过融合Transformer和Diffusion模型,实现了能同时处理文本和图像数据的多模态模型。此模型结合了语言模型的预测能力和Diffusion模型的生成能力,能够在单一架构中处理混合模态数据,有效学习文本与图像间的复杂关系,提升跨模态理解和生成效果。经过大规模预训练,Transfusion模型在多种基准测试中表现出色,尤其在图像压缩和模态特定编码方面具有优势。然而,其训练所需的大量计算资源和数据、以及潜在的伦理和隐私问题仍需关注。
82 7
|
5月前
|
机器学习/深度学习 人工智能 算法
解决方案评测:通义万相 AI 绘画创作
通义万相 AI 绘画创作工具在功能、使用体验等方面表现出色,为用户提供了一种便捷、高效的绘画创作方式。虽然存在一些不足之处,但随着技术的不断发展和优化,相信其性能和表现会不断提升。对于艺术家、设计师、创意工作者以及普通爱好者来说,通义万相都是一款值得尝试和探索的 AI 绘画工具。
456 4
解决方案评测:通义万相 AI 绘画创作
|
4月前
|
人工智能
解决方案评测|通义万相AI绘画创作获奖名单
通义万相AI绘画创作获奖名单正式发布!
202 1
|
5月前
|
存储 人工智能 弹性计算
解决方案评测|通义万相AI绘画创作测评
解决方案评测|通义万相AI绘画创作测评
331 12
|
5月前
|
人工智能 弹性计算 对象存储
通义万相AI绘画创作方案:创新艺术的数字化画布
在数字化艺术创作的浪潮中,通义万相AI绘画创作方案以其强大的图像生成能力,为艺术家和设计师提供了一个全新的创作平台。本文将从部署体验、功能亮点、用户反馈以及改进建议等方面,全面评测这一创新方案。
|
5月前
|
存储 人工智能 弹性计算
通义万相AI绘画创作的解决方案评测
通义万相AI绘画创作的解决方案评测
134 2
|
5月前
|
存储 人工智能 弹性计算
通义万相AI绘画创作解决方案体验
在数字化时代,艺术创作正以前所未有的方式被重塑。最近,我有幸深入了解并亲身体验了阿里云的通义万相——一款集成了人工智能技术的绘画工具。我将从部署流程、功能表现、用户体验等方面分享我的一些体验心得。
309 4
|
5月前
|
人工智能 弹性计算 自然语言处理
通义万相AI创作绘画产品方案产品体验
本次我有幸接触并体验了阿里云通义万相这一创新的AI绘画工具方案。该方案它是在利用人工智能技术,为用户提供创新、便捷的绘画创作体验。在体验过程中,我主要关注了产品的易用性、功能性、创新性、用户体验及方案本身等方面。
179 3
|
5月前
|
存储 人工智能 弹性计算
通义万相AI绘画创作评测及图文搭建教程
【7月更文挑战第4天】阿里云的通义万相是AI绘画模型,结合ECS、OSS和API服务,提供无缝创作环境。用户上传图片至OSS,模型通过签名URL下载图片,然后生成AI艺术作品。模型服务具有高性能、易集成的特点,适用于多种场景如设计、广告等。用户可按指示在阿里云官网注册、充值、开通服务并部署。项目评测显示,其集成便捷、响应快、泛化能力强,但仍有改进空间,如增加图像控制选项和批量处理能力。相对于竞品,通义万相在成本、易用性和应用场景上有竞争力,值得推荐。
10638 9
|
5月前
|
人工智能 API 持续交付
通义万相AI绘画创作解决方案评测
在阿里云平台上,资源部署体验流畅,提供详尽步骤,包括开通服务、获取API-KEY、创建网络资源和服务器。一键部署借助ROS脚本,简化了程序安装,API设计直观,适合快速集成。用户可自定义登录凭据,部署过程自动化,大约5分钟后即可通过URL访问。服务响应快,模型泛化能力强,支持多种图片风格,图片质量高。建议增加更多风格滤镜、多语言支持和动态图像生成等新功能。成本效益高,易用性强,适合广泛行业,文档丰富,适合新手。
121 4