AI 绘画Stable Diffusion 研究(五)sd文生图功能详解(下)(1)

简介: AI 绘画Stable Diffusion 研究(五)sd文生图功能详解(下)

上一篇文章详细介绍了sd文生图的功能及使用注意事项,感兴趣的朋友可以前往查看:AI 绘画Stable Diffusion 研究(四)sd文生图功能详解(上)


那今天这篇文章,我们接着介绍 sd文生图功能,主要是 sd 提示词prompt 。


大家都知道,提示词是整个Stable Diffusion ai 绘画的灵魂,那么我们应该怎么来写提示词呢?什么样的提示词是优秀的提示词呢?


这篇文章给大家介绍的提示词,很有可能是以前没有听过的,只要大家跟着我的脚步,认认真真的看完这篇文章,你一定不会为写提示词而烦恼!也一定会让你的提示词更简洁有效!

这篇文章的干货非常多,那现在就正式开始吧~


提示词的内容主要包含2个部分:prompt 的格式、 修饰词。

相信大家在网上也看过其他博主有关提示词的知识介绍,一般主要讲解的是提示词的格式,如怎么提高权重、减少权重,以及少量的怎么让画面变得清晰这块。但是修饰词这块很少讲解,那这里就把这块内容进行补齐。


一、提示词 prompt 详解


1、从了解自己的需求开始理解提示词的要素


在写提示词之前,我们脑海里面就要过一下以下问题。

为了便于理解,这里做了中英文的对比,英文部分是直接可以使用的提示词。


(1)、 我想要一张照片(photo)还是一幅画(painting)?

尝试回答 ==》 照片(photo)


(2)、图片的主题是什么? 是人(Person)? 是动物(An animal)还是风景(landscape)?

尝试回答 ==》 一个女孩 (a girl)


(3)、我想添加哪些细节?

尝试回答 ==》 穿泳衣(Dress swimming)


我需要哪种特殊照明(Special Lighting)?自然光(naturalight)、柔光(Soft)、环境光(ambient)、环形光(ring light)、霓虹灯(neon)?

尝试回答 ==》 自然光(naturalight)


我需要在什么环境(Environment)下?室内(lndoor)、室外(outdoor)、水下(underwater)、太空(in space)?

尝试回答 ==》 水下(underwater)


我需要哪种配色方案(Color Scheme)?颜色鲜艳(with bright colors)、充满活力(Vibrant)、黑暗(dark)、柔和(pastel)?

尝试回答 ==》 柔和(pastel)


我需要哪种视角(Point of view)?正面(Front)、头顶(Overhead)、侧面(Side)?

尝试回答 ==》 正面(Front)


(4)、我需要哪种特定的艺术风格? 3D渲染(3D render),吉卜力工作室studio ghibli),电影海报(movie poster)?

尝试回答 ==》 电影海报(movie poster)


(5)、我需要哪种特定的照片类型? 微距(Macro)、长焦(telephoto)

尝试回答 ==》 微距(Macro)


根据以上问题,我们将其串联起来,就可以清晰的看见提示词涉及的元素。

如下:

photo,a girl,Dress swimming,Special Lighting naturalight,Environment underwater,with bright colors pastel,Front, 3D render movie poster,Macro


2、关于提示词权重增减


(1)、单词的顺序很重要

句子中的词,越早出现,权重越高,单词从做往右,从上往下,权重逐渐降低。

因此,我们写提示词的时候,要尽量将重要的核心的内容写在前面,次要的内容写在后面。


(2)、强制增减权重

在上一篇也有简单说明 ,这里再总结一下,感兴趣的朋友可以回头看看

AI 绘画Stable Diffusion 研究(四)sd文生图功能详解(上)-21、Tag 加权、减权用法简单说明


A、套英文半角()

每套一层,权重就乘以 1.1倍

例如:

(((a very beautiful girl )))

表示 1.1x1.1x1.1=1.331倍(增强)


B、英文半角()+数字

a very beautiful girl:1.5

表示权重变为原来的1.5倍

a very beautiful girl:0.8

表示权重变为原来的0.8倍


c、套大括号{}

每套一层,权重就乘以1.05倍

{{{a very beautiful girl}}}

表示 1.05x1.05x1.05 =1.157625倍(增强)


d、套方括号[]

每套一层,权重就乘以0.9倍

[[[a very beautiful girl]]]

表示 0.9x0.9x0.9 =0.729倍(减弱)


二、修饰词详解


修饰词可以改变图像风格、格式、视角的单词。

事实证明,某些单词或短语,有神奇的效果,可以提高图片的质量,下面我们来详细介绍不同类型的修饰词。


下表总结了常用的几类修饰词,在实际书写提示词时,可以搭配使用。


镜头类型 shot type 风格 style Subject 主体 灯光 Lighting 环境Environment 镜头 Lens
Long shot Polaroid Woman Soft Indoor Wide-angle
Close-up Monochrome Old man Ambient Outdoor Telephoto
Medium shot Long exposure Grey cat Ring At night 24mm
PoV Color splash Bunny Sun In the park EF 70mm
Extreme Close-up Tilt-shift Ferrari Cinematic Studio Bokeh


(1)、镜头类型 (shot type)

  • Long shot (远景): Long shot 是一种较远距离拍摄的镜头类型,用于展示被拍摄对象相对较远的位置和环境。远景镜头广泛用于展示整个场景、人物在广阔环境中的位置或活动,或者用于突出环境对故事的重要性。

  • Close-up(特写): Close-up 指的是对被拍摄对象进行近距离拍摄,使其填满画面或占据大部分画面。这种镜头类型用于强调被拍摄对象的细节、表情或情感。它通常用于人物特写或突出物体的细节。

  • Medium shot (中景): Medium shot 是介于远景和特写之间的一种镜头类型。它将被拍摄对象从腰部或膝盖处裁剪,并展示人物或物体的整体外貌和姿态。中景镜头适用于展示人物的动作、表情和环境背景。

  • POV(第一人称视角): POV 是“Point of View”(视角)的缩写,表示通过模拟角色或观察者的视觉角度来呈现场景或情节。POV 镜头旨在让观众体验到与角色或观察者更加身临其境的感觉,使其感受到与角色共享的视觉体验。

  • Extreme Close-up(极特写): Extreme Close-up 指的是对被拍摄对象的极度近距离拍摄。它将焦点限制在非常小的区域上,以突出显示物体的微小细节或部分。极特写常用于表达强烈的情感、揭示重要的细节或营造紧张的氛围。


(2)、风格(style)


  • Polaroid: Polaroid 指的是一种特殊的即时成像摄影技术。它使用一种叫做 Polaroid 的相机拍摄,照片在拍摄后几)钟内即可显影完成,无需进一步的冲洗或处理过程。Polaroid 照片通常具有独特的外观和色彩效果,给人一种复古怀旧的感觉。
still photo of a child sittine in the middle
of a wide empty city street, his back to the camera, symmetrical, polaroid photography, highly detailed, crisp qualit



  • Monochrome: Monochrome 指的是黑白摄影。这种摄影风格仅使用黑、白、灰三种色调,去除了彩色的元素,将照片呈现为单色调的画面。黑白摄影通常具有独特的表现力和艺术感,可以突出形式、纹理和光影效果。
Photo of staircase in abandoned building, symmetrical, monochrome
photography, highly detailed, crisp quality and light reflections, 100mm lens



  • Long exposure: Long exposure 指的是长时间曝光。在摄影中,当相机的快门打开并保持打开的时间较长时,允许更多的光线进入相机,从而在照片中捕捉到移动的物体或在场景中产生模糊效果。长时间曝光常用于拍摄流水、星轨、夜景等场景,创造出动态、流动或梦幻的效果。
An aerial view of a gty at night, long exposure, instagram contest



  • Color splash: Color splash 指的是色彩喷溅效果。这种效果通过将照片中的大部分部分转换为黑白或灰度,并突出显示其中的某些颜色,以产生强烈的色彩对比。通常,选择的颜色会在照片中显眼突出,而其他部分则变为单色或无彩色,营造出一种引人注目的效果。
color splash wide photo of red phone booth in the middle of empty street
detailed, mist soft vignette




相关文章
|
3月前
|
人工智能 编解码 芯片
【AI绘画】你有多久没有打开SD了?
曾几何时,Stable Diffusion的复杂参数令人崩溃,如今即梦、可灵等AI工具已让生成图片变得轻而易举。哩布哩布发布2.0升级公告,看似迈向更易用的未来,却也悄然为那个钻研模型、拼接工作流的“拓荒时代”奏响终章。技术迭代飞快,但那份对创造的热爱与探索精神,永不褪色。
783 9
|
机器学习/深度学习 人工智能 自然语言处理
Sketch2Lineart:AI绘画工具,自动将手绘草图转换成清晰的线条画
Sketch2Lineart是一款基于人工智能的绘画工具,能够自动将手绘草图转换成清晰的线条画。该工具支持多种功能,如草图转线稿、自动描述生成、细节调整和风格定制等,适用于艺术创作、产品设计、教育培训等多个领域。
1319 60
Sketch2Lineart:AI绘画工具,自动将手绘草图转换成清晰的线条画
|
10月前
|
机器学习/深度学习 人工智能 安全
Stable Diffusion 3.0 :一键开启你的AI绘画之旅
本文介绍了Stable Diffusion 3.0的主要优化,包括采用DiT架构提升多对象生成能力及“流匹配”技术加速采样。同时解决了部署复杂、显卡需求高等问题,可通过阿里云计算巢一键部署,实现即开即用。文章展示了人像、动漫风、科幻风等生成效果,并提供中文菜单设置与插件下载教程。无论是专业设计师还是普通用户,都能轻松开启智能创作新时代。 Flux模型支持即将上线,值得期待。
|
人工智能 数据安全/隐私保护 图形学
关于AI绘画优雅草央千澈整理的一份咒语(与AI对话提示词-应用于AI绘图和AI生成视频)-本文长期更新-本次更新2025年1月15日更新-长期更新建议点赞收藏
关于AI绘画优雅草央千澈整理的一份咒语(与AI对话提示词-应用于AI绘图和AI生成视频)-本文长期更新-本次更新2025年1月15日更新-长期更新建议点赞收藏
878 4
|
人工智能 弹性计算 自然语言处理
云端问道 6 期实践教学-创意加速器:AI 绘画创作
本文介绍了在阿里云平台上一键部署Demo应用的步骤。部署完成后,通过公网地址体验Demo应用,包括文本生成图像等功能。
299 10
|
存储 人工智能 弹性计算
云端问道6期方案教学-创意加速器:AI 绘画创作
本文整理自绍懿老师在云端问道第6期关于“创意加速器:AI绘画创作”的分享,主要介绍阿里云通义万相大模型的应用。内容涵盖七大部分:有趣的应用场景、通义万相简介、使用方法、优势特点、典型案例(如电商和营销场景)、收费标准及实操部署。通过这些内容,用户可以快速了解如何利用通义万相实现文字生成图片、图像编辑等功能,并应用于实际业务中,提升效率与创造力。
323 1
|
人工智能 程序员 Linux
神秘山洞惊现AI绘画至宝Stable Diffusion残卷
随着AI神器的现世,不少修士担忧其会取代人类职业。然而,自女娲创造人类以来,法宝虽强,始终只是辅助工具,需修士操控才能发挥威力。如今修仙界最大的至宝是GPT,它能以文字为引,转化出所需答案。图片处理方面也有Stable Diffusion、DALL-E等法宝。这些AI工具并非替代修士,而是提升效率的助手。例如,Stable Diffusion最初由慕尼黑和海德堡大学宗师炼制,现已发展多个版本,如v1、v2.0、SDXL等,帮助修士更便捷地生成图像。通过合理使用这些工具,修士们可以更好地实现心中所想,而非被技术取代。
314 6
|
人工智能 测试技术
语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场
【9月更文挑战第20天】Meta研究人员提出了一种名为Transfusion的创新方法,通过融合Transformer和Diffusion模型,实现了能同时处理文本和图像数据的多模态模型。此模型结合了语言模型的预测能力和Diffusion模型的生成能力,能够在单一架构中处理混合模态数据,有效学习文本与图像间的复杂关系,提升跨模态理解和生成效果。经过大规模预训练,Transfusion模型在多种基准测试中表现出色,尤其在图像压缩和模态特定编码方面具有优势。然而,其训练所需的大量计算资源和数据、以及潜在的伦理和隐私问题仍需关注。
366 7
|
机器学习/深度学习 人工智能 算法
解决方案评测:通义万相 AI 绘画创作
通义万相 AI 绘画创作工具在功能、使用体验等方面表现出色,为用户提供了一种便捷、高效的绘画创作方式。虽然存在一些不足之处,但随着技术的不断发展和优化,相信其性能和表现会不断提升。对于艺术家、设计师、创意工作者以及普通爱好者来说,通义万相都是一款值得尝试和探索的 AI 绘画工具。
1151 4
解决方案评测:通义万相 AI 绘画创作