AI 绘画Stable Diffusion 研究(五)sd文生图功能详解(下)(3)

简介: AI 绘画Stable Diffusion 研究(五)sd文生图功能详解(下)

5、环境(environment)


  • **Indoor:**指的是室内环境。这个词描述了在室内进行的活动、场景或拍摄。室内环境通常具有不同的照明、背景和氛围,需要相应的拍摄技巧和照明设置。

  • Outdoor:意为户外环境。这个词用来描述在户外进行的活动、场景或拍摄。户外环境具有自然光线、广阔的背景和与室内不同的氛围,可能需要特殊的照明和拍摄技巧。

  • At night: 表示在夜晚进行的活动、场景或拍摄。夜晚的环境通常具有特殊的照明需求,例如利用城市灯光、月光或人工照明来创造所需的效果。

  • In the park: 指在公园进行的活动、场景或拍摄。公园环境通常具有自然的景观、开放的空间和特定的氛围,可以提供丰富的背景和拍摄机会。

  • Studio: 指的是摄影工作室,一个专门用于摄影和拍摄的室内场地。摄影工作室提供了受控的照明、背景和拍摄环境,可以实现更精确和艺术化的照片和影像创作。

6、镜头(Lens)


  • Wide-angle (广角)
    广角镜头指的是具有较短焦距的镜头。它提供更广阔的视角和较大的景深,可以捕捉到更多的场景和环境细节。广角镜头适用于拍摄大景、建筑物、风景以及需要更多环境呈现的场景。
  • Telephoto (长焦)
    长焦镜头是具有较长焦距的镜头。它提供较窄的视角和较小的景深,可以放大远处的对象,并提供更为聚焦的效果。
    长焦镜头适用于拍摄远距离的主体、体育活动、野生动物以及需要把焦点放在被摄对象上的场景。
Alligator emerging from water, telephoto lens


  • 24mm
    指的是一个具体的焦距。24mm 是一种广角镜头,常用于拍摄广阔的场景,提供较宽的视角和透视效果。

  • EF 70mm
    EF 70mm 是指使用佳能(Canon) F镜头接口的镜头,并具有 70mm 的焦距。70mm 焦距的镜头通常被归类为中焦镜头,可用于人像摄影、风景摄影以及许多其他拍摄情景。

  • Fish-eye
    Fish-eye(鱼眼)是一种特殊类型的广角镜头,具有非常短的焦距和极大的视角。它得名于其像鱼眼一样弯曲和凸起的透镜形状。

Night club, people dancing, Fish-eye lens


  • 800mm
    800mm焦距的镜头被归类为超长焦镜头,它提供了非常高的放大倍率和远距离的拍摄能力。这种镜头适用于需要捕捉远距离对象的场景,例如野生动物摄影、体育摄影或其他需要将远处主体细节捕捉到的场景。800mm 焦距的镜头通常被视为专业镜头,因为它提供了极高的放大能力和图像清晰度。使用这样的镜头需要稳定的支架或三脚架,以确保摄影师能够稳定地拍摄远距离的主体,并避免图像模糊或抖动。
Photo of hummingbird,800mm lens
• 1


  • Macro
    "Macro”(微距)是一种特殊类型的镜头,专门设计用于拍摄极为近距离的主体,以捕捉微小的细节和放大的图像Macro镜头具有较短的最短对焦距离和高放大倍率,使摄影师能够接近被摄对象并拍摄非常接近的图像。它通常用于拍摄小型物体、昆虫、花朵、珠宝、纹身等需要呈现微小细节的主题。Maro镜头的特点是能够提供极高的解析度和清晰度,捕捉微小的细节、纹理和结构。它通常具有浅景深,使被摄对象突出于模糊的背景之中,从而产生出独特的视觉效果。使用 Macro 镜头,摄影师可以探索微观世界,揭示日常生活中被忽视的细节和美丽。这种镜头在室内和室外的摄影、产品摄影、生态摄影、医学摄影等领域都有广泛的应用。

Photo of a ladybug bee hybrid standing on a tulip, macro lens


三、如何写自己的提示词


(1)、提示词书写公式

根据以上所学知识,这里我总结了一套提示词书写公式:

提示词 = 人物及主体特征+ 场景特征 + 环境光照 + 画幅视角 + 画质提示词 + 画风提示词 


(1)、人物及主体特征

  • 服饰穿搭 (white dress)
  • 发型发色 (blonde hair, long hair)
  • 五官特点 (small eyes, big mouth)
  • 面部表情 (smiling)
  • 肢体动作 (stretching arms)

(2)、场景特征

  • 室内、室外 (indoor / outdoor)
  • 大场景 (forest, city, street)
  • 小细节 (tree, bush, white filower)

(3)、环境光照

  • 日天黑夜 (day / night)
  • 特定时段 (moming,sunset)
  • 光环境 (sunlight, bright, dark)
  • 天空 (blue sky, starry sky)

(4)、画幅视角

  • 距离 (cose-up, distant)
  • 人物例 (full body, upper body)
  • 观察视角 (from above, view of back)
  • 镜头类型 (wide angle, Sony A7)

(5)、画质提示词

通用高画质

best quality, ultra detailed, masterpiece, hires, 8k


(6)、画风提示词

  • 插画风 (illustration, painting, paintbrush)
  • 二次元 (anime, comic, game CG)
  • 写实系 (photorealistic, reallistic, photograph)

2、提示词实践


根据以上提示词书写公式 ,我们再结合前一篇的知识点,加上正向画质改善提示词,以及通用反向提示词,配合面部修复、高分辨率修复参数设置即可生成一张漂亮的图片。


关于通用的改善画质提示词和通用的反向提示词,忘记的朋友,建议再回头看看 AI 绘画Stable Diffusion 研究(四)sd文生图功能详解(上)


例如,我想画一张这样的图片:

早上,一个漂亮的小女孩身穿西服背着小书包,长发披肩,一双水灵灵的大眼睛,樱桃小嘴,鹅蛋脸,她微笑着站在一座桥上,下面是一条宁静流淌的河流,远处是连绵起伏的山峦和晴空万里,使用 24mm 镜头拍摄。


对应的正向提示词:

Morning, a beautiful little girl in a suit, carrying a small backpack, with long hair draped over her shoulders, Her eyes are large and sparkling, with cherry lips and an oval face, On her way to school, she stands smiling on a bridge,Below is a tranquil flowing river, Outdoor,with rolling mountains and clear skies in the distance,Captured with a 24mm lens,(masterpiece:1.2), best quality, masterpiece, highres, original, extremely detailed wallpaper.oerfect lighting,(extremely detailed CG:1.2), drawing, paintbrush


对应的反向提示词:

NSFW, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality,(monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, (ugly:1.331),duplicate:1.331), (morbid:1.21), (mutilated:1.21), (tranny:l.331), mutated hands, (poorly drawnands:1.5), blurry, (bad anatomy:1.21), (bad proportions:1.331), extra limbs, (disfigured:1.331),missing arms:1.331), (extra legs:1.331), (fused fingers:1.61051), (too many fingers:1.61051),unclear eyes:1.331), lowers, bad hands, missing fingers, extra digit,bad hands, missing fingers.((extra arms and legs)))


按照以下8个步骤,生成:


生成效果如下:


3、关于写提示词的建议:


(1)、提示词不要一次性写的太多,图像效果是一个不断调整的过程。有时候只需要添加几个主题关键词,效果就可以非常好。因此我们要从简单的提示词开始,只包含主题内容,一次性最少生成4张图,先看看会得到什么样的图。


(2)、大多数的提示词并不是100%有效,因此,如果一个提示词没有生效,不要沮丧,可以尝试调整它的位置,或者增加权重,再或者是更换为近义词。


(3)、能不使用强制增减权重,就不要使用,因为这会增加后期调整的难度。


(4)、修饰词和魔法词很重要,有时候往往增加一个修饰词或魔法词,就可以给图像带来巨大的改变,一定要熟练掌握。

相关文章
|
8月前
|
人工智能 编解码 芯片
【AI绘画】你有多久没有打开SD了?
曾几何时,Stable Diffusion的复杂参数令人崩溃,如今即梦、可灵等AI工具已让生成图片变得轻而易举。哩布哩布发布2.0升级公告,看似迈向更易用的未来,却也悄然为那个钻研模型、拼接工作流的“拓荒时代”奏响终章。技术迭代飞快,但那份对创造的热爱与探索精神,永不褪色。
1034 9
|
编解码 物联网 API
"揭秘SD文生图的神秘面纱:从选择模型到生成图像,一键解锁你的创意图像世界,你敢来挑战吗?"
【10月更文挑战第14天】Stable Diffusion(SD)文生图功能让用户通过文字描述生成复杂图像。过程包括:选择合适的SD模型(如二次元、2.5D、写实等),编写精准的提示词(正向和反向提示词),设置参数(迭代步数、采样方法、分辨率等),并调用API生成图像。示例代码展示了如何使用Python实现这一过程。
847 4
|
数据采集 机器学习/深度学习 人工智能
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记
这段内容介绍了一个使用Stable Diffusion与LoRA技术创建定制化二次元图像生成模型的全流程。首先,通过安装必要的软件包如Data-Juicer和DiffSynth-Studio准备开发环境。接着,下载并处理二次元图像数据集,利用Data-Juicer进行数据清洗和筛选,确保图像质量和尺寸的一致性。随后,训练一个针对二次元风格优化的LoRA模型,并调整参数以控制模型复杂度。完成训练后,加载模型并通过精心设计的提示词(prompt)生成一系列高质量的二次元图像,展示模型对细节和艺术风格的理解与再现能力。整个过程展示了从数据准备到模型训练及结果生成的完整步骤,为定制化图像提供了方向。
|
存储 人工智能 Serverless
搭建文生图AI系统
随着人工智能的发展,**文本生成图像(文生图)**技术在广告创意、视觉设计、内容营销等领域应用广泛。阿里云通义千问作为先进的大语言模型,不仅具备强大的文本理解能力,还能与图像生成技术结合,实现根据文本描述自动生成高质量图像。 本博客将展示如何使用通义千问与阿里云的其他产品(如函数计算、API 网关、对象存储 OSS)搭建一个简单的文生图系统,实现用户输入文本并生成相应图像的功能。
1219 6
|
人工智能 测试技术
语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场
【9月更文挑战第20天】Meta研究人员提出了一种名为Transfusion的创新方法,通过融合Transformer和Diffusion模型,实现了能同时处理文本和图像数据的多模态模型。此模型结合了语言模型的预测能力和Diffusion模型的生成能力,能够在单一架构中处理混合模态数据,有效学习文本与图像间的复杂关系,提升跨模态理解和生成效果。经过大规模预训练,Transfusion模型在多种基准测试中表现出色,尤其在图像压缩和模态特定编码方面具有优势。然而,其训练所需的大量计算资源和数据、以及潜在的伦理和隐私问题仍需关注。
483 8
|
人工智能 自然语言处理 物联网
Datawhale从零入门AI文生图原理&实践-Task1
Datawhale从零入门AI文生图原理&实践-Task1
901 11
|
人工智能 自然语言处理 计算机视觉
比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型
【9月更文挑战第6天】最近,一篇论文在AI领域引起广泛关注,展示了如何以极低成本训练高质量文本生成图像(T2I)模型。研究者通过随机遮蔽图像中75%的patch并采用延迟遮蔽策略,大幅降低计算成本,同时结合Mixture-of-Experts(MoE)层提升性能。最终,他们仅用1890美元就训练出了一个拥有11.6亿参数的模型,在COCO数据集上取得12.7的FID分数。这一成果比Stable Diffusion成本低118倍,为资源有限的研究人员提供了新途径。尽管如此,该方法在其他数据集上的表现及进一步降低成本的可行性仍需验证。
350 1
|
数据采集 机器学习/深度学习 人工智能
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记
这段内容介绍了一个使用LoRA技术定制Stable Diffusion模型的工作流程。首先定义了提示词的结构,接着概述了LoRA作为轻量级微调方法的角色。ComfyUI作为一个图形化工具,简化了AI模型的配置与操作。示例脚本展示了如何通过Data-Juicer和DiffSynth-Studio进行数据准备、模型训练,并最终生成特定风格的二次元图像。通过不同的种子和提示词,生成了一系列具有一致风格但内容各异的高质量二次元角色图像。
|
人工智能
解决方案评测|通义万相AI绘画创作获奖名单
通义万相AI绘画创作获奖名单正式发布!
515 1
|
人工智能 弹性计算 对象存储
通义万相AI绘画创作方案:创新艺术的数字化画布
在数字化艺术创作的浪潮中,通义万相AI绘画创作方案以其强大的图像生成能力,为艺术家和设计师提供了一个全新的创作平台。本文将从部署体验、功能亮点、用户反馈以及改进建议等方面,全面评测这一创新方案。