手把手教你生成一幅好看的AI图片

简介: 想要生成一幅好看的AI图片,但是却不知道如何下手?只会1girl的你现在是不是很烦恼?别急,看这篇文章就够了。

很多人看到别人用SD生成出来的图片感到非常的羡慕,因为即使给了他们最好的SD软件,他们也是词穷,不知道该如何去描述要生成的图片。

别急,这篇文章会一步步的教会你怎么才能生成一个好看的AI图片。

跟着我,别走丢。

准备工作

当然前提是你需要一个SD的软件,你可以用本地的SD webUI或者云端的SD环境,全都是可以的。

跟着我生成一幅漂亮的图片

为了构建一个有效的提示(prompt),以引导生成模型产生你想要的图像,你的提示应该包含以下几个关键信息:

  1. 主题(Subject)(必需):确定图像的中心主题或主要对象。
    1. 媒介(Medium):指定艺术作品使用的媒介,比如油画、水彩、数字艺术等。
    1. 风格(Style):描述你想要的艺术风格,如写实主义、抽象、卡通化等。
    1. 艺术家(Artist):提及一个具体的艺术家或其风格,以模仿或启发生成的图像。
    1. 分辨率(Resolution):设定图像的分辨率要求,如 1920x1080 或 256x256。
    1. 附加细节(Additional details):添加任何额外的细节,如特定的动作、表情、背景元素等。
    1. 颜色(Color):指定颜色方案或特定的颜色要求。
    1. 光照(Lighting):描述光照条件,比如柔和的日光、昏暗的灯光、特定的阴影效果等。

      主题

对于初学者来说,一个常见的错误是未能提供足够详细的图像描述。

比如我们想要画一个美女的图片,那么你的提示词可能是这样:

A beautiful woman

image-20240423153839606

虽然出来了一个美女,但是很可能不符合你的要求。

因为你并没有给出关于这个美女的更多信息,所以一切都留给AI来发挥,最终得到的结果不尽如人意。

我们想一想,这个美女在做什么?穿着什么样的衣服?头发是什么样子的?有没有戴眼镜?

在构建提示时,需要考虑那些看似微小但实际上对整体图像传达至关重要的细节。

  1. 服装(Clothing)
    • 描述具体服装的样式、颜色和材质。例如:“她穿着一件复古风格的淡蓝色太阳裙,裙子上有精致的白色蕾丝镶边。”
    1. 发型(Hairstyle)
    • 描述发型的类型、长度、颜色和任何特别的发型设计。例如:“她有着一头飘逸的栗色长发,自然地披在肩上。”
    1. 配饰(Accessories)
    • 包括人物所佩戴的任何饰品或配件,如耳环、项链、手镯等。例如:“她戴着一条简约的银色项链,增添了一丝优雅。”
    1. 表情(Expression)
    • 描述人物的面部表情,如微笑、严肃、思考等。例如:“她的脸上带着温柔的微笑。”
    1. 姿态(Posture)
    • 描述人物的姿态或动作,如坐着、站着、行走等。例如:“她正坐在一扇精美的木窗旁。”
      思考一下,我们补充一下细节:

一个女孩,穿着复古风格的淡蓝色裙子,金黄色的长头发,银色项链,微笑,坐在木窗旁边

翻译成英文输入prompt:

1girl,retro-styled light blue dress,blonde long hair,silver necklace, smiling, sitting next to a wooden window

当然我们再加入一些常用的反向提示词:

ugly, deform, disfigured
再次生成一下看看效果:

image-20240423154756838

看起来还不错,基本上满足了我们的描述内容。

媒介

对于图片来说,每张图片都有对应的图片媒介,比如这个图片是油画、水彩、数字艺术等。以下是一些常见的媒介类型:

  1. 摄影Photography:使用相机捕捉现实世界的图像,可以包括风景、人物、动物、城市等。
    1. 插画Illustration:手绘或数字绘制的图像,用于故事书、广告、海报等。
    1. 漫画Comics:一种用于讲述故事或传达观点的插画形式,通常有对话框和气泡。
    1. 动画Animation:连续的图像序列,通过快速播放产生动态效果。
    1. 图形设计Graphic Design:使用图形元素如形状、颜色和文本来传达信息或创建视觉效果,例如标志、海报、名片等。
    1. 艺术绘画Fine Art Painting:手工或数字绘制的艺术作品,表达艺术家的情感和想法。
    1. 拼贴Collage:由多个不同的图像或材料组合而成的图像。
    1. 抽象艺术Abstract Art:通过形状、颜色和纹理等抽象元素来表达艺术家的感觉和观点。
    1. 立体图像Stereoscopic Imaging:通过使用特殊技术或眼镜来创建立体效果的图像。
    1. 宣传海报Promotional Poster:用于宣传活动、产品或服务的图像设计。
    1. 数字绘画Digital Painting:电脑软件进行的绘画活动。艺术家使用电子画笔、触摸屏或图形板在计算机上绘制和编辑图像。它结合了传统绘画的技巧和数字技术的优势,使艺术家能够创建出既具有传统艺术感又富有现代氛围的作品。
    1. 油画:Oil painting是一种使用油性颜料在画布或其他基材上绘制图像的艺术形式。
      我们给上面的图加上一个Digital Painting媒介描述:

Digital Painting of 1girl,retro-styled light blue dress,blonde long hair,silver necklace,smiling,sitting next to a wooden window,
image-20240423160058719

当然你也可以使用其他的媒介类型,但是有一点需要注意的是你的checkpoint需要能够识别到这些不同的媒介类型才能起作用。

风格

在 stable diffusion 中,"Style" 可以是不同的艺术形式或特定的视觉风格。以下是一些常见的图片 Style:

  1. Impressionism(印象派):模糊的笔触和光线效果,强调色彩和光影的变化。
    1. Expressionism(表现主义):强烈的情感和个人观点,颜色和形状被夸张和扭曲。
    1. Cubism(立体派):将物体分解成基本的几何形状,展示多个视角和时间的同步。
    1. Realism(现实主义):尽可能真实地呈现对象和场景,追求细节和精确性。
    1. Surrealism(超现实主义):超越现实的幻想和梦境,将不相关的元素结合在一起。
    1. Abstract(抽象):不依赖于现实对象的形状或轮廓,强调颜色、形状和纹理的组合。
    1. Pop Art(波普艺术):使用流行文化和大众传媒的图像,强调明亮的颜色和大胆的设计。
    1. Gothic(哥特风格):黑暗、神秘和装饰性强的风格,常见于建筑和插图。
    1. Digital Art(数字艺术):使用计算机软件创建的图像,结合传统艺术技巧和数字技术。
    1. Photorealism(照片写实主义):模仿摄影的细节和精确性,创造出几乎与真实照片相同的图像。

      Artist艺术家

"Artist"(艺术家)通常是指那些通过他们的创意和技能来定义和影响艺术风格的个人或团队。这些艺术家可能是现实世界中的著名艺术家,也可能是数字艺术和计算机图形领域中的创新者。

以下是一些可能在 stable diffusion 中被提及或模仿的知名艺术家,以及他们的风格或贡献:

  1. Vincent van Gogh(文森特·梵高):印象派和后印象派的代表,以其独特的笔触和明亮的色彩著称。
    1. Pablo Picasso(巴勃罗·毕加索):立体派和现代艺术的创始人,对艺术形式和结构有深远的影响。
    1. Salvador Dalí(萨尔瓦多·达利):超现实主义的代表,以其梦幻和离奇的画面而著称。
    1. Jackson Pollock(杰克逊·波洛克):抽象表现主义的领军人物,以其滴漆技术和动态的画面效果著称。
    1. Andy Warhol(安迪·沃霍尔):波普艺术的代表,通过复制和大众文化图像创造出标志性的作品。
    1. Frida Kahlo(弗里达·卡罗):墨西哥现实主义和超现实主义的艺术家,以自画像和深情主题而著称。
    1. H.R. Giger(汉斯·鲁道夫·吉格尔):科幻艺术和超现实主义的艺术家,设计了《异形》电影系列中的怪物。
    1. Yoko Honda:现代数字艺术家,以其复古和霓虹风格的插图著称。
    1. Banksy:街头艺术家和社会评论者,以其政治和社会批评的作品而著称。
    1. Ai Weiwei(艾未未):多媒体艺术家和社会活动家,以其对政治和社会问题的关注而著称。

      Resolution分辨率

这里的分辨率不是指的图像最终生成的分辨率,而是指图片里面内容的显示效果。决定了图像的细节和清晰度。不同的应用场景和需求可能需要不同的分辨率。以下是一些常见的图像分辨率选项:

  1. 低分辨率
    • 480p(640 x 480像素)
    • 720p(1280 x 720像素)
    • 1080p(1920 x 1080像素)
    1. 标准分辨率
    • 2K(2048 x 1080像素)
    • 1440p(2560 x 1440像素)
    1. 高分辨率
    • 4K(3840 x 2160像素)
    • 5K(5120 x 2880像素)
    • 8K(7680 x 4320像素)
    1. 超高分辨率
    • 10K(10240 x 4320像素)
    • 12K(12288 x 6480像素)

      Lighting光线

"Lighting"(光照)是一个重要的视觉元素,它影响图像的氛围、情感和可读性。以下是一些常见的光照选项和风格:

自然光(Natural Light)

  • 日光(Sunlight):模拟白天的阳光,可以有不同的角度和强度。
    • 黄昏/日落(Twilight/Sunset):温暖的光线,产生浪漫和神秘的氛围。
    • 夜晚/月光(Night/Moonlight):冷色调的柔和光线,适合创造宁静和神秘的氛围。
      人造光(Artificial Light)
  • 室内灯光(Indoor Lighting):如灯泡、吊灯或台灯,可以为场景提供温馨或聚焦的光源。

    • 闪光灯(Flash Lighting):短暂且强烈的光源,常用于摄影和特殊效果,提供明亮的高光和深色的阴影。
    • 霓虹灯(Neon Lights):鲜艳且多彩的光源,常用于夜晚或城市场景,创造生动和现代的效果。
      环境光(Ambient Light)
  • 全局光(Global Illumination):均匀分布在整个场景中的光线,用于强调整体亮度和阴影,提供自然和平衡的照明。

    • 方向光(Directional Light):模拟特定方向的光源,如太阳或其他主要光源,产生明确的阴影和高光。
    • 点光源(Point Light):小而集中的光源,可以用于创造特定的高光和阴影效果,提供局部和突出的照明。
      特殊效果(Special Effects)
  • 阴影和高光(Shadows and Highlights):通过调整光源的位置和强度,创建深度和立体感,强调对象的形状和纹理。

    • 光晕和散射(Halo and Diffusion):模拟光线在空气中的散射效果,创造柔和和梦幻的效果,提供柔和和温暖的光线。
    • 背光(Backlight):光源位于被摄对象的背后,产生轮廓和明亮的边缘效果,提供层次和深度的感觉。

      结合起来

好了,我们把上面所有的结合起来,得到下面一个prompt:

Digital Painting of 1girl,retro-styled light blue dress,blonde long hair,silver necklace,smiling,sitting next to a wooden window,by Stanley Artgerm Lau, artstation, 8k, extremely detailed, ornate, cinematic lighting, rim lighting, vivid

image-20240423162237043

效果是不是还可以?

总结一下

总结一下,写好提示有下面一些要注意的事项:

  1. 详细且具体:在描述主题时,提供尽可能多的细节,包括场景、人物、动作、情感等。
    1. 使用括号
    • 使用多个圆括号()可以增加某个元素的重要性,使其在生成的图像中更加突出。
    • 使用方括号[]可以减少某个元素的影响,或者在不希望它过于显著时使用。
    1. 介质类型:选择与艺术家风格相匹配的介质类型,以确保生成的图像风格一致。
    1. 艺术家名字:提及特定艺术家的名字可以强烈地影响图像的风格,因此应该谨慎使用。
    1. 风格融合:尝试将不同的艺术风格融合在一起,可能会产生意想不到的创意效果。
    1. 迭代和测试:生成图像后,根据结果不断调整和优化你的提示。
    1. 否定提示:使用否定提示来排除你不希望出现在图像中的元素或效果。
      当然,还有一个好的办法是查看其他用户创建的高质量提示,这可以给你灵感,并帮助你理解如何构建有效的提示。如果你喜欢某个特定的图像,可以将其使用的提示作为起点,然后根据自己的需求进行调整。

点我查看更多精彩内容:www.flydean.com

相关文章
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
OpenSAP 上 SAP Generative AI 公开课里提到的一张图片
OpenSAP 上 SAP Generative AI 公开课里提到的一张图片
|
2月前
|
机器学习/深度学习 编解码 人工智能
AI短视频制作一本通:文本生成视频、图片生成视频、视频生成视频
AI短视频制作一本通:文本生成视频、图片生成视频、视频生成视频
457 0
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
四张图片道清AI大模型的发展史(1943-2023)
现在最火的莫过于GPT了,也就是大规模语言模型(LLM)。“LLM” 是 “Large Language Model”(大语言模型)的简称,通常用来指代具有巨大规模参数和复杂架构的自然语言处理模型,例如像 GPT-3(Generative Pre-trained Transformer 3)这样的模型。这些模型在处理文本和语言任务方面表现出色,但其庞大的参数量和计算需求使得它们被称为大模型。当然也有一些自动生成图片的模型,但是影响力就不如GPT这么大了。
1843 0
|
11月前
|
人工智能 程序员
仅仅10秒,AI 能将你的静态图片转换成视频
仅仅10秒,AI 能将你的静态图片转换成视频
1368 0
仅仅10秒,AI 能将你的静态图片转换成视频
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
轻松复现一张AI图片
现在有一个非常漂亮的AI图片,你是不是想知道他是怎么生成的?今天我会交给大家三种方法,学会了,什么图都可以手到擒来了。
轻松复现一张AI图片
|
2月前
|
人工智能
Raspberry Pi利用AI在电子墨水显示屏上创作图片故事书
`Thomas Valadez` 创造了一款名为 `Storybook Pi` 的项目,使用 `Raspberry Pi` 和 `AI` 来自动生成带有图片的睡前故事。故事和图像在 `Pi` 上本地生成,然后显示在低功耗的电子墨水屏上。虽然创作过程大约需要五分钟,但结果是独特的。项目基于 `Raspberry Pi 5`,建议使用至少 `32GB microSD` 卡。源代码和相关信息已在 `GitHub` 开源。
|
9月前
|
人工智能 并行计算 数据安全/隐私保护
铅华洗尽,粉黛不施,人工智能AI基于ProPainter技术去除图片以及视频水印(Python3.10)
视频以及图片修复技术是一项具有挑战性的AI视觉任务,它涉及在视频或者图片序列中填补缺失或损坏的区域,同时保持空间和时间的连贯性。该技术在视频补全、对象移除、视频恢复等领域有广泛应用。近年来,两种突出的方案在视频修复中崭露头角:flow-based propagation和spatiotemporal Transformers。尽管两套方案都还不错,但它们也存在一些局限性,如空间错位、时间范围有限和过高的成本。 说白了,你通过AI技术移除水印或者修复一段不清晰的视频,但结果却没法保证连贯性,让人一眼能看出来这个视频或者图片还是缺失状态,与此同时,过高的算力成本也是普通人难以承受的。
铅华洗尽,粉黛不施,人工智能AI基于ProPainter技术去除图片以及视频水印(Python3.10)
|
9月前
|
人工智能 机器人
人工智能 AI 绘画 AI绘制的图片 ? 简介的版权,以及如何使用图像生成AI 绘画 ?
人工智能 AI 绘画 AI绘制的图片 ? 简介的版权,以及如何使用图像生成AI 绘画 ?
275 0
|
2月前
|
人工智能 编解码 数据安全/隐私保护
才发现百度自带的AI图片助手这么好用,去水印、画质优化、AI扩图、涂抹消除等功能一应俱全!
才发现百度自带的AI图片助手这么好用,去水印、画质优化、AI扩图、涂抹消除等功能一应俱全!
400 0
|
2月前
|
人工智能 异构计算 Python
字节跳动最新研究AI项目:一张图片组合一组动作就可以生成毫无违和感的视频!
字节跳动最新研究AI项目:一张图片组合一组动作就可以生成毫无违和感的视频!