AI制作艺术二维码 - 文生图

简介: AI制作艺术二维码 - 文生图

前几天看到几个逼格比较高的二维码,然后自己动手做了一下,给大家看看效果:

1、 文生图(狮子):

1689162303489.png

2、文生图(城市):

image.png

下边将开始介绍怎么做的,有兴趣的可以继续读一读。

这里使用的AI绘图工具是Stable Diffusion,没有的同学需要去部署一个,计算平台国内建议使用AutoDL,国外可以白嫖Kaggle的算力,这两个我都用过。具体怎么部署网上已经有很多教程,这里就不多说了,如果大家希望我再写一篇部署说明,请在评论区留言,人多了可以考虑。

生成艺术二维码有两种方法:

一是直接使用提示词,也就是文生图,这样出来的二维码比较漂亮,但是细节很难控制。

二是使用图生图,复刻现有图片的构图或者姿势,这样容易控制细节,但是图像不那么漂亮。

由于内容比较多,这篇文章先讲文生图,图生图后边再开一篇。

文生图

这里文生图用到的模型是:revAnimated,大家可以去huggingface下载,参考地址:huggingface.co/hanafuusen2…

1、我们以生成狮子二维码为例,这里给的提示词都是关于生成狮子的,二维码部分在后边。

提示词: Full Photo shot of a lion, Yoji Shinkawa style, Jean-baptiste Monge, general plan, central composition, entirely on a sheet, Ink painting, expressive painting, watercolor, bold brushstrokes, Concept art, orange, (purple:1.2), gray and white, stylize, intricate detail, 8k, transparent background, (white background:1.4), 3D vector

反向提示词: Watermark, Text, censored, deformed, bad anatomy, disfigured

2、首先看下几个主要参数:

  • 采样器: DPM++ 2M Karras
  • 采样步数:30
  • 分辨率 768 x 768
  • 提示词引导系数: 11

1689162383472.png

3、然后我们添加两个ControlNet,用来控制二维码部分的处理。这两个ControlNet都需要将待合成的二维码上传上去。

1689162414692.png

(1)先看第一个ControlNet的配置,主要是将二维码的黑白对比度融入到图像中。

注意这里设置的几个参数:

  • Control Type:All
  • 预处理器:inpaint_global_harmonious
  • ControlNet模型:control_v1p_sd15_brightness
  • 控制权重:0.35,如果画面太灰,试试调高这个权重。

1689162466939.png

(2)再看第二个ControlNet的配置,主要是还原二维码细节,让二维码更容易被扫出。

注意这里设置的几个参数:

  • Control Type:All
  • 预处理器:inpaint_global_harmonious
  • ControlNet模型:control_v11f1e_sd15_tile
  • 控制权重:0.5,如果不容易扫出,可以增大这个参数。
  • Starting Control Step:什么时候开始介入,越早介入,二维码越容易识别。
  • Ending Control Step:什么时候结束介入,越晚退出,二维码越容易识别。

1689162512283.png

4、最后点击生成就可以了。

image.png

如果生成的图不美观或者扫不出,可以尝试调整ControlNet的各个参数。

ControlNet

1、ControlNet是什么?

如果我们仅仅使用提示词,不能精确的控制图像的细节,比如让人把手举到什么高度;或者我们只想复制图片中的人脸,其它部分可以自由发挥;再或者这里我们需要一个二维码的底图,这个绘制出的二维码必需能扫描出来,不能随便生成一张。

总结起来就是ControlNet能让设计者复制参考图片的构图或者人体的姿势。

2、相关参数

预处理器:提取参考图的特征,不同的预处理器会提取不同的特征。

模型:实现不同的图像生成控制,比如人体姿势、线条控制、图像深度、配色方案等。

权重:值越大,则生成图越依从参考图,反之则越依从提示词。

起始/终止控制步数:ControlNet介入图像绘制的起始和终止采样步数,取值范围0-1,是个百分比。

对于二维码的例子可以调整权重和开始步骤控制图片展示效果和二维码识别率。

其它

另外测试发现色彩明亮、2.5D或者3D模型的效果更好,比如我尝试了“国风3”这个模型,感觉出图效果也还可以,有兴趣的可以试试。


以上就是本文的主要内容了,后续我会继续分享AI应用方面的东西,大家有兴趣的及时加我关注(微信公众号:萤火架构),以免错过精彩内容。


相关文章
|
4月前
|
数据采集 机器学习/深度学习 人工智能
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记
这段内容介绍了一个使用Stable Diffusion与LoRA技术创建定制化二次元图像生成模型的全流程。首先,通过安装必要的软件包如Data-Juicer和DiffSynth-Studio准备开发环境。接着,下载并处理二次元图像数据集,利用Data-Juicer进行数据清洗和筛选,确保图像质量和尺寸的一致性。随后,训练一个针对二次元风格优化的LoRA模型,并调整参数以控制模型复杂度。完成训练后,加载模型并通过精心设计的提示词(prompt)生成一系列高质量的二次元图像,展示模型对细节和艺术风格的理解与再现能力。整个过程展示了从数据准备到模型训练及结果生成的完整步骤,为定制化图像提供了方向。
|
19天前
|
存储 人工智能 Serverless
搭建文生图AI系统
随着人工智能的发展,**文本生成图像(文生图)**技术在广告创意、视觉设计、内容营销等领域应用广泛。阿里云通义千问作为先进的大语言模型,不仅具备强大的文本理解能力,还能与图像生成技术结合,实现根据文本描述自动生成高质量图像。 本博客将展示如何使用通义千问与阿里云的其他产品(如函数计算、API 网关、对象存储 OSS)搭建一个简单的文生图系统,实现用户输入文本并生成相应图像的功能。
55 6
|
2月前
|
人工智能 自然语言处理 安全
【通义】AI视界|Adobe推出文生视频AI模型,迎战OpenAI和Meta
本文精选了过去24小时内的重要科技新闻,包括微软人工智能副总裁跳槽至OpenAI、Adobe推出文本生成视频的AI模型、Meta取消高端头显转而开发超轻量设备、谷歌与核能公司合作为数据中心供电,以及英伟达股价创下新高,市值接近3.4万亿美元。这些动态展示了科技行业的快速发展和激烈竞争。点击链接或扫描二维码获取更多资讯。
|
3月前
|
机器学习/深度学习 人工智能 编解码
深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
【9月更文挑战第2天】深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
 深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
|
4月前
|
人工智能 自然语言处理 物联网
Datawhale从零入门AI文生图原理&实践-Task1
Datawhale从零入门AI文生图原理&实践-Task1
233 11
|
4月前
|
数据采集 机器学习/深度学习 人工智能
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记
这段内容介绍了一个使用LoRA技术定制Stable Diffusion模型的工作流程。首先定义了提示词的结构,接着概述了LoRA作为轻量级微调方法的角色。ComfyUI作为一个图形化工具,简化了AI模型的配置与操作。示例脚本展示了如何通过Data-Juicer和DiffSynth-Studio进行数据准备、模型训练,并最终生成特定风格的二次元图像。通过不同的种子和提示词,生成了一系列具有一致风格但内容各异的高质量二次元角色图像。
|
4月前
|
人工智能
解决方案评测|通义万相AI绘画创作获奖名单
通义万相AI绘画创作获奖名单正式发布!
201 1
|
4月前
|
机器学习/深度学习 人工智能 编解码
AI文生图模型
8月更文挑战第16天
|
4月前
|
人工智能 编解码 自然语言处理
AI文生图模型DALL·E 3
8月更文挑战第15天
|
4月前
|
机器学习/深度学习 人工智能 编解码

热门文章

最新文章

下一篇
DataWorks