AI | Stable Diffusion系列教程(一)

简介: 最近的AI大火,我也来曾一个热度吧。本篇应该算是干货较多。

最近的AI大火,我也来曾一个热度吧。本篇应该算是干货较多。

原因

为啥会出这一系列的教程,大概还是很多人不清楚这个东西。前面的ChatGPT大火,很多具有前瞻性的朋友凭借这个迅速圈地,成立了星球,收取会费,赚的盆满钵满,当然也为会员提供了对应的服务,帮助最开始的一批人使用了AI,已然成为老手,但是还是有很多人不会,所以我就出了这一系列教程。当然我也是在学习当中,边学边更,如有错误之处,请指正。

除了ChatGPT外,类似的还有claude,国内的星火大模型等等好多个,但是除此之外,最让人具有冲击感的还是Midjourney以及Stable Diffusion,这两个都是可以根据你的描述,来生成高质量图片。

前段时间想去试试Midjourney,发现收费了,听说是被薅羊毛太厉害了,目前不免费了,后面可能继续免费。当然重要的是你还会科学。

所以我继续体验了Stable Diffusion

介绍

Stable Diffusion是一个文生图的生成式AI,将文本转化为高质量图片,正如Diffusion的意思一样,他是扩散的,它会对文本一个个生成,最开始是一个模糊的图片,根据文本会扩散的继续扩散、绘图,最后根据步数来生成最后的图片。

这个相对于Midjourney有什么优势?当然这个是开源免费的,你可以安装在自己的电脑上面或者服务器上面,你可以下载很多的模型,你甚至可以调试属于自己风格的模型,可以随时随地来绘画,也不需要科学。

用处

说实话,Stable Diffusion用处的话,我其实想到的不多,可能对于设计来说,是一个很好的帮助,或者变现,大概就是通过软件生图,然后出售,我后面应该也会通过Stable Diffusion去生图,出售,如果有兴趣,可以关注下,大概就是在咸鱼或者淘宝。应该挺便宜的。

建议电脑配置

我这里是windows系统,仅针对此系统建议,mac电脑同样也可以安装,只是配置我不熟悉了。

因为Stable Diffusion是比较吃显卡的,所以显卡很重要。

名称 配置
显卡 RTX1660S及以上
显存 6G及以上
内存 16G及以上
硬盘可用空间 最好100G以上

为啥可用空间要那么大?因为你可能会下载模型,模型比较大,举个例子,AbyssOrangeMix Realistic模型就3G多,还有更大的。本身的Stable Diffusion只有10G的样子。

不然生图的时候,可能就会和我的电脑一样,卡的掉帧,然后可能就GG了,等个几小时成生一个图。所以我用了我对象的电脑,GTX2080Ti几秒钟一个图,当然配置越高,生图越快。

下载地址

ControlNet用模型、Stable Diffusion环境以及软件下载地址

链接:https://pan.quark.cn/s/18479fb6b761
提取码:1zL5

模型下载地址:

C站:https://civitai.com/

LibLibAi:https://www.liblibai.com/

当然,C站需要科学,所以可以直接使用国内的炼丹阁。

炼丹阁:https://www.liandange.com/

如何安装

  • 程序依赖于python所以需要安装。下载地址:https://www.python.org/

  • 先点击启动器依赖这个exe,用来安装相关依赖。

  • 解压sd-webui-aki-v4.2文件,文件比较大,需要一会时间,等待解压完毕。

  • 解压完毕后,找到启动器。打开启动器。

  • 咱需要先更新一下版本,在版本管理里面,点击一键更新,选择扩展,再点击一键更新。

  • 然后就可以点击一键启动啦,会弹出一个cmd命令的窗口,这个可不能关闭哈,代码生图的时候都是在这里执行的,等待一会,就会打开一个网站。如果没有打开的话,请在cmd命令窗口找到这个ip,打开浏览器,输入即可。

  • 打开后,应该是这样的界面。

简单入门使用

让我们来绘制一个简单的图片吧!由于还没有下载任何模型,所以我们选择默认的模型就好了。关键词是英文,如果不会翻译的,可以去翻译软件翻译成英文即可。

我们输入在辽阔的海面上,阳光灿烂地照耀着,天空很蓝。有帆船在航行,画面高质量。翻译一下,就是On the vast sea, the sun is shining brightly, and the sky is very blue. There is a sailboat sailing, and high-quality pictures.我们就能得到以下图片。

我们可以将生图称为抽卡,每次生成的都是不一样的,人物的话,最好勾上面部修复。当我们选择一个满意的图片是,发现还有点缺陷,我们可以对其进行图生图或者修复,图片感觉太小了,可以进行后期处理,放大图片。

成图

原图512

放大至1024

后面再更一期,讲讲现在的二维码美化,现在咸鱼上面有卖的那种,便宜的5元,贵的几十,可以定制很多种风格。

相关文章
|
1月前
|
人工智能 Serverless
AI助理精准匹配------助力快速搭建Stable Difussion图像生成应用
【10月更文挑战第7天】过去在阿里云社区搭建Stable Diffusion图像生成应用需查阅在线实验室或官方文档,耗时且不便。现阿里云AI助理提供精准匹配服务,直接在首页询问AI助理即可获取详细部署步骤,简化了操作流程,提高了效率。用户可按AI助理提供的步骤快速完成应用创建、参数设置、应用部署及资源释放等操作,轻松体验Stable Diffusion图像生成功能。
|
1月前
|
人工智能 Serverless
AI助理精准匹配,为您推荐方案——如何添加一个Stable Difussion图像生成应用
介绍了一种利用AI助手快速获取并搭建Stable Diffusion图像生成应用的方法。用户只需在阿里云官网向AI助手提出需求,即可获得详细的实施方案。随后,按照AI助手提供的方案,通过函数计算部署应用,并进行测试。此过程显著提升了开发效率。
798 2
AI助理精准匹配,为您推荐方案——如何添加一个Stable Difussion图像生成应用
|
1月前
|
自然语言处理 IDE 测试技术
通义灵码史上最全使用教程:秀一秀AI编程新肌肉
通义灵码是阿里云推出的一款智能编码辅助工具,基于通义大模型,提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码优化、注释生成、代码解释、研发智能问答、异常报错排查等功能。它支持 Visual Studio Code 和 JetBrains IDEs,适配多 IDE 原生设计,帮助开发者高效、流畅地编码。官方提供了详细的下载和安装指南,以及丰富的功能介绍和使用指南。
280 3
|
1月前
|
人工智能
添加一个Stable Difussion图像生成应用,通过向AI助手简单的提问,即可快速搭建Stable Diffusion应用至自己的网站中,大幅提升开发效率。
添加一个Stable Difussion图像生成应用,通过向AI助手简单的提问,即可快速搭建Stable Diffusion应用至自己的网站中,大幅提升开发效率。
|
2月前
|
人工智能
在stable diffussion中完美修复AI图片
无论您的提示和模型有多好,一次性获得完美图像的情况很少见。修复小缺陷的不可或缺的方法是图像修复(inpainting)
在stable diffussion中完美修复AI图片
|
2月前
|
人工智能 测试技术
语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场
【9月更文挑战第20天】Meta研究人员提出了一种名为Transfusion的创新方法,通过融合Transformer和Diffusion模型,实现了能同时处理文本和图像数据的多模态模型。此模型结合了语言模型的预测能力和Diffusion模型的生成能力,能够在单一架构中处理混合模态数据,有效学习文本与图像间的复杂关系,提升跨模态理解和生成效果。经过大规模预训练,Transfusion模型在多种基准测试中表现出色,尤其在图像压缩和模态特定编码方面具有优势。然而,其训练所需的大量计算资源和数据、以及潜在的伦理和隐私问题仍需关注。
71 7
|
3月前
|
人工智能
Suno教程篇:音乐小白也能使用Suno AI零门槛创作音乐?从此只听AI写的歌!
本文是一篇Suno AI音乐创作工具的教程,指导音乐小白如何使用Suno AI零门槛创作音乐,包括准备工作、基础使用、歌曲风格的选择、歌词填入技巧,以及通过实例展示如何为不同场景生成背景音乐。
Suno教程篇:音乐小白也能使用Suno AI零门槛创作音乐?从此只听AI写的歌!
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
还不懂如何与AI高效交流?保姆级且全面的chatGPT提示词工程教程来啦!(一)基础篇
这篇文章是一篇保姆级的教程,旨在全面介绍如何与AI进行高效交流,包括ChatGPT的前世今生、应用场景以及提问的基础技巧。
还不懂如何与AI高效交流?保姆级且全面的chatGPT提示词工程教程来啦!(一)基础篇
|
2月前
|
人工智能 Linux iOS开发
AI超强语音转文本SenseVoice,本地化部署教程!
【9月更文挑战第7天】以下是AI超强语音转文本工具SenseVoice的本地化部署教程:首先确保服务器或计算机满足硬件和软件要求,包括处理器性能、内存及操作系统等。接着从官网下载适合的安装包,并按操作系统进行安装。配置音频输入设备和语言模型后,启动SenseVoice并测试其语音转文本功能。最后根据实际使用情况进行优化调整,并定期更新以获取最新功能。详细步骤需参照官方文档。
584 1
|
2月前
|
机器学习/深度学习 人工智能 测试技术
AI计算机视觉笔记二十五:ResNet50训练部署教程
该项目旨在训练ResNet50模型并将其部署到RK3568开发板上。首先介绍了ResNet50网络,该网络由何恺明等人于2015年提出,解决了传统卷积神经网络中的退化问题。项目使用车辆分类数据集进行训练,并提供了数据集下载链接。环境搭建部分详细描述了虚拟环境的创建和所需库的安装。训练过程中,通过`train.py`脚本进行了15轮训练,并可视化了训练和测试结果。最后,项目提供了将模型转换为ONNX和PT格式的方法,以便在RK3568上部署。

热门文章

最新文章