神秘山洞惊现AI绘画至宝Stable Diffusion残卷

简介: 随着AI神器的现世,不少修士担忧其会取代人类职业。然而,自女娲创造人类以来,法宝虽强,始终只是辅助工具,需修士操控才能发挥威力。如今修仙界最大的至宝是GPT,它能以文字为引,转化出所需答案。图片处理方面也有Stable Diffusion、DALL-E等法宝。这些AI工具并非替代修士,而是提升效率的助手。例如,Stable Diffusion最初由慕尼黑和海德堡大学宗师炼制,现已发展多个版本,如v1、v2.0、SDXL等,帮助修士更便捷地生成图像。通过合理使用这些工具,修士们可以更好地实现心中所想,而非被技术取代。

最近听到不少大宗门纷纷发声:随着AI神器的现世“程序员职业将不复存在”,“设计图将要失业”。

至此,不少修士开始担忧起来,现出世的AI神器会不会取代掉我辈修士。

其实,至女娲天神创造人类以来,在这漫漫修仙路上,人类在不断的进步。在炼器界不少大修士或隐世宗门炼制出不少法宝,如炼制石器法宝、到铁器法宝、到蒸汽机法宝。。。

每一次炼器界的冲破,无不给各修仙界带来巨大的影响。但法宝虽强,终究是法宝只是辅助我辈修士,终不可能代替我们,AI即使是神器也需我们修士输入真元和法诀加于操控才能发挥出法宝真正威力。

在如今的修仙界,最大的至宝莫过于GPT。GPT已有初级的器灵,虽无灵智,但修士能够以文字为引,让GPT转化出自己想要的答案。

当然在图片处理方面也已经有修仙大派炼制出如:Stable Diffusion、DALL-E、Midjourney等法宝

添加图片注释,不超过 140 字(可选)

我偶然在一神秘的山洞里发现一份残缺的Stable Diffusion法宝的炼制玉简,上面有记载Stable Diffusion法宝的炼制术。下面我们一起来探索这份神秘的玉简,揭开Stable Diffusion绘图法宝的神秘面纱。

添加图片注释,不超过 140 字(可选)

SD秘籍入门篇

SD起源

Stable Diffusion法宝最初源自于Latent Diffusion之术,由慕尼黑路德维希-马克西米利安大学和海德堡大学的宗师炼制。Stable Diffusion的第一个卷本(v1)由CompVis宗派炼制出来。

SD卷本

添加图片注释,不超过 140 字(可选)

  • Stable Diffusion v1: CompVis团队发布的原始卷本。
  • Stable Diffusion v2.0: Stability AI资助和炼制的更新卷本。
  • Stable Diffusion XL (SDXL): 在Stable Diffusion的基础上进行了扩展和改进。
  • SDXL Turbo: SDXL Turbo是SDXL的超快模型,改变了用户与技术的交互方式。
  • Stable Diffusion v3: 最新的卷本,目前处于早期预览阶段。

SD秘籍炼制篇

Windows法器卷本

添加图片注释,不超过 140 字(可选)

大家看到这个风格,一定会感觉这好像并不是Stable Diffusion宗派的风格啊。

的确,Stable Diffusion宗派并没有提供相应的Windows法器上的卷本,我们来看看它是怎么来的。

在修仙的B站界中,有一名声名鹊起的up主,名为秋叶。他近日炼制出了一款名为Stable Diffusion整合包v4的阵法,此阵法使得SD的炼制变化简便易用和一键启灵之特性,深受修仙者们的青睐。

下载时,如果只是简单的体验,只需下载这两个文件,其它的就不用了。因为这些文件都比较大

添加图片注释,不超过 140 字(可选)

如果你的电脑时第一次安装,需要先下载启动器运行依赖,双击安装就可以

添加图片注释,不超过 140 字(可选)

解压sd-webui-aki-v4.8文件夹后,双击打开“A绘世启动器.exe”程序。

添加图片注释,不超过 140 字(可选)

中间有提示就点确认,然后就出现此窗体了

添加图片注释,不超过 140 字(可选)

等待一会,就会自动弹出浏览器页面:http://127.0.0.1:7860/

添加图片注释,不超过 140 字(可选)

至此就炼制完成了

秋叶WEBUI整合包免费下载地址:

网盘:https://pan.quark.cn/s/2c832199b09b

解压密码:bilibili@秋葉aaaki

到这里不少修士应该会一直带着一个疑问,我是普通电脑没有英伟达的显卡,能不能搭建SD,答案是肯定的,可以。不过就是CPU和内存基本会被拉满,还过还是可以体验的。

添加图片注释,不超过 140 字(可选)

Linux法器卷本

添加图片注释,不超过 140 字(可选)

环境配置: 首先,更新现有的潜在扩散环境,运行以下命令:

安装xformers: 为了在GPU上提高效率和速度,强烈推荐安装xformers库。需要较新卷本的nvcc和gcc/g++,可以通过以下命令获取:

然后,运行以下命令(编译可能需要长达30分钟):

下载权重: 下载SD2.1-v和SD2.1-base模型的权重。

文本到图像: 使用以下命令从SD2.1-v模型中采样:

这些步骤是从页面中提取的关键信息,用于安装和运行Stable Diffusion模型。请确保按照指示操作以避免安装问题。如果需要更多帮助,请参考页面上的详细文档。

SD秘籍秘诀篇    

SD官方API

打开官方秘籍

添加图片注释,不超过 140 字(可选)

点击进入API篇

添加图片注释,不超过 140 字(可选)

找到API key替换掉代码中的数据

添加图片注释,不超过 140 字(可选)

点击API key链接,这里需要一个账号登录,比如使用自己的google账号登录

添加图片注释,不超过 140 字(可选)

复制这里的API key,替换掉代码中的,这里我选择使用的是Python的调用方式。

prompt:dog wearing black glasses

提示词:戴黑色眼镜的狗

添加图片注释,不超过 140 字(可选)

这是接口返回的结果

添加图片注释,不超过 140 字(可选)

我们来更换prompt试试效果:

增加描述性细节:如颜色、场景、风格、光照等的描述

prompt:A sleek black dog wearing stylish black sunglasses, standing on a beach at sunset.

提示词:一个圆滑的黑色狗戴着时髦的黑色太阳镜,站在日落的海滩。

添加图片注释,不超过 140 字(可选)

使用高级词汇:使用专业的词汇来代替通用词汇。

prompt:A confident Border Collie wearing aviator-style black glasses, captured in a dynamic action shot.

提示词:一个自信的边境牧羊犬戴着飞行员风格的黑色眼镜,捕捉到了一个动态的动作镜头。

添加图片注释,不超过 140 字(可选)

再增加一些场景与氛围

prompt:a photorealistic image of a friendly golden retriever dog wearing stylish black glasses and a red bow tie, sitting in a bright and modern office environment。

提示词:一张写实风格的图片,展示一只友好的金毛寻回犬戴着时尚的黑色眼镜和红色领结,坐在明亮现代的办公环境中。

添加图片注释,不超过 140 字(可选)

再利用对比和比喻手法:通过对比或比喻手法,增强图像的视觉效果。

prompt:A photorealistic picture showing a super cute white dog with stylish black glasses and suave manners sitting on a sunny family balcony with flowers and greenery.

提示词:一张写实风格的图片,展示一只超级可爱的白毛小狗,戴着时尚的黑色眼镜和温文尔雅的举止,坐在带有鲜花、绿植的阳光家庭阳台环境中。

添加图片注释,不超过 140 字(可选)

可以看到prompt非常的神奇,这就是我们驱动法宝的“法诀”,它能够将修士的真意传给SD,然后转化为栩栩如生的图像。

也就是当下流传比较广的“法诀在手,天下我有”....

然而,

法诀却非万能的。修士们常常发现,即便使用了法诀,所绘之图却与心中所想相去甚远,甚至反复调整并尝试,结果依旧不尽人意。这是因为,AI所修炼的模型之中,尚未吸纳足够的知识库,以至于无法理解修士的真意。

若遇此困境,可以看看这个,机会难得,别错过。

除了上面基础接口外,官方宗门还提供了很多其它的接口,大家都可以尝试着调用

添加图片注释,不超过 140 字(可选)

自建webui                                                      

上面已经搭建好自己的Stable Diffusion,下面来直接使用一下:

添加图片注释,不超过 140 字(可选)

这是第一个由Stable Diffusion生成的图片,生成一只猫女。

不过这画质是相当的不错.....

换一换,法诀。如果说我不知道如何写法诀,怎么办?webui上收录了大量的法诀:

添加图片注释,不超过 140 字(可选)

然后,看看生成的效果

添加图片注释,不超过 140 字(可选)


目录
相关文章
|
2天前
|
调度 云计算 芯片
云超算技术跃进,阿里云牵头制定我国首个云超算国家标准
近日,由阿里云联合中国电子技术标准化研究院主导制定的首个云超算国家标准已完成报批,不久后将正式批准发布。标准规定了云超算服务涉及的云计算基础资源、资源管理、运行和调度等方面的技术要求,为云超算服务产品的设计、实现、应用和选型提供指导,为云超算在HPC应用和用户的大范围采用奠定了基础。
|
9天前
|
存储 运维 安全
云上金融量化策略回测方案与最佳实践
2024年11月29日,阿里云在上海举办金融量化策略回测Workshop,汇聚多位行业专家,围绕量化投资的最佳实践、数据隐私安全、量化策略回测方案等议题进行深入探讨。活动特别设计了动手实践环节,帮助参会者亲身体验阿里云产品功能,涵盖EHPC量化回测和Argo Workflows量化回测两大主题,旨在提升量化投研效率与安全性。
云上金融量化策略回测方案与最佳实践
|
11天前
|
人工智能 自然语言处理 前端开发
从0开始打造一款APP:前端+搭建本机服务,定制暖冬卫衣先到先得
通义灵码携手科技博主@玺哥超carry 打造全网第一个完整的、面向普通人的自然语言编程教程。完全使用 AI,再配合简单易懂的方法,只要你会打字,就能真正做出一个完整的应用。
8858 20
|
15天前
|
Cloud Native Apache 流计算
资料合集|Flink Forward Asia 2024 上海站
Apache Flink 年度技术盛会聚焦“回顾过去,展望未来”,涵盖流式湖仓、流批一体、Data+AI 等八大核心议题,近百家厂商参与,深入探讨前沿技术发展。小松鼠为大家整理了 FFA 2024 演讲 PPT ,可在线阅读和下载。
4767 12
资料合集|Flink Forward Asia 2024 上海站
|
15天前
|
自然语言处理 数据可视化 API
Qwen系列模型+GraphRAG/LightRAG/Kotaemon从0开始构建中医方剂大模型知识图谱问答
本文详细记录了作者在短时间内尝试构建中医药知识图谱的过程,涵盖了GraphRAG、LightRAG和Kotaemon三种图RAG架构的对比与应用。通过实际操作,作者不仅展示了如何利用这些工具构建知识图谱,还指出了每种工具的优势和局限性。尽管初步构建的知识图谱在数据处理、实体识别和关系抽取等方面存在不足,但为后续的优化和改进提供了宝贵的经验和方向。此外,文章强调了知识图谱构建不仅仅是技术问题,还需要深入整合领域知识和满足用户需求,体现了跨学科合作的重要性。
|
23天前
|
人工智能 自动驾驶 大数据
预告 | 阿里云邀您参加2024中国生成式AI大会上海站,马上报名
大会以“智能跃进 创造无限”为主题,设置主会场峰会、分会场研讨会及展览区,聚焦大模型、AI Infra等热点议题。阿里云智算集群产品解决方案负责人丛培岩将出席并发表《高性能智算集群设计思考与实践》主题演讲。观众报名现已开放。
|
11天前
|
人工智能 容器
三句话开发一个刮刮乐小游戏!暖ta一整个冬天!
本文介绍了如何利用千问开发一款情侣刮刮乐小游戏,通过三步简单指令实现从单个功能到整体框架,再到多端优化的过程,旨在为生活增添乐趣,促进情感交流。在线体验地址已提供,鼓励读者动手尝试,探索编程与AI结合的无限可能。
三句话开发一个刮刮乐小游戏!暖ta一整个冬天!
|
10天前
|
消息中间件 人工智能 运维
12月更文特别场——寻找用云高手,分享云&AI实践
我们寻找你,用云高手,欢迎分享你的真知灼见!
874 58

热门文章

最新文章