Stable Diffusion 3.0 :一键开启你的AI绘画之旅

简介: 本文介绍了Stable Diffusion 3.0的主要优化,包括采用DiT架构提升多对象生成能力及“流匹配”技术加速采样。同时解决了部署复杂、显卡需求高等问题,可通过阿里云计算巢一键部署,实现即开即用。文章展示了人像、动漫风、科幻风等生成效果,并提供中文菜单设置与插件下载教程。无论是专业设计师还是普通用户,都能轻松开启智能创作新时代。 Flux模型支持即将上线,值得期待。

引言

距离Stable Diffusion 3.0 已经正式发布了一段时间,该模型能生成照片般细节逼真、色彩鲜艳、光照自然的图像;那么主要有什么优化呢?

1. 把U-Net丢进垃圾桶这次SD3直接把传统U-Net架构丢进回收站,换上与Sora师出同门的DiT架构(扩散版变形金刚)。这货能把图片切成"乐高积木"式潜在块,再用自注意力机制玩全局拼图游戏。实测单句提示词能塞进12个对象还不乱套,堪称"甲方の噩梦终结者"——"蓝色立方体顶红色球体,左边猫右边狗背后绿三角"这种反人类需求也能精准生成

2. 快递式路径优化传统扩散模型像山路十八弯的快递路线,SD3直接上"流匹配"技术给路径拉直成高速公路。采样速度飙升300%,RTX4090上1.2秒出4K图,比甲方改需求的速度还快。更绝的是引入Rectified Flow修正流,少步采样也能出DALL·E 3级画质,低配设备狂喜

虽然SD3更强了,但是如何畅玩SD3 + WebUI仍然是一个难倒小白的问题。比如:

  1. 本机部署搞定环境就很麻烦
  2. 吃本机显卡配置
  3. 在线生成图平台无法自由换模型。更不用说使用限制级模型了。
  4. 做不到即开即用,配置还很好。

咱们先不聊怎么解决这些问题,先来看看我通过阿里云计算巢平台通过SD3+Lora微调能达到什么效果。

实战效果

人像生成方面

参考Prompt:

Frontal photography,Look front,evening,dark clouds,1girl,happy,(smile:0.6),full body,gyaru,black hair,long hair,coat, jacket,denim_shorts,midriff,sleeveless,
dark theme,dark background,muted tones,pastel colors,high contrast,(natural skin texture, A dim light, high clarity) ((sky background))((Facial highlights)),highlight,flash, <lora:polaroid:0.5>

SD3做到了:

  • 毛孔级皮肤纹理重建
  • 物理精确的光线追踪模拟
  • 多图层景深控制

动漫风

参考Prompt

(Masterpiece), persimmon branches, cat, simple background

科幻风

参考prompt

(masterpiece:1.3),best quality,(official art:1.3),(A future mechanical car:1.2),Facing the lens,On urban streets,Surrounded by urban buildings,(Light rain:1.3),The background is starry sky,(Stage smoke:1.1),A dark and mysterious atmosphere,surrounded by light signs,neon lights,large screen,rich details,(the whole body:1.3),light strips,reflective materials,glass,cyberpunk std,c4d,8K,a sci-fi city with mushrooms as the main element

一键部署

看了这么多令人兴奋作品,小白肯定已经饥渴难耐了,肯定想问有没有部署在云上即开即用,显卡又好的使用方式呢?

有的,兄弟有的。

我平时绘画是直接在阿里云计算巢部署的。

  1. 单击部署链接,进入服务实例部署界面,根据界面提示,填写参数
  2. 根据提示填写参数。推荐去新加坡部署,这样最新发布的模型和插件可以直接自己下载使用到。

  3. 通过安全代理访问WebUI服务。
  4. 开始爽玩吧。

设置中文菜单

  1. 选择"setting"且左侧选择User Interface
  2. 再次选择User Interface并点击。
  3. 安装图示的三个操作,设置为中文

下载插件

** 重要** :如果您的机器如果不是海外机器,请采用Github镜像网站的下载链接,避免因被墙导致插件安装失败。

  1. 在如图所示菜单处下载插件。

结语无论是专业设计师还是普通创作者,现在均可通过这一平台将想象力直接转化为媲美专业级的生产力输出。赶快开启属于您的智能创作新时代!

我们即将支持Flux模型,敬请期待!!!


更多有意思,又好玩又有深度的服务,请访问计算巢网址

相关文章
|
2月前
|
人工智能 编解码 芯片
【AI绘画】你有多久没有打开SD了?
曾几何时,Stable Diffusion的复杂参数令人崩溃,如今即梦、可灵等AI工具已让生成图片变得轻而易举。哩布哩布发布2.0升级公告,看似迈向更易用的未来,却也悄然为那个钻研模型、拼接工作流的“拓荒时代”奏响终章。技术迭代飞快,但那份对创造的热爱与探索精神,永不褪色。
660 9
|
10月前
|
人工智能 Linux API
Omnitool:开发者桌面革命!开源神器一键整合ChatGPT+Stable Diffusion等主流AI平台,本地运行不联网
Omnitool 是一款开源的 AI 桌面环境,支持本地运行,提供统一交互界面,快速接入 OpenAI、Stable Diffusion、Hugging Face 等主流 AI 平台,具备高度扩展性。
1038 94
Omnitool:开发者桌面革命!开源神器一键整合ChatGPT+Stable Diffusion等主流AI平台,本地运行不联网
|
机器学习/深度学习 人工智能 自然语言处理
Sketch2Lineart:AI绘画工具,自动将手绘草图转换成清晰的线条画
Sketch2Lineart是一款基于人工智能的绘画工具,能够自动将手绘草图转换成清晰的线条画。该工具支持多种功能,如草图转线稿、自动描述生成、细节调整和风格定制等,适用于艺术创作、产品设计、教育培训等多个领域。
1086 60
Sketch2Lineart:AI绘画工具,自动将手绘草图转换成清晰的线条画
|
11月前
|
人工智能
🎨 设计师必备!AI Stable Diffusion 提示词神器,让你秒变创意大师!
AI绘图新时代来临,设计师必备工具——**白盒子AI绘图提示词生成器**助你轻松跨越提示词难题。该工具操作简便,支持中英文切换,涵盖近1000个精选提示词,适用于各种风格创作。无论是新手还是专业设计师,都能大幅提升工作效率,快速实现创意构想。网址:[https://www.baihezi.com/ai-painting-prompt](https://www.baihezi.com/ai-painting-prompt)
711 19
🎨  设计师必备!AI Stable Diffusion 提示词神器,让你秒变创意大师!
|
11月前
|
人工智能 UED
VersaGen:生成式 AI 代理,基于 Stable Diffusion 生成图像,专注于控制一至多个视觉主体等生成细节
VersaGen 是一款生成式 AI 代理,专注于文本到图像合成中的视觉控制能力,支持多种视觉控制类型,并通过优化策略提升图像生成质量和用户体验。
230 8
VersaGen:生成式 AI 代理,基于 Stable Diffusion 生成图像,专注于控制一至多个视觉主体等生成细节
|
11月前
|
人工智能 数据安全/隐私保护 图形学
关于AI绘画优雅草央千澈整理的一份咒语(与AI对话提示词-应用于AI绘图和AI生成视频)-本文长期更新-本次更新2025年1月15日更新-长期更新建议点赞收藏
关于AI绘画优雅草央千澈整理的一份咒语(与AI对话提示词-应用于AI绘图和AI生成视频)-本文长期更新-本次更新2025年1月15日更新-长期更新建议点赞收藏
697 4
|
11月前
|
人工智能 弹性计算 自然语言处理
云端问道 6 期实践教学-创意加速器:AI 绘画创作
本文介绍了在阿里云平台上一键部署Demo应用的步骤。部署完成后,通过公网地址体验Demo应用,包括文本生成图像等功能。
279 10
|
11月前
|
存储 人工智能 弹性计算
云端问道6期方案教学-创意加速器:AI 绘画创作
本文整理自绍懿老师在云端问道第6期关于“创意加速器:AI绘画创作”的分享,主要介绍阿里云通义万相大模型的应用。内容涵盖七大部分:有趣的应用场景、通义万相简介、使用方法、优势特点、典型案例(如电商和营销场景)、收费标准及实操部署。通过这些内容,用户可以快速了解如何利用通义万相实现文字生成图片、图像编辑等功能,并应用于实际业务中,提升效率与创造力。
276 1
|
12月前
|
人工智能 程序员 Linux
神秘山洞惊现AI绘画至宝Stable Diffusion残卷
随着AI神器的现世,不少修士担忧其会取代人类职业。然而,自女娲创造人类以来,法宝虽强,始终只是辅助工具,需修士操控才能发挥威力。如今修仙界最大的至宝是GPT,它能以文字为引,转化出所需答案。图片处理方面也有Stable Diffusion、DALL-E等法宝。这些AI工具并非替代修士,而是提升效率的助手。例如,Stable Diffusion最初由慕尼黑和海德堡大学宗师炼制,现已发展多个版本,如v1、v2.0、SDXL等,帮助修士更便捷地生成图像。通过合理使用这些工具,修士们可以更好地实现心中所想,而非被技术取代。
271 6

热门文章

最新文章