来魔搭社区,探索超赞的SDXL 1.0画图功能!

简介: 来魔搭社区,探索超赞的SDXL 1.0画图功能!

导读

Stability AI团队近期发布开放模型SDXL 1.0,这是文本到图像生成模型的下一个迭代。继SDXL 0.9的有限、仅供研究发布之后,SDXL的完整版本是目前最好的开源图像生成模型。从Stability的Discord,我们了解到SDXL 的一些最令人兴奋的功能,包括:

  • 最高质量的文本到图像模型:SDXL 生成被盲测人员认为在各种风格、概念和类别中总体质量和美观性最佳的图像。与其他领先模型相比,SDXL 的整体质量显着提升。

  • 表达自由:一流的真实感,以及以几乎任何艺术风格生成高质量艺术作品的能力。独特的图像是在没有模特赋予任何特定“感觉”的情况下制作的,确保了风格的绝对自由。

  • 增强的智能:一流的能力,能够生成图像模型难以渲染的概念,例如手和文本,或空间排列的物体和人(例如,蓝色框顶部的红色框)更简单的提示 :与其他生成图像模型不同,SDXL 只需要几个单词即可创建复杂、详细且美观的图像。不再需要限定词段落。

  • 更准确:SDXL 中的提示不仅简单,而且更符合提示的意图。SDXL 改进的 CLIP 模型可以非常有效地理解文本。这种准确性允许我们做更多的工作来直接从文本中获得完美的图像,甚至在使用稳定扩散闻名的更高级功能或微调之前也是如此。
  • 稳定扩散的所有灵活性:SDXL 专为复杂的图像设计工作流程而设计,包括生成文本或基础图像、修复(使用蒙版)、修复等。SDXL 还可以针对概念进行微调并与controlnet一起使用。其中一些功能将由 Stability 即将发布。

魔搭社区也第一时间进行了适配,大家可以在魔搭notebook上使用免费GPU资源来体验,先上一张社区体验官的“卖家秀”,大家看看效果可还行 →_→

image.png

【promts】Beautiful and cute girl, 16 years old, denim jacket, gradient background, soft colors, soft lighting, cinematic edge lighting, light and dark contrast, anime, art station Seraflur, blind box, super detail, 8k

环境配置与安装

本文在ModelScope的Notebook的免费环境(PAI-DSW)配置下运行(可单卡运行,推理显存15G)

服务器连接与环境准备

1、进入ModelScope首页:modelscope.cn,进入我的Notebook

image.png

2、选择GPU环境

image.png

3、进入Terminal,先查看一下GPU的使用情况

image.png

使用SDXL 1.0, ModelScope需要升级到github上最新的master版本(预计8月1号发布版本),进入Notebook的Terminal环境,更新ModelScope版本,并升级依赖:

git clone https://github.com/modelscope/modelscope.git
cd modelscope
pip install .
pip install invisible_watermark safetensors
pip install diffusers==0.18.0

模型链接及下载

stable-diffusion-xl-base-1.0

模型链接:https://modelscope.cn/models/AI-ModelScope/stable-diffusion-xl-base-1.0/summary

使用notebook进行模型weights下载(飞一样的速度,可以达到百兆每秒):

from modelscope.hub.snapshot_download import snapshot_download
model_dir = snapshot_download('AI-ModelScope/stable-diffusion-xl-base-1.0', revision='v1.0.0')

模型推理

版本更新前,需要在Notebook的Terminal里面执行

from modelscope.utils.constant import Tasks
from modelscope.pipelines import pipeline
import cv2
pipe = pipeline(task=Tasks.text_to_image_synthesis, 
                model='AI-ModelScope/stable-diffusion-xl-base-1.0',
                use_safetensors=True,
                model_revision='v1.0.0')
prompt = 'Beautiful and cute girl, 16 years old, denim jacket, gradient background, soft colors, soft lighting, cinematic edge lighting, light and dark contrast, anime, art station Seraflur, blind box, super detail, 8k'
output = pipe({'text': prompt})
cv2.imwrite('result.png', output['output_imgs'][0])

推理运行显存:15G

image.png

效果体验

Prompt:best quality, Chinese landscape, rich details, high resolution, masterpiece

image.png

Prompt:stars in the eyes, colored hair, Starry sky adorns hair, (lots of big colorful Bubble), (pearl), (Galaxy), depth of field

image.png

Prompt:A portrait of a bipedal cat wearing 19th century men's clothing

image.png

Prompt:Hubble ultra deep field sky, moonlit hills, glowing creek babbling brook, ultra high detail, high resolution, 8k, HDR

Prompt:A dog is playing with a ball.

image.png

相关文章
|
算法 JavaScript 大数据
高德地图 错误码说明 对照表
序号  infocode info返回值 状态描述 问题排查策略 1 10000 OK 请求正常 请求正常 2 10001 INVALID_USER_KEY key不正确或过期 开发者发起请求时,传入的key不正确或者过期  3 10002 SERVICE_NOT_AVAILABLE 没有权限使用相应的服务或者请求接口的路径拼写错误 1.开发者没有权限使用相应的服务,例如:开发者申请了WEB定位功能的key,却使用该key访问逆地理编码功能时,就会返回该错误。反之亦然。2.开发者请求接口的路径拼写错误。例如:正确的https://restapi.amap.com/v3/ip在程序中被拼装写了h
4452 0
|
12月前
|
机器学习/深度学习 人工智能 编解码
Lumina-Image 2.0:上海 AI Lab 开源的统一图像生成模型,支持生成多分辨率、多风格的图像
Lumina-Image 2.0 是上海 AI Lab 开源的高效统一图像生成模型,参数量为26亿,基于扩散模型和Transformer架构,支持多种推理求解器,能生成高质量、多风格的图像。
1068 17
Lumina-Image 2.0:上海 AI Lab 开源的统一图像生成模型,支持生成多分辨率、多风格的图像
|
3月前
|
人工智能 数据可视化 前端开发
震惊,Github开源,真正让程序员效率提升 90%的AI辅助工具来啦!!!
Claude Code Viewer 是一款开源浏览器工具,将 Claude Code 的终端日志可视化,支持会话管理、Git Diff 查看、文件预览与定时任务,实现远程交互与多项目导航,提升 AI 编程效率。
814 0
条件构造器,MybatisPlus支持各种复杂的where条件,其实就是Wrapper,eq是等于的意思,相当于等于那个数值,ne就是不等于,gt大于的意思,ge大于等于,QueryWrapper是做
条件构造器,MybatisPlus支持各种复杂的where条件,其实就是Wrapper,eq是等于的意思,相当于等于那个数值,ne就是不等于,gt大于的意思,ge大于等于,QueryWrapper是做
|
消息中间件 关系型数据库 MySQL
Flink CDC 在阿里云实时计算Flink版的云上实践
本文整理自阿里云高级开发工程师阮航在Flink Forward Asia 2024的分享,重点介绍了Flink CDC与实时计算Flink的集成、CDC YAML的核心功能及应用场景。主要内容包括:Flink CDC的发展及其在流批数据处理中的作用;CDC YAML支持的同步链路、Transform和Route功能、丰富的监控指标;典型应用场景如整库同步、Binlog原始数据同步、分库分表同步等;并通过两个Demo展示了MySQL整库同步到Paimon和Binlog同步到Kafka的过程。最后,介绍了未来规划,如脏数据处理、数据限流及扩展数据源支持。
808 0
Flink CDC 在阿里云实时计算Flink版的云上实践
|
JSON Java 定位技术
【Android App】GPS获取定位经纬度和根据经纬度获取详细地址讲解及实战(附源码和演示 超详细)
【Android App】GPS获取定位经纬度和根据经纬度获取详细地址讲解及实战(附源码和演示 超详细)
5554 1
|
区块链 Python
9-18|图片上生成字体设置字体大小
9-18|图片上生成字体设置字体大小
|
安全 API 调度
HarmonyOS学习路之开发篇—流转
随着全场景多设备生活方式的不断深入,用户拥有的设备越来越多,每个设备都能在适合的场景下提供良好的体验,例如:手表可以提供及时的信息查看能力,电视可以带来沉浸的观影体验。但是,每个设备也有使用场景的局限,例如:在电视上输入文本相对手机来说是非常糟糕的体验。当多个设备通过分布式操作系统能够相互感知、进而整合成一个超级终端时,设备与设备之间就可以取长补短、相互帮助,为用户提供更加自然流畅的分布式体验。
|
Linux
Realtek 网卡 支持RK vendor mac地址写入
Realtek 网卡 支持RK vendor mac地址写入
609 4