来魔搭社区,探索超赞的SDXL 1.0画图功能!

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 来魔搭社区,探索超赞的SDXL 1.0画图功能!

导读

Stability AI团队近期发布开放模型SDXL 1.0,这是文本到图像生成模型的下一个迭代。继SDXL 0.9的有限、仅供研究发布之后,SDXL的完整版本是目前最好的开源图像生成模型。从Stability的Discord,我们了解到SDXL 的一些最令人兴奋的功能,包括:

  • 最高质量的文本到图像模型:SDXL 生成被盲测人员认为在各种风格、概念和类别中总体质量和美观性最佳的图像。与其他领先模型相比,SDXL 的整体质量显着提升。

  • 表达自由:一流的真实感,以及以几乎任何艺术风格生成高质量艺术作品的能力。独特的图像是在没有模特赋予任何特定“感觉”的情况下制作的,确保了风格的绝对自由。

  • 增强的智能:一流的能力,能够生成图像模型难以渲染的概念,例如手和文本,或空间排列的物体和人(例如,蓝色框顶部的红色框)更简单的提示 :与其他生成图像模型不同,SDXL 只需要几个单词即可创建复杂、详细且美观的图像。不再需要限定词段落。

  • 更准确:SDXL 中的提示不仅简单,而且更符合提示的意图。SDXL 改进的 CLIP 模型可以非常有效地理解文本。这种准确性允许我们做更多的工作来直接从文本中获得完美的图像,甚至在使用稳定扩散闻名的更高级功能或微调之前也是如此。
  • 稳定扩散的所有灵活性:SDXL 专为复杂的图像设计工作流程而设计,包括生成文本或基础图像、修复(使用蒙版)、修复等。SDXL 还可以针对概念进行微调并与controlnet一起使用。其中一些功能将由 Stability 即将发布。

魔搭社区也第一时间进行了适配,大家可以在魔搭notebook上使用免费GPU资源来体验,先上一张社区体验官的“卖家秀”,大家看看效果可还行 →_→

image.png

【promts】Beautiful and cute girl, 16 years old, denim jacket, gradient background, soft colors, soft lighting, cinematic edge lighting, light and dark contrast, anime, art station Seraflur, blind box, super detail, 8k

环境配置与安装

本文在ModelScope的Notebook的免费环境(PAI-DSW)配置下运行(可单卡运行,推理显存15G)

服务器连接与环境准备

1、进入ModelScope首页:modelscope.cn,进入我的Notebook

image.png

2、选择GPU环境

image.png

3、进入Terminal,先查看一下GPU的使用情况

image.png

使用SDXL 1.0, ModelScope需要升级到github上最新的master版本(预计8月1号发布版本),进入Notebook的Terminal环境,更新ModelScope版本,并升级依赖:

git clone https://github.com/modelscope/modelscope.git
cd modelscope
pip install .
pip install invisible_watermark safetensors
pip install diffusers==0.18.0

模型链接及下载

stable-diffusion-xl-base-1.0

模型链接:https://modelscope.cn/models/AI-ModelScope/stable-diffusion-xl-base-1.0/summary

使用notebook进行模型weights下载(飞一样的速度,可以达到百兆每秒):

from modelscope.hub.snapshot_download import snapshot_download
model_dir = snapshot_download('AI-ModelScope/stable-diffusion-xl-base-1.0', revision='v1.0.0')

模型推理

版本更新前,需要在Notebook的Terminal里面执行

from modelscope.utils.constant import Tasks
from modelscope.pipelines import pipeline
import cv2
pipe = pipeline(task=Tasks.text_to_image_synthesis, 
                model='AI-ModelScope/stable-diffusion-xl-base-1.0',
                use_safetensors=True,
                model_revision='v1.0.0')
prompt = 'Beautiful and cute girl, 16 years old, denim jacket, gradient background, soft colors, soft lighting, cinematic edge lighting, light and dark contrast, anime, art station Seraflur, blind box, super detail, 8k'
output = pipe({'text': prompt})
cv2.imwrite('result.png', output['output_imgs'][0])

推理运行显存:15G

image.png

效果体验

Prompt:best quality, Chinese landscape, rich details, high resolution, masterpiece

image.png

Prompt:stars in the eyes, colored hair, Starry sky adorns hair, (lots of big colorful Bubble), (pearl), (Galaxy), depth of field

image.png

Prompt:A portrait of a bipedal cat wearing 19th century men's clothing

image.png

Prompt:Hubble ultra deep field sky, moonlit hills, glowing creek babbling brook, ultra high detail, high resolution, 8k, HDR

Prompt:A dog is playing with a ball.

image.png

相关文章
|
8月前
|
人工智能
【奶奶看了都会】ComfyUI+SVD制作AI视频教程,附效果演示
AI一天,人间一年。大家好啊,我是小卷,最近AI绘画又发展出一些新玩意了,小卷因为工作的关系有一个月没关注AI的发展了,都有点跟不上版本节奏了。。。
641 2
【奶奶看了都会】ComfyUI+SVD制作AI视频教程,附效果演示
|
8月前
|
机器学习/深度学习 人工智能 搜索推荐
小红书开源「InstantID」,2024第一个爆火的Al写真项目,惊艳了!
小红书开源「InstantID」,2024第一个爆火的Al写真项目,惊艳了!
308 0
|
15天前
|
编解码 人工智能 自然语言处理
OpenAI Sora 怎么用:最新详细教程-新手小白必看 | Sora 如何使用?(202412月最新更新)
OpenAI的Sora模型现已正式开放使用,本文将详细介绍Sora的注册、使用方法及视频生成技巧。Sora能根据简洁文本生成长达60秒的高质量视频,具备远超以往模型的时间连续性和视觉效果。文章涵盖从零开始的准备工作、操作界面介绍、视频生成设置、编辑功能(如Re-cut、Remix、Blend、Loop)以及Storyboard故事板功能,帮助新手轻松上手世界顶级AI视频创作工具。此外,还解答了关于Sora的常见问题,包括订阅计划、视频类型和局限性等,适合全媒体创作者参考。
86 3
OpenAI Sora 怎么用:最新详细教程-新手小白必看 | Sora 如何使用?(202412月最新更新)
|
5月前
|
传感器 人工智能 JSON
多图、视频首上端!面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!魔搭推理、微调、部署实战教程来啦!
该模型基于 SigLip-400M 和 Qwen2-7B 构建,仅 8B 参数,取得 20B 以下单图、多图、视频理解 3 SOTA 成绩,一举将端侧AI多模态能力拉升至全面对标 GPT-4V 水平。
|
8月前
|
数据可视化 物联网 测试技术
零一万物Yi-1.5系列模型发布并开源!34B/9B/6B 多尺寸魔搭社区推理微调最佳实践教程来啦!
Yi-1.5是Yi的升级版本。 它使用 500B tokens的高质量语料库在 Yi 上持续进行预训练,并在 3M 个多样化的微调样本上进行微调。
|
自然语言处理 测试技术 编译器
社区供稿 | 姜子牙大模型开源代码大模型Ziya-Coding-34B-v1.0 再创榜单新高,魔搭开源可体验!
使用自然语言生成高质量的代码是大模型落地中的高频需求。近日,IDEA研究院封神榜团队正式开源最新的代码大模型Ziya-Coding-34B-v1.0,我们在HumanEval Pass@1的评测上,取得了75.5的好成绩,超过了GPT-4(67.0)的得分,也成为目前已知开源模型新高。
|
8月前
|
人工智能 机器人 Linux
超级炫酷的AI绘图工具—MidJourney入门使用教程
超级炫酷的AI绘图工具—MidJourney入门使用教程
|
8月前
|
人工智能
MidJourney以图生图的详细教程(含6种案例介绍)(下)
MidJourney以图生图的详细教程(含6种案例介绍)
|
8月前
|
人工智能
MidJourney以图生图的详细教程(含6种案例介绍)(上)
MidJourney以图生图的详细教程(含6种案例介绍)
|
人工智能

热门文章

最新文章