InstantStyle,无需训练,风格保留文生图

简介: InstantStyle 是一个通用框架,它采用两种简单但有效的技术来实现风格和内容与参考图像的有效分离。

1. 引言


InstantStyle 是一个通用框架,它采用两种简单但有效的技术来实现风格和内容与参考图像的有效分离。

image.png


将内容与图像分离。受益于 CLIP 全局特征的良好表征,从图像特征中减去内容文本特征后,可以显式地解耦样式和内容。

image.png


仅注入样式块:根据经验,深层网络的每一层都会捕获不同的语义信息,在工作中关键观察是存在两种特定的注意力层处理风格。具体来说,InstantStyle分别找到向上的blocks.0.attentions.1和向下的blocks.2.attentions.1捕捉风格(颜色、材质、氛围)和空间布局(结构、构图)。

image.png


下面是一些示例:

image.png

image.png


InstantStyle项目也登上了Github global Trending榜!恭喜项目组!

image.png


2. InstantStyle体验最佳实践


魔搭社区体验地址

风格迁移:

  image.png

image.png

prompt:a girl, masterpiece, best quality, high quality

image.png

image.png

prompt:a cat, masterpiece, best quality, high quality


风格迁移+controlnet

image.png

image.png

image.png

prompt:a Chinese girl, masterpiece, best quality, high quality


InstantStyle推理代码:

环境安装和模型下载:

!git clone https://github.com/InstantStyle/InstantStyle.git
%cd InstantStyle
!git clone https://www.modelscope.cn/AI-ModelScope/IP-Adapter.git
!mv IP-Adapter/models models
!mv IP-Adapter/sdxl_models sdxl_models


模型推理:


import torch
from diffusers import StableDiffusionXLPipeline
from modelscope import snapshot_download
from PIL import Image

from ip_adapter import IPAdapterXL

base_model_path = snapshot_download("AI-ModelScope/stable-diffusion-xl-base-1.0")
image_encoder_path = "sdxl_models/image_encoder"
ip_ckpt = "sdxl_models/ip-adapter_sdxl.bin"
device = "cuda"

# load SDXL pipeline
pipe = StableDiffusionXLPipeline.from_pretrained(
    base_model_path,
    torch_dtype=torch.float16,
    add_watermarker=False,
)

# reduce memory consumption
pipe.enable_vae_tiling()

# load ip-adapter
# target_blocks=["block"] for original IP-Adapter
# target_blocks=["up_blocks.0.attentions.1"] for style blocks only
# target_blocks = ["up_blocks.0.attentions.1", "down_blocks.2.attentions.1"] # for style+layout blocks
ip_model = IPAdapterXL(pipe, image_encoder_path, ip_ckpt, device, target_blocks=["up_blocks.0.attentions.1"])

image = "./assets/0.jpg"
image = Image.open(image)
image.resize((512, 512))

# generate image variations with only image prompt
images = ip_model.generate(pil_image=image,
                            prompt="a cat, masterpiece, best quality, high quality",
                            negative_prompt= "text, watermark, lowres, low quality, worst quality, deformed, glitch, low contrast, noisy, saturation, blurry",
                            scale=1.0,
                            guidance_scale=5,
                            num_samples=1,
                            num_inference_steps=30, 
                            seed=42,
                            #neg_content_prompt="a rabbit",
                            #neg_content_scale=0.5,
                          )

images[0].save("result.png")


WebUI-Demo搭建

clone创空间代码:

git clone https://www.modelscope.cn/studios/instantx/InstantStyle.git
cd InstantStyle
python app.py


前端web应用展现:

image.png


点击即可体验~


相关文章
|
人工智能 搜索推荐 物联网
InstantID:一张照片,无需训练,秒级个人写真生成
InstantID 是由InstantX项目组推出的一种SOTA的tuning-free方法,只需单个图像即可实现 ID 保留生成,并支持各种下游任务。
|
存储 人工智能 自然语言处理
Scepter Studio-万能图片生成工作台
一句“A cute girl”这样的提示词,到底在Scepter studio上可以生成多少张不同风格的图片?答案是:无限
|
4月前
|
人工智能 运维 数据可视化
OpenClaw是什么?OpenClaw能做什么?2026年阿里云OpenClaw(原Clawdbot/Moltbot)部署官方教程
在2026年AI Agent全面爆发的浪潮中,OpenClaw凭借“开源可控、本地优先、全场景适配”的核心优势,成为个人、新手开发者及轻量团队搭建专属AI助手的首选工具,其前身为备受关注的Clawdbot与Moltbot,历经品牌迭代后,于2026年正式统一命名为OpenClaw,核心功能一脉相承且全面升级,彻底打破了传统AI工具“只会说不会做”的局限,成为真正能替人干活的“数字员工”。
4130 6
|
11月前
|
存储 前端开发 Java
如何开发供应商管理系统中的询报价板块(附架构图+流程图+代码参考)
本文介绍了供应商管理系统中的询报价板块,涵盖创建询价需求、供应商报价、比价分析、核价等核心流程。通过系统化管理,企业可提升采购效率与透明度,优化供应商选择,降低采购成本。
|
6月前
|
人工智能 自然语言处理 数据可视化
数字展厅升级重点推荐方案:AI数字人+智慧大屏实现低成本高互动
传统展厅升级痛点多?AI数字人+智慧大屏方案来了!无需更换硬件,低成本快速部署,支持智能问答、多语种讲解、后台一键更新内容。适配政务、企业、文旅等多场景,提升互动体验与运营效率,助力展厅迈向“可对话、会思考”的智慧新时代。
532 0
|
机器学习/深度学习 搜索推荐 TensorFlow
使用Python实现深度学习模型:用户行为预测与个性化服务
【7月更文挑战第23天】 使用Python实现深度学习模型:用户行为预测与个性化服务
653 3
|
存储 Prometheus 并行计算
10倍性能提升-SLS Prometheus 时序存储技术演进
本文将介绍近期SLS Prometheus存储引擎的技术更新,在兼容 PromQL 的基础上实现 10 倍以上的性能提升。同时技术升级带来的成本红利也将回馈给使用SLS 时序引擎的上万内外部客户。
159207 7
|
机器学习/深度学习 分布式计算 供应链
Hadoop在特定行业中的应用实例
【8月更文第28天】Hadoop是一个强大的分布式计算框架,能够处理大规模数据集。由于其高可扩展性和成本效益,Hadoop被广泛应用于多个行业中,如金融、医疗保健和零售等。本文将探讨Hadoop在这些行业的具体应用场景和一些成功案例。
782 0

热门文章

最新文章