黑森林Kontext LoRA:多种新奇图像编辑新玩法!魔搭首发!附炼丹训练指南

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: 黑森林的Kontext 模型已经开源了一段时间,社区生态迅猛发展,Kontext LoRA已经层出不穷。就在今天,魔搭社区的开发者开源了4种全新的Kontext LoRA,blingbling的雕像风格、拿捏氛围感的图像美学提升神器...


♦引言

黑森林的Kontext 模型已经开源了一段时间,社区生态迅猛发展,Kontext LoRA已经层出不穷。就在今天,魔搭社区的开发者开源了4种全新的Kontext LoRA,blingbling的雕像风格、拿捏氛围感的图像美学提升神器...

本期文章,魔搭带你玩转这几个Kontext 的 LoRA,解锁新奇的图像编辑新玩法!

 

LoRA案例效果

image.gif 编辑

 

image.gif 编辑

 

image.gif 编辑

 

image.gif 编辑

 

玩法1:低分辨率图像的高清修复

模型链接

https://modelscope.cn/models/DiffSynth-Studio/FLUX.1-Kontext-dev-lora-highresfix

编辑指令:

Improve the clarity.

这个 LoRA 模型是使用大量高清图及其低分辨率版本训练而来的,可以大幅度提升图像的清晰度。例如下面这张图经过模型处理后,画面变得非常清晰。

image.gif 编辑

 

不过这还不是这个 LoRA 模型的全部功力,它在表情包处理上有奇效。例如,下面是一张经过多次转发导致出现“电子包浆”的表情包图片。使用这个 LoRA 模型,就可以发挥 Kontext 模型的图像编辑能力消除其中的噪声,让表情包重现生机。

image.gif 编辑

 

当图像内容出现模糊时,模型也可以自行发挥想象力,补充其中的细节。例如下面这张表情包,经过高清化处理之后,呈现出尴尬又不失魔性的笑容。

image.gif 编辑

 

 

玩法2:图像的局部编辑与外扩

模型链接

https://modelscope.cn/models/DiffSynth-Studio/FLUX.1-Kontext-dev-lora-SuperOutpainting

编辑指令:

Outpaint the image. + 英文图像描述(可选)

Kontext模型本身有一定图像外扩能力,但是对prompt和输入样例不稳定,可能导致非指定区域也被修改。因此,我们使用EliGen训练集构建了Kontext的图像外扩训练集,训练了这个LoRA模型,可以稳定地完成图像外扩,也可以泛化到图像重绘和局部编辑情形。

如下,给定部分区域缺失的图像,可以让模型直接进行图像重绘,绘出缺失部分。

image.gif 编辑

 

而如果待补全区域过大,则是图像外扩任务。如下的例子中,给定几朵花,模型可以绘制整个场景。

image.gif 编辑

 

图像外扩可以进一步用在拉远场景视角上,比如我们将上一个输出的场景图置于图的中央,并再执行一次外扩,可以得到更大视角的场景图。

image.gif 编辑

 

以下是人物场景下,连续进行两次图像外扩的例子。

image.gif 编辑

 

我们可以利用这个LoRA模型的图像外扩和局部编辑能力来做一下有意思的事情。比如我们可以进行经典表情包的局部替换,如下例所示,输入指令为:Outpaint the image. A chicken-headed man in suspenders is playing the basketball.

image.gif 编辑

 

可以看到 "Kuntext" 的出色生成效果。还可以进行热门表情包的组合,比如,先手动将表情包粘贴到一张图上,然后让模型进行重绘,如下例所示。

image.gif 编辑

 

进一步地,可以只保留原图的少部分内容,让模型自由发挥,比如下面两个例子,输入指令均为:Outpaint the image. A chicken-headed man in suspenders is playing the basketball with a white background.

image.gif 编辑

 

 

玩法3:图像的美学提升

模型链接

https://modelscope.cn/models/DiffSynth-Studio/FLUX.1-Kontext-dev-lora-ArtAug

编辑指令:

Enhance the aesthetic quality of this image.

Kontext 模型在训练过程中其实已经潜移默化地学习到了一定的图像理解能力,既然如此,模型就有理解什么是“美”的能力,经过训练后可以进一步激发其能力,用于提升图像的美感。例如这只小鸟的图片,模型可以增加环境细节,让画面看起来更协调。

image.gif 编辑

 

image.gif 编辑

 

当然,美学提升后的图片可以继续作为模型输入,从而进一步提升美学质量。上面的图像经过多次处理后,呈现出深邃的景深感。

下面这个例子也是类似的,经过多次美学提升后,画面中晚霞的光线更加柔美,四周也出现了姹紫嫣红的花朵。

image.gif 编辑

 

 

玩法4:风格变变变

模型链接:

https://modelscope.cn/models/DiffSynth-Studio/FLUX.1-Kontext-dev-lora-blingbling

编辑指令:

Transform into a glass sculpture.

这个 LoRA 可以端到端地实现风格迁移,把任何物体转化为玻璃雕像。这是一种特殊的风格,由于玻璃透明的特性,模型不仅要保持物体结构,还需要推理出背后的景物,并根据环境光照调整玻璃表面光线的反射和折射。但对于 Kontext 模型来说,这个任务稍经训练即可完成。我们来看几组例子:

image.gif 编辑

 

image.gif 编辑

 

此外,由于 FLUX 和 Kontext 模型的结构相似性,原本为 FLUX 训练的 LoRA 模型也可用于 Kontext 的风格迁移,下面是一些社区用户提供的例子。

视觉风格:抽象色块

模型链接:

https://modelscope.cn/models/cancel13/cxsk

编辑指令:

Translate the style into abstract color blocks.

 

image.gif 编辑

视觉风格:线条插画

模型链接:

https://modelscope.cn/models/Dyrice/F.1_InternetCommercialFlatPortraitIllustration

编辑指令:

Convert the visual style into line illustrations.

image.gif 编辑

 

 

在线图像编辑

以上提及的几个LoRA 模型可以直接在魔搭社区的 AIGC 专区进行生图体验。

在线生图地址:

https://modelscope.cn/aigc/imageGeneration?tab=advanced

 

LoRA推理与训练

本地部署推理和训练时,可使用开源项目 DiffSynth-Studio。

 

DiffSynth-Studio 本地部署推理

安装:

git clone https://github.com/modelscope/DiffSynth-Studio.git
cd DiffSynth-Studio
pip install -e .

image.gif

 

git clone https://github.com/modelscope/DiffSynth-Studio.git cd DiffSynth-Studio pip install -e .

推理:

import torch
from diffsynth.pipelines.flux_image_new import FluxImagePipeline, ModelConfig
from PIL import Image
from modelscope import snapshot_download
pipe = FluxImagePipeline.from_pretrained(
    torch_dtype=torch.bfloat16,
    device="cuda",
    model_configs=[
        ModelConfig(model_id="black-forest-labs/FLUX.1-Kontext-dev", origin_file_pattern="flux1-kontext-dev.safetensors"),
        ModelConfig(model_id="black-forest-labs/FLUX.1-dev", origin_file_pattern="text_encoder/model.safetensors"),
        ModelConfig(model_id="black-forest-labs/FLUX.1-dev", origin_file_pattern="text_encoder_2/"),
        ModelConfig(model_id="black-forest-labs/FLUX.1-dev", origin_file_pattern="ae.safetensors"),
    ],
)
pipe.load_lora(
    pipe.dit,
    ModelConfig(model_id="DiffSynth-Studio/FLUX.1-Kontext-dev-lora-highresfix", origin_file_pattern="model.safetensors")
)
image = Image.open("your_image.jpg")
image = pipe(
    prompt="Improve the clarity.",
    kontext_images=image,
    embedded_guidance=2.5,
    seed=0,
)
image.save("output.jpg")

image.gif

 

DiffSynth-Studio 训练

虽然 Kontext 的模型结构与 FLUX 一致,但作为一个图像编辑模型,其生成过程融入了额外的输入图像,因此训练算法也需要作出针对性的修改。DiffSynth-Studio 已经支持了 Kontext 原生编辑模式的训练。

 

image.gif 编辑

 

 

以上这些 LoRA 模型都是基于 DiffSynth-Studio 训练的,训练教程可参考往期文章:

FLUX.1 Kontext 的全生态教程来啦!AIGC专区在线试玩!DiffSynth框架、Com

或进入 DiffSynth-Studio 的开源项目页面查看。

DiffSynth-Studio地址:

https://github.com/modelscope/DiffSynth-Studio/tree/main/examples/flux

 

image.gif 编辑

 

 

点击链接,即可跳转模型链接~

https://modelscope.cn/models/DiffSynth-Studio/FLUX.1-Kontext-dev-lora-highresfix

目录
相关文章
|
2月前
|
编解码 物联网 开发者
FLUX.1 Kontext 的全生态教程来啦!AIGC专区在线试玩!
Flux.1 Kontext [dev] 开源模型大家都用上了吗?小编汇总了3个使用教程,打包送上!
1745 1
|
人工智能 搜索推荐 物联网
InstantID:一张照片,无需训练,秒级个人写真生成
InstantID 是由InstantX项目组推出的一种SOTA的tuning-free方法,只需单个图像即可实现 ID 保留生成,并支持各种下游任务。
|
2月前
|
人工智能 资源调度 数据可视化
ModelScope魔搭25年7月发布月报
七月流火,这个夏天火热的开场已然揭开。6月30号,我们在北京举办了首届魔搭开发者大会(ModelScope DevCon 2025),邀请了国内外知名的开源模型,以及头部开源工具的研发团队,与广大开发者共聚一堂进行分享。顶尖的AI 模型首次从线上 Hub走进线下盛会,为大家呈现了一场“模型全明星”盛会。同时我们还邀请了社区开发者参加我们的“搭友之夜”(aka 大规模面基大会)。大会分享场场爆满,现场只能用一句话来描述:“好~多~人~啊”,不提前占位根本挤不进去~~
210 3
wxid加好友工具插件,微信号wxid转换器, 在线wxid转微信号
本资源提供微信wxid相关技术源码及生成器高级用法示例,包括数据流处理、斐波那契数列生成和批处理生成器等功能。
|
3月前
|
编解码 自然语言处理 安全
📣通义大模型新成员Qwen-VLo,重磅上线,它实现了从“看懂”世界到“描绘”世界
通义千问团队推出全新多模态统一理解与生成模型Qwen VLo,具备强大的图像理解与生成能力。它不仅能“看懂”图像内容,还能基于理解进行高质量再创造,实现从感知到生成的跨越。支持开放指令编辑、多语言交互及复杂任务处理,适用于图像生成、风格迁移、检测标注等多种场景。
727 0
|
2月前
|
人工智能 缓存 自然语言处理
AI 编程如何在团队中真正落地?
如果你是技术负责人、团队推动者或希望在团队中引入 AI 编程工具的工程师,这篇文章将为你提供一条可借鉴、可落地、可优化的路径。
558 24
AI 编程如何在团队中真正落地?

热门文章

最新文章