MimicBrush：奇迹画刷，重新定义局部重绘

2024-06-24 226

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 图像编辑是一项实用而又具有挑战性的任务，因为用户的需求多种多样，其中最困难的部分之一是准确描述编辑后的图像应该是什么样子。在MimicBrush这项工作中，提出了一种新的编辑形式，称为模仿编辑，以帮助用户更方便地发挥创造力。

引言

图像编辑是一项实用而又具有挑战性的任务，因为用户的需求多种多样，其中最困难的部分之一是准确描述编辑后的图像应该是什么样子。在MimicBrush这项工作中，提出了一种新的编辑形式，称为模仿编辑，以帮助用户更方便地发挥创造力。具体来说，为了编辑感兴趣的图像区域，用户可以自由地直接从一些自然参考（例如，一些在线遇到的相关图片）中汲取灵感，而不必处理参考和源之间的契合。这样的设计要求系统自动找出对参考的期望以执行编辑。为此，提出了一个生成训练框架，称为 MimicBrush，它从视频剪辑中随机选择两帧，屏蔽一帧的某些区域，并学习使用另一帧的信息恢复被屏蔽的区域。这样，模型（从扩散先验发展而来）能够以自监督的方式捕捉单独图像之间的语义对应关系。项目组通过实验证明了我们的方法在各种测试用例下的有效性以及它相对于现有替代方案的优越性，还构建了一个基准以促进进一步的研究。

上图是MimicBrush 的训练过程。首先，从视频序列中随机采样两帧作为参考和源图像。然后对源图像进行mask处理并通过数据增强进行增强。之后，将源图像的noisy image latent, mask, background latent, and depth latent输入到模拟 U-Net 中。参考图像也经过增强并发送到参考 U-Net。对双 U-Net 进行训练以恢复源图像的mask区域。参考 U-Net 的attention key和value与模拟 U-Net 连接起来，以协助合成mask区域。

下面，我们从一个视频详细了解下MimicBrush吧！

模型和WebUI代码现已在魔搭社区开源并可体验！

模型链接：https://modelscope.cn/models/xichen/MimicBrush

论文链接：https://arxiv.org/abs/2406.07547

Github地址：https://github.com/ali-vilab/MimicBrush?tab=readme-ov-file

体验地址：

PC端：https://modelscope.cn/studios/iic/mimicbrush-demo

魔搭社区WebUI最佳实践

模型体验

第一步：上传选择要编辑的源图像

第二步：在源图像上绘制要编辑的区域。

第三步：上传/选择参考图像

第四步：生成图片！

模型下载

#模型下载
from modelscope import snapshot_download
model_dir = snapshot_download('xichen/MimicBrush')

搭建运行WebUI

使用魔搭免费算力Notebook体验简单WebUI

打开Terminal

运行代码

pip install gradio
git clone https://www.modelscope.cn/studios/iic/mimicbrush-demo.git
cd mimicbrush-demo
python app.py

就可以体验您搭建的个人WebUI页面啦！

更多MimicBrush技术解析，欢迎预约6.26（周三）20：00-21：30直播

MimicBrush：奇迹画刷，重新定义局部重绘

引言

魔搭社区WebUI最佳实践

模型下载

搭建运行WebUI

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

直播

下载

镜像站

技术资料

MimicBrush：奇迹画刷，重新定义局部重绘

引言

魔搭社区WebUI最佳实践

模型下载

搭建运行WebUI

热门文章

最新文章

相关电子书