ColorFlow：腾讯和清华大学联合推出的图像序列着色模型，通过参考图像的颜色对黑白漫画进行着色生成彩色漫画

2024-12-18 8

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

视觉智能开放平台，视频资源包5000点

视觉智能开放平台，分割抠图1万点

视觉智能开放平台，图像资源包5000点

简介： ColorFlow是由清华大学和腾讯ARC实验室共同推出的图像序列着色模型，通过检索增强、上下文学习和超分辨率技术，确保黑白图像序列的着色与参考图像颜色一致，适用于漫画、动画制作等工业应用。

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发非常感兴趣，我会每日跟你分享最新的 AI 资讯和开源应用，也会不定期分享自己的想法和开源实例，欢迎关注我哦！

🥦 微信公众号｜搜一搜：蚝油菜花 🥦

🚀 快速阅读

正文（附运行示例）

公众号: 蚝油菜花 - ColorFlow

ColorFlow是清华大学和腾讯ARC实验室共同推出的图像序列着色模型，能够精细化地保持图像序列中个体身份的同时进行着色。该模型基于检索增强、上下文学习和超分辨率技术，确保黑白图像序列的着色与参考图像颜色一致，适用于漫画、动画制作等工业应用。

ColorFlow在图像序列着色领域展现了超越现有技术的卓越性能，通过提升CLIP-IS、降低FID、增加PSNR和SSIM得分及提高AS，为艺术行业提供了新的着色标准。

检索增强管道（Retrieval-Augmented Pipeline, RAP）：从参考图像池中提取与输入黑白图像最相关的彩色图像块，指导着色过程。
上下文着色管道（In-context Colorization Pipeline, ICP）：基于强大的上下文学习来准确检索颜色身份，采用双分支设计进行着色。
引导超分辨率管道（Guided Super-Resolution Pipeline, GSRP）：上采样低分辨率的着色输出，产生高分辨率的彩色图像，增强细节恢复并提高输出质量。

检索增强（Retrieval-Augmented）：基于预训练的CLIP图像编码器生成输入图像和参考图像的嵌入，计算余弦相似度识别最相似的参考图像块，用于后续的着色训练。
上下文着色（In-context Colorization）：引入辅助分支“Colorization Guider”整合条件信息，基于U-Net扩散模型逐步整合特征，实现像素级的条件嵌入。使用轻量级LoRA方法对预训练的扩散模型进行微调，保留其着色能力。
超分辨率增强（Super-Resolution）：处理着色过程中的下采样问题，减少结构失真。将高分辨率黑白图像与低分辨率彩色输出结合，增强细节恢复，提升输出质量。
自我注意力机制（Self-Attention）：在扩散模型中使用自我注意力机制，将参考图像和灰度图像放在同一个画布上，提取特征，逐层输入到扩散模型中进行着色。
时间步采样策略（Timestep Shifted Sampling）：调整采样策略，强调在更高时间步长上的采样，增强着色过程的效果。
屏幕风格增强（Screenstyle Augmentation）：对灰度图像和ScreenVAE输出进行随机线性插值，增强输入图像的风格适应性，提升着色性能。

克隆仓库：

git clone https://github.com/TencentARC/ColorFlow
cd ColorFlow

设置Python环境：

conda create -n colorflow python=3.8.5
conda activate colorflow
pip install -r requirements.txt

运行应用：
```
python app.py
```
在浏览器中访问：
打开浏览器并访问 http://localhost:7860。如果是在远程服务器上运行，请将 localhost 替换为服务器的IP地址或域名。

🥦 微信公众号｜搜一搜：蚝油菜花 🥦