GitHub 1.3k 一款能“填色回忆”的神器:DDColor 让老照片鲜活又逼真

简介: DDColor 是阿里达摩院推出的图像自动着色模型,采用双解码器架构与 Colorfulness Loss 技术,实现黑白图到高保真彩色图的智能转换。支持 GPU/CPU 推理,兼容历史照片、动画、游戏截图等多场景,具备高效、真实、多样、易用等特点,广泛适用于影像修复、艺术创作等领域。

嗨,我是小华同学,专注解锁高效工作与前沿AI工具!每日精选开源技术、实战技巧,助你省时50%、领先他人一步。👉免费订阅,与10万+技术人共享升级秘籍!

image.png


DDColor 是如何通过双解码器技术,把黑白老照片和动画场景一键还原成色彩饱满、细节清晰的彩色图像?

项目简介

DDColor: Towards Photo‑Realistic Image Colorization via Dual Decoders 作者:Xiaoyang Kang 等,DAMO Academy(阿里达摩院) ICCV 2023 论文实现|公开PyTorch代码与预训练模型

DDColor 是阿里达摩院团队提出的新一代图像自动着色模型,基于“像素解码器 + 颜色查询解码器”双重设计,实现高保真、真实感强的黑白图转彩色图,兼容历史照片与二次元游戏风格图,创造“还原真实”的视觉奇迹。

痛点与场景

  • 黑白历史照:老照片缺色但蕴含高历史价值,传统着色容易失真、色彩偏差剧烈。
  • 动画或游戏截图:如《原神》风格清淡,不够自然。
  • 自动化需求强:手动上色耗时费力且效果不统一,在线或本地批量需求大。
  • 期望效果:需要真实的颜色、细节清晰、色彩丰富、自动可靠。

配合 GPU 或在线 Demo,几秒钟就能完成令人惊喜的色彩重塑。

核心功能亮点

  1. 双解码器架构
  • 像素解码器负责恢复图像空间结构;
  • 颜色查询解码器通过多尺度语义特征调色,协同避免色彩偏差。
  1. Colorfulness Loss:增加颜色丰富度,让输出饱满、生动。
  2. 多领域适配
  • 历史照片着色效果真实,细节还原力强;
  • 可将游戏或动画风格图转为写实风,场景更贴近现实。
  1. 预训练网络多样化:提供 tiny、paper、modelscope、artistic 四套模型,满足不同效果需求。
  2. 多出口平台支持
  • 本地 PyTorch 脚本推理;
  • ModelScope、Replicate 在线 Demo 接口;
  • Hugging Face Hub 模型调用。
  1. 多硬件兼容:支持 CUDA GPU 本地部署,也有 ONNX 优化,可在 CPU 上跑!
  2. 高性价比在线成本:Replicate 调用成本约 ,次才1。

技术架构

优势对比(区别于单解码模型或传统 CNN)

维度 传统 CNN Transformer 着色 DDColor 双解码器
色彩还原 容易失真、偏色 更好但复杂 语义结合色调,色彩更准确
多样性 效果模板化 效果较好 上色更加丰富、饱满
通用性 特殊场景需微调 通用但推理慢 四档预训练+在线接口即用
推理速度 较慢 ~1s/图,成本低、兼容 CPU+GPU

操作上手

🚀 在线 Demo (ModelScope / Replicate)

from modelscope.pipelines import pipeline
from modelscope.outputs import OutputKeys
from modelscope.utils.constant import Tasks

pipe = pipeline(Tasks.image_colorization, model='damo/cv_ddcolor_image-colorization')
out = pipe('xxx_bw.jpg')
cv2.imwrite('result.png', out[OutputKeys.OUTPUT_IMG])

效果秒出,色彩自然,细节清晰。

🎯 本地推理脚本

git clone https://github.com/piddnad/DDColor
cd DDColor
pip install -r requirements.txt
pip install torch==2.2.0 torchvision torchaudio -f .../cu118
python setup.py develop
python infer.py \
 --model_path ./modelscope/damo/cv_ddcolor_image-colorization/pytorch_model.pt \
 --input ./assets/test_images

🧠 ONNX 优化(轻量 CPU 版本)

python ddcolorize.py --image 1.jpg --output 1_ddcolor.jpg

兼容无 GPU 场景,仅需下载 ONNX 模型。

界面 & 效果展示

典型应用场景

  • 资料馆、档案管理:为历史珍贵照片配色,提升可视传播价值。
  • 视频修复项目:对老旧黑白片段进行批量上色,使剧情更具吸引力。
  • 二次元或游戏截图:影视化处理,让画面质感逼近真实。
  • 个人艺术创作:无需专业绘师即可为老图、素描快速上色。

与同类项目对比

项目 色彩真实度 多样性 推理速度 上手难度 特点
DeOldify(GAN) ☆☆ 饱和但偏色
ColorFormer(Transformer) ☆☆☆☆ ☆☆ 效果较好,但依赖预设
DDColor(双解码) ★★★★★ ★★★★ 快(1s/图) 色彩丰富、真实、自动

DDColor 融合多优势,同时降低用户上手门槛。

同类/相关项目推荐

  • ComfyUI-DDColor:为 ComfyUI 制作节点插件,一键调用 DDColor 模型。
  • instant-high/DDColor‑onnx:ONNX 优化版,适合无 GPU 独立部署。
  • vs‑ddcolor:VapourSynth 插件,支持视频帧批量着色。

总结亮点

DDColor 是目前业界少有的集准确还原、色彩丰富、推理高效、平台多样于一体的图像自动着色方案。其双解码器结构、Colorfulness Loss,以及多平台支持,使其不仅是学术新星,也真正走进了用户工具链。历史修复、影像美化、艺术创作……都可成为你的“魔法笔”。

项目地址

https://github.com/piddnad/DDColor

相关文章
|
1月前
|
人工智能 数据可视化 开发者
惊艳!GitHub 开发者一键接入!4.2k star 项目 Champ,用一张照片秒变动画
“Champ” 致力于从一张静态人物图生成流畅连续的人体动画,支撑精准姿态控制与形状一致性,其核心思路是将 3D 参数化人体模型(SMPL)引入扩散模型:
|
3月前
|
人工智能 Linux 计算机视觉
GitHub 开源热搜!10.7k  star, MagicAnimate,让照片秒变动画短片!
MagicAnimate 是由新加坡国立大学与字节跳动团队开发的静态图像动画工具,基于视频扩散模型与时序注意力模块,可实现高保真一致动画。用户只需上传一张照片和动作视频/DensePose 数据,即可生成高质量动画,效率提升 50%。项目在 GitHub 上获得 11.1k 星,支持多 GPU 推理、模型替换及跨平台部署,适用于短视频创作、在线教育、营销广告等场景。其优势在于流畅度高、细节还原精准,是目前最强的人像动画技术之一。
161 0
|
机器学习/深度学习 人工智能 开发工具
GitHub 项目推荐:用深度学习让你的照片变得美丽
不是每个人都能买得起最好的相机,但我们可以用深度学习来得到高质量的照片
575 0
|
1月前
|
JSON Kubernetes 安全
找到啦,我们已上车,Github 27000+ star,研发团队必备开源工具项目,真丝滑!!!
Trivy 是一款高效灵活的开源安全扫描工具,支持容器镜像、文件系统、Kubernetes 等多目标扫描,具备快速、易用、集成性强等特点,适用于 DevSecOps 全流程安全检测。
|
2天前
|
人工智能 JavaScript 前端开发
Github 2024-10-28 开源项目周报 Top15
本周GitHub热门项目涵盖Svelte、Open Interpreter、PowerShell等,涉及Web开发、AI助手、自动化工具等领域,Python、JavaScript为主流语言,展现开源技术活跃生态。(239字)
60 19
|
2天前
|
人工智能 JavaScript 前端开发
Github 2024-11-04 开源项目周报 Top14
本周GitHub热门项目涵盖屏幕截图转代码、网页监控、低代码开发等。Python与TypeScript主导,亮点项目包括AI生成代码工具、开源社交应用Bluesky及机器人框架LeRobot,展现AI与自动化技术的快速发展趋势。
34 15
|
2天前
|
人工智能 JavaScript Docker
Github 2024-11-11 开源项目周报 Top15
本周GitHub热门项目涵盖多领域:Python与TypeScript领跑,包括屏幕截图转代码、本地文件共享、PDF处理、AI开发代理等。亮点项目如screenshot-to-code、LocalSend、OpenHands及Diagrams,兼具创新与实用性,广受开发者关注。
53 13
|
2天前
|
人工智能 算法 JavaScript
Github 2024-10-14 开源项目周报 Top14
本周GitHub热门项目共14个,Python项目占7席。涵盖算法实现、生成式AI、金融分析、目标检测等领域,包括TheAlgorithms系列、OpenBB金融平台、Ultralytics YOLO11、Manim动画框架等,展现开源技术多元发展态势。
27 8
|
2天前
|
人工智能 Rust JavaScript
Github 2024-10-07 开源项目周报 Top15
本周GitHub热门项目共15个,Python项目占比最高达7个。榜首为Python算法实现集合TheAlgorithms/Python,Star数超17万;其他亮点包括Godot游戏引擎、OpenBB金融平台、ToolJet低代码框架及新兴AI相关项目如Crawl4AI、Llama Stack等,涵盖游戏、金融、AI、理财等多个领域。
23 4
|
2天前
|
人工智能 Rust 算法
Github 2024-09-30 开源项目周报 Top15
本周GitHub热门项目揭晓:Python主导,AutoGPT居首,涵盖AI、编程、数学动画等领域,助力开发者探索前沿技术。
26 4

热门文章

最新文章