一键抠图,毛发毕现:这个GitHub项目助你快速PS

简介: 快速抠图不留痕,设计看了都精神。

抠图是 PS 中的一项常用技术。但是要做到完美地将图像中的目标选取出来往往费时费力。近日,一个名为 PyMatting 的项目无疑能够帮助你。


项目地址:https://github.com/pymatting/pymatting


无需手动,一键抠图


抠图的 AI 应用场景是这样的:给定一张图像,通过划定一个区域,AI 应当能够估计到划定区域内的前景图目标,并将这个前景完整地抽取出来,用来替换到其他背景的图像中去。


因此,抠图需要两个 AI 能力:首先,AI 需要能够在划定的区域内识别目标。其次,AI 要能够完整地将目标抽取出来,没有划定错误的边缘、模糊的图像等问题。


微信图片_20211203095332.jpg


上图为项目作者提供的示例。给定一只动物的图像(左上),以及人划定的区域(右上),算法应当能够获得划定区域内目标的阿尔法通道,即区分前景和背景的黑白轮廓(左下)。有了这一数据,就可以从原图中抠去目标,并移动到新的图像中去(右下)。


据项目介绍,PyMatting 具有以下特性。


首先,项目能够完成阿尔法抠图(Alpha Matting),其中包括 Closed-Form 抠图、大核抠图(Large Kernel Matting)、KNN 抠图、基于学习的数字抠图(Learning Based Digital Matting)、随机游走(Random Walk)抠图等算法。


同时,项目也能完成前景预估,包括 Clos Form 前景预估和多级别前景预估(基于 CPU、CUDA 和 OpenCL 等)算法。


该项目还可以进行快速多线程 KNN 搜索、不完全阈值化楚列斯基分解(incomplete thresholded Cholesky decomposition)、V 轮几何多网格预条件子(V-Cycle Geometric Multigrid preconditioner)等。


使用方法


在使用前,你需要保证电脑安装相应的 Python 环境(Python 3),同时需要以下安装包:


numpy>=1.16.0

pillow>=5.2.0

numba>=0.47.0

scipy>=1.1.0


由于项目需要 GPU,因此也需要 GPU 相关支持:

cupy-cuda90>=6.5.0 or similar

pyopencl>=2019.1.2


除此之外,为了进行测试,也需要:

pytest>=5.3.4


为了方便使用,作者提供了一些示例代码。例如,如下代码中,给定原始图像和抠图框,可以抽取出阿尔法前景:

from pymatting import cutout

cutout(

   # input image path"data/lemur.png",

   # input trimap path"data/lemur_trimap.png",

   # output cutout path"lemur_cutout.png")


作者还提供了高级代码,直接进行抠图,生成新图像:


image = load_image("../data/lemur/lemur.png", "RGB", scale, "box")

trimap = load_image("../data/lemur/lemur_trimap.png", "GRAY", scale, "nearest")

# estimate alpha from image and trimap

alpha = estimate_alpha_cf(image, trimap)

# make gray background

new_background = np.zeros(image.shape)

new_background[:, :] = [0.5, 0.5, 0.5]

# estimate foreground from image and alpha

foreground, background = estimate_foreground_ml(image, alpha, return_background=True)

# blend foreground with background and alpha, less color bleeding

new_image = blend(foreground, new_background, alpha)


除了代码示例外,项目还提供了测试代码,可在主目录中运行:

python3 tests/download_images.py

pip3 install -r requirements_tests.txt

pytest

这一测试能够覆盖 89% 的代码。


除了项目外,作者还提供了不同的抠图算法的基准测试结果,如下所示:

微信图片_20211203095715.jpg不同算法在测试数据集上的均方误差大小。


可以看出,基于学习的算法和 Closed-Form 算法都能取得不错的效果。


完整的基准测试结果:https://pymatting.github.io/benchmark.html


相关文章
|
1月前
|
JSON Kubernetes 安全
找到啦,我们已上车,Github 27000+ star,研发团队必备开源工具项目,真丝滑!!!
Trivy 是一款高效灵活的开源安全扫描工具,支持容器镜像、文件系统、Kubernetes 等多目标扫描,具备快速、易用、集成性强等特点,适用于 DevSecOps 全流程安全检测。
|
9天前
|
人工智能 JavaScript 前端开发
Github 2024-10-28 开源项目周报 Top15
本周GitHub热门项目涵盖Svelte、Open Interpreter、PowerShell等,涉及Web开发、AI助手、自动化工具等领域,Python、JavaScript为主流语言,展现开源技术活跃生态。(239字)
163 19
|
9天前
|
人工智能 JavaScript 前端开发
Github 2024-11-04 开源项目周报 Top14
本周GitHub热门项目涵盖屏幕截图转代码、网页监控、低代码开发等。Python与TypeScript主导,亮点项目包括AI生成代码工具、开源社交应用Bluesky及机器人框架LeRobot,展现AI与自动化技术的快速发展趋势。
70 15
|
9天前
|
人工智能 JavaScript Docker
Github 2024-11-11 开源项目周报 Top15
本周GitHub热门项目涵盖多领域:Python与TypeScript领跑,包括屏幕截图转代码、本地文件共享、PDF处理、AI开发代理等。亮点项目如screenshot-to-code、LocalSend、OpenHands及Diagrams,兼具创新与实用性,广受开发者关注。
86 13
|
9天前
|
人工智能 算法 JavaScript
Github 2024-10-14 开源项目周报 Top14
本周GitHub热门项目共14个,Python项目占7席。涵盖算法实现、生成式AI、金融分析、目标检测等领域,包括TheAlgorithms系列、OpenBB金融平台、Ultralytics YOLO11、Manim动画框架等,展现开源技术多元发展态势。
44 8
|
9天前
|
人工智能 Rust JavaScript
Github 2024-10-07 开源项目周报 Top15
本周GitHub热门项目共15个,Python项目占比最高达7个。榜首为Python算法实现集合TheAlgorithms/Python,Star数超17万;其他亮点包括Godot游戏引擎、OpenBB金融平台、ToolJet低代码框架及新兴AI相关项目如Crawl4AI、Llama Stack等,涵盖游戏、金融、AI、理财等多个领域。
46 4
|
9天前
|
人工智能 Rust 算法
Github 2024-09-30 开源项目周报 Top15
本周GitHub热门项目揭晓:Python主导,AutoGPT居首,涵盖AI、编程、数学动画等领域,助力开发者探索前沿技术。
60 4
|
9天前
|
人工智能 JavaScript 前端开发
Github 2024-09-16 开源项目周报 Top14
本周GitHub热门项目涵盖Python、TypeScript、Go等语言,React居首。亮点包括微软PowerToys、Node版本管理器、AI证件照工具HivisionIDPhotos及端侧大模型MiniCPM等。
37 2
|
9天前
|
Rust JavaScript 安全
Github 2024-09-02 开源项目周报 Top13
本周GitHub热门项目涵盖AI、开发工具与开源替代品。包括Notion替代AppFlowy、Airtable替代NocoDB、云平台Coolify及可观察性平台OpenObserve等,涉及Python、TypeScript、Rust等语言,聚焦效率、隐私与自动化。
41 1
|
1月前
|
人工智能 编解码 JSON
不看后悔!GitHub 开源 MultiTalk .8k star 强大的人语音+图像绑定项目
MultiTalk 是 GitHub 上的开源项目,具备音频驱动、多人对话视频生成功能。支持多路音频与图像绑定,实现高同步唇动与角色互动,适用于教学、虚拟人及短视频创作,已获 8k 星标。
180 0