CVPR 2018:一种交互式纹理迁移通用框架

简介: 本文提出了一种用户引导的纹理迁移技术,通过输入素材语义图、素材风格图及目标语义图,能够自动生成具有目标语义和素材风格的目标风格图。

雷锋网(公众号:雷锋网) AI 科技评论按:本文是北京大学门怡芳基于其 CVPR spotlight 论文为 AI 科技评论提供的独家稿件,未经许可不得转载。论文信息:A Common Framework for Interactive Texture Transfer

引言

纹理迁移技术作为计算机视觉和图形学领域的一个研究热点,能够将样图中的风格纹理自动迁移到目标图像中,本文提出了一种用户引导的纹理迁移技术,通过输入素材语义图、素材风格图及目标语义图,能够自动生成具有目标语义和素材风格的目标风格图,该问题描述如图 1 所示。

TB13aiuiVzqK1RjSZFCXXbbxVXa.png

图 1:问题描述。输入素材语义图 S_sem、素材风格图 S_sty 及目标语义图 T_sem,能够自动生成具有目标语义和素材风格的目标风格图 T_sty。

该技术有着广泛的应用场景,例如将一副简单的用户涂鸦变成艺术画作、编辑装饰性纹理的生成路径和形状、生成具有已知风格纹理的特效文字、控制特效字中特效的空间分布、对图像中两个物体进行纹理交换等,该技术可以通过语义引导的方式将素材样图中的纹理图案迁移到目标图像中。

由于任务的多样性和语义引导的简单性,利用一些现有的技术很难达到我们的目标。一些方法在特定的场景上能达到很好的效果,如装饰笔刷 [1] 和文本特效迁移 [2],但这些方法只适用于单一的指定场景,不适用于我们目标中的多任务情景。基于图像类比的方法 [3,4],由于缺少对内部结构信息的分布引导,很难对内部具有复杂结构信息的纹理进行迁移并保留其细节性高频纹理。神经涂鸦 [5]利用卷积神经网络进行风格迁移,然而该方法适用范围小,仅适合于抽象的艺术画作,而不能很好地处理真实拍摄的图像或写实主义图片,使得真实图像迁移后的结果图包含大量的底层噪声,并且这种方法类似于一个黑盒操作,无法控制生成过程,使得生成结果有更多不可预测性,难以控制其细节合成,从而难以生成高质量的图片。

本文提出一种用户引导的纹理迁移通用框架以适用于多任务场景。本方法基于非参数化的纹理合成技术,从素材图取样完成目标图像的合成,采用了多个引导项动态引导合成过程。本方法通过显著性结构纹理引导的方式解决了目标风格图中结构信息丢失的问题;通过语义引导项为用户提供了控制纹理形态、位置的接口,提供用户交互性;通过纹理相干性引导项保证与素材风格的一致性。使其能够生成高质量的纹理迁移图片,满足多场景任务需求。

方法

本文通过输入包含素材语义图、素材风格图和目标语义图的一组样图,通过显著结构信息提取、结构信息传播、引导性的纹理合成等步骤,使得纹理迁移后仍能保持内部结构信息、底层细节信息,由此自动生成与目标语义图内容一致且具备素材风格的目标风格图,其总体处理流程如图 2 所示。

TB19jmwi3HqK1RjSZFEXXcGMXXa.png

图 2:方法的总体流程。主要包含显著结构信息提取、结构信息传播和引导性的纹理合成三个步骤。

1. 显著结构信息提取。通过显著性检测对图像中各个像素点的显著度进行计算,将满足结构信息定义的像素点标注为显著性点,得到素材风格图中的显著性结构信息,可视化过程如图 3 所示。

TB1okSui7voK1RjSZPfXXXPKFXa.png

图 3:显著结构信息提取过程可视化。(c)(d) 分别为 (a)(b) 进行显著性检测结果,将其差值作为显著结构信息,左右为两个样例。

2. 创建目标结构图:依据素材语义图和目标语义图的形状相似性,找到一个平面变换关系,将素材风格图中的具备显著结构信息的像素点映射到新图像中,该图像定义为目标结构图,可视化过程如图 4 所示。

TB1fBatiZbpK1RjSZFyXXX_qFXa.png

图 4:首先根据 CPD 算法对素材语义图和目标语义图进行轮廓关键点匹配,之后依据匹配结果,利用薄板样条插值算法将素材风格图中的具备显著结构信息的像素点映射到新图像中,该图像定义为目标结构图。

3. 建立目标函数并进行纹理合成优化,目标函数由不同权重的语义引导项、结构引导项和纹理相干项构成。语义引导项用于施加用户对风格纹理形态、位置的控制;结构引导项用于约束目标结构图中图像块与实时合成的目标风格图中图像块的相似性;纹理相干项控制目标风格图中生成的纹理与素材风格图中纹理风格相一致,使得风格纹理具有连续性。且语义引导项的权重随着迭代次数增多逐渐下降,变化范围从常数 β 下降到 0,以权重变化方式进行动态引导。将纹理合成过程看作一个最优化问题,以多尺度方式在每个尺度上利用最大期望值算法不断迭代优化目标函数,交替执行最近邻搜索和目标风格图重建两个步骤,直至收敛,即完成图像纹理迁移,得到具备素材风格的目标风格图。

实验结果

本文主要通过不同任务场景下的生成效果展示了方法的有效性,仅需要单张样例,便能够根据用户需求生成高质量的纹理迁移图片,在满足目标形态的同时,保证了纹理的连续性和一致性。以下为不同场景下图像的生成结果:

(1)用户涂鸦变艺术画作

TB1tS1riYvpK1RjSZPiXXbmwXXa.png TB13fqIi4jaK1RjSZFAXXbdLFXa.png

(2)编辑装饰性纹理的生成路径和形状

TB1r31ni9rqK1RjSZK9XXXyypXa.png

(3)特效字生成(控制特效空间分布)

TB1TYOti4TpK1RjSZFKXXa2wXXa.png

(4)纹理交换

TB1Fqixi7zoK1RjSZFlXXai4VXa.png

本文在不同任务场景下和其他 state-of-the-arts 方法进行了对比实验,表明了文本方法在图像生成质量及风格迁移效果上的优越性。

TB1YPeRi5LaK1RjSZFxXXamPFXa.png

参考文献

[1] J. Lu, C. Barnes, C.Wan, P. Asente, R. Mech, and A. Finkelstein. Decobrush: drawing structured decorative patterns by example. ACM Transactions on Graphics (TOG), 33(4):90, 2014.

[2] S. Yang, J. Liu, Z. Lian, and Z. Guo. Awesome typography: Statistics-based text effects transfer[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017: 7464-7473.

[3] A. Hertzmann, C. E. Jacobs, N. Oliver, B. Curless, and D. H. Salesin. Image analogies. In Proceedings of the 28th annual conference on Computer graphics and interactive techniques, pages 327–340. ACM, 2001.

[4] P. B´enard, F. Cole, M. Kass, I. Mordatch, J. Hegarty, M. S. Senn, K. Fleischer, D. Pesare, and K. Breeden. Stylizing animation by example. ACM Transactions on Graphics (TOG), 32(4):119, 2013.

[5] A. J. Champandard. Semantic style transfer and turning two-bit doodles into fine artworks. arXiv preprint arXiv: 1603.01768, 2016.

雷锋网

目录
相关文章
|
Web App开发 缓存 JavaScript
【安装指南】nodejs下载、安装与配置详细教程
这篇博文详细介绍了 Node.js 的下载、安装与配置过程,为初学者提供了清晰的指南。读者通过该教程可以轻松完成 Node.js 的安装,了解相关配置和基本操作。文章首先介绍了 Node.js 的背景和应用场景,随后详细说明了下载安装包、安装步骤以及配置环境变量的方法。作者用简洁明了的语言,配以步骤图示,使得读者能够轻松跟随教程完成操作。总的来说,这篇文章为初学者提供了一个友好的入门指南,使他们能够顺利开始使用 Node.js 进行开发。
5521 2
【安装指南】nodejs下载、安装与配置详细教程
|
算法 数据库 计算机视觉
Dataset之COCO数据集:COCO数据集的简介、下载、使用方法之详细攻略
Dataset之COCO数据集:COCO数据集的简介、下载、使用方法之详细攻略
|
12月前
|
人工智能 数据安全/隐私保护
什么样的“软技能”可以跨越周期、终身成长?
在快速变化的数字化时代,软技能成为职场人士实现终身成长的关键。本文探讨了学习能力、适应能力、沟通能力、领导力和创新思维等跨越周期的软技能,并介绍了生成式人工智能(GAI)认证作为提升软技能的新途径。GAI认证不仅涵盖技术知识,还强调软技能培养,助力职场人士增强竞争力、促进职业发展,同时强化道德与合规意识。通过系统学习与实践,个人可在未来职业生涯中脱颖而出,实现持续成长。
vue3.2中setup语法糖父组件如何调用子组件中的方法
vue3.2中setup语法糖父组件如何调用子组件中的方法
vue3.2中setup语法糖父组件如何调用子组件中的方法
|
机器学习/深度学习 人工智能 算法
【语音识别算法】深度学习语音识别算法与传统语音识别算法的区别、对比及联系
深度学习语音识别算法与传统语音识别算法在理论基础、实现方式、性能表现等方面存在显著区别,同时也有一些联系。下面将从几个方面详细比较这两种方法,并给出应用实例和代码示例
863 4
|
网络协议 Java 关系型数据库
16 Java网络编程(计算机网络+网络模型OSI/TCP/IP+通信协议等)
16 Java网络编程(计算机网络+网络模型OSI/TCP/IP+通信协议等)
371 2
|
安全 大数据 Java
高效处理大数据集合:JavaStreamAPI
高效处理大数据集合:JavaStreamAPI
268 1
|
机器学习/深度学习 人工智能 算法
一文读懂目标检测AI算法:R-CNN,faster R-CNN,yolo,SSD,yoloV2
## 1 引言 深度学习目前已经应用到了各个领域,应用场景大体分为三类:物体识别,目标检测,自然语言处理。上文我们对物体识别领域的技术方案,也就是CNN进行了详细的分析,对LeNet-5 AlexNet VGG Inception ResNet MobileNet等各种优秀的模型框架有了深入理解。本文着重与分析目标检测领域的深度学习方法,对其中的经典模型框架进行深入分析。 目标检测可以
20441 0
|
数据可视化
新建论文三线表模板,一键格式刷(包含word和latex版本)
新建论文三线表模板,一键格式刷(包含word和latex版本)
3062 0
|
数据采集 SQL 编解码
CVPR2022 Oral | CosFace、ArcFace的大统一升级,AdaFace解决低质量图像人脸识(一)
CVPR2022 Oral | CosFace、ArcFace的大统一升级,AdaFace解决低质量图像人脸识(一)
1034 0

热门文章

最新文章