神经网络风格化过程的特征控制

简介: 翻译:《Controlling Perceptual Factors in Neural Style Transfer》

《Controlling Perceptual Factors in Neural Style Transfer》

相当于在第一篇上的扩展,是一种对风格化方法的优化。

介绍

对神经元风格化方法的概括:分别从两张踢偏上提取风格和内容物来生成一个新的图片。“style”与“content”两个·1词都是对图像的某种特征的概括。

  1. 不同的区域可能具有不同的风格:如天空和地面
  2. 笔刷纹理和纯填充物对颜色有不同的影响
  3. 不同结构的精细度不同

因此给出假设:图片的整体风格是位于包含不同的区域颜色光照信息和空间范围的风格的集合

通过在独立地控制不同空间区域风格的特征来改良神经元风格化并且减少失败。

相关工作

参数性神经元纹理模型相对基于补丁的模型允许较少的直觉控制??

纹理参数可以影响风格化而它们的相互作用是相当复杂的,因此很难预测它们对风格化结果的影响。

主要目的是提供通过控制神经性风格化来融合这种策略和早期风格化方法的是更高精度的用户控制的优点。

神经性风格化

用相应的特征表达来定义内容图像和风格图像。

生成一个新图像具有内容图像的内容和风格图像的风格。

                Ltotal = αLcontent + βLstyle    

在早起工作中,我们使用VGG-19以及第四层卷积作为图像内容,使用所有风格层的关系矩阵作为数据来形成风格。

空间控制

我们的目标是人为选择某片特定区域的表现风格。

比如:将某个风格应用在天空区域,将另一种风格应用在地面区域。

既避免人工痕迹太明显又能够产生来自于不同源的新的混搭风。

区域的内容指引通道值要与其风格的风格指引通道值相同。

当存在多种不同的风格图片时,在所有的样板图像进行索引。

我们将每一层的风格特征图同R指引通道相乘,为每个区域求得一个空间指引矩阵。

每一个指引矩阵被当作内容图像相应区域的最有目标。

最重要的用处是指引通道可以背用来保证风格化仅发生在相似区域。

一个难点是:靠近边界的神经元总有大片的接触区域。

生成较好的结果但是却不能较好的捕捉纹理。

颜色控制

颜色信息是风格的重要组成部分,同时又极大程度上独立于其他元素。

颜色控制的一个重要案例是风格化过程中颜色的保持。

有两种有效的方法来保存原图像的颜色。

  • 亮度转移法
  • 颜色直方图匹配

亮度转移法

在这种策略中,我们只在亮度通道上进行风格化。

视觉感知对亮度的感知比对颜色的感知更加敏感。

使用颜色空间来区分亮度和颜色信息,内容图像的颜色信息同生成后的亮度信息一起用来输出最终的图像。

如果在内容图像和风格图像的亮度直方图中有大量不匹配的地方,那么这种方法容易得到很好的效果。

对亮度通道的平均值和方差进行处理。

                Ls′ =σC(LS−μS)+μC
颜色直方图匹配

这一种方法感觉比较简单。

直接改变风格图像的颜色从而使它与内容图像相匹配,即生成一个新的风格凸显作为输入。

在神经性风格化过程中工作的比较好。

也可以用来保存风格图像的颜色:如果两者间存在明显的不匹配但是又想保留风格图像的颜色分布。

两种方法比较

两种方法都能提供不错的结果但是存在不同的优缺点。

  • 颜色匹配策略被颜色转移过程所限制。通常情况下颜色分布并不能被完美匹配,从而导致了输出图像与内容图像的颜色的不匹配。
  • 相反的,亮度转移策略完美地保留了内容图像的颜色,然而亮度和颜色通道的依赖性丢失了。
    有明显笔刷纹理的风格的颜色会表现得很不自然。

层次控制

这一部分没看明白

生成融合了一个图像的高精度信息和另一个图形的粗糙信息的新风格图像。

我们用粗糙风格的图像来初始化最优过程并且完整地忽略一下内容缺失,所以来自粗糙风格凸显的纹理将会被充分替代。

现有的神经性风格化方法在并不能很好地产生高分辨率输出。

可接触范围在CNN网络中有着固定的大小,所以风格化的输出结果高度依赖于输入图像的分辨率。

可接触区域越大,风格化区域越大???

对高精度输入图像进行下降采样,生成了低精度输出图像,

然后对低精度输出结果进行上升采样,提升分辨率。

把最终生成的图像作为神经性风格化过程的初始量。

从粗糙到精细的过程具有额外的优点,即可以减少迭代次数,因此提升效率。

快速神经性风格化

神经性风格化的一个主要缺点是图像生成过程相对较慢。

  • 保留输入图像的颜色的最简单的方法是使用现有的前向反馈风格化网络,将风格化的亮度通道和内容图像的颜色通道相结合。
    或者在风格图像的亮度通道和内容图像的亮度通道上分别训练前向反馈网络,将生成的亮度图像同输入的内容图像的颜色通道相结合。
    两种方法都需要我们将输出的平均亮度同内容图像相匹配。
    我们发现,基于亮度网络的颜色保留策略能够更好地将风格和内容图像的结构相结合。
    • John-son’s training procedure的小改动。

综述

我们假设图像风格包括了类似于空间、颜色、层次等多种元素并且提出了同这些元素有关的在风格化过程中能有效提升质量和灵活性等方法。

控制策略等一个应用是混合风格,这和用线性表达方法产生的混搭风格是不同的。

一个可能的问题是如果风格表达的某个方向和可察觉变量之间没有什么联系,那么生成新的风格就会比较困难。


An exciting open research question is to predict what combinations of styles will combine nicelyinto new, perceptually pleasing styles.


神经性风格化之所以吸引人,是因为它能在原有的图像基础上生成新的图像结构。

相关文章
|
2月前
|
机器学习/深度学习 算法 内存技术
【CVPR2021】CondenseNetV2:用于深度网络的稀疏特征再激活
【CVPR2021】CondenseNetV2:用于深度网络的稀疏特征再激活
85 2
【CVPR2021】CondenseNetV2:用于深度网络的稀疏特征再激活
|
2月前
|
机器学习/深度学习 算法 计算机视觉
卷积神经网络中的卷积层,如何提取图片的特征?
卷积神经网络中的卷积层,如何提取图片的特征?
|
2月前
|
机器学习/深度学习 算法 机器人
【论文速递】TMM2023 - FECANet:用特征增强的上下文感知网络增强小样本语义分割
【论文速递】TMM2023 - FECANet:用特征增强的上下文感知网络增强小样本语义分割
|
2月前
|
机器学习/深度学习 算法 计算机视觉
[YOLOv8/YOLOv7/YOLOv5系列算法改进NO.5]改进特征融合网络PANET为BIFPN(更新添加小目标检测层yaml)
本文介绍了改进YOLOv5以解决处理复杂背景时可能出现的错漏检问题。
172 5
|
7天前
|
编解码 计算机视觉 网络架构
【YOLOv10改进- 特征融合NECK】BiFPN:加权双向特征金字塔网络
YOLOv10专栏探讨了目标检测的效率提升,提出BiFPN,一种带加权和自适应融合的双向特征金字塔网络,优化了多尺度信息传递。EfficientDet系列利用这些创新在效率与性能间取得更好平衡,D7模型在COCO测试集上达到55.1 AP。YOLOv8引入MPDIoU,结合BiFPN学习分支权重,提高检测精度。详情见[YOLOv10 创新改进](https://blog.csdn.net/shangyanaf/category_12712258.html)和相关文章。
|
2月前
|
计算机视觉
【YOLOv8改进】 AFPN :渐进特征金字塔网络 (论文笔记+引入代码).md
YOLO目标检测专栏介绍了YOLO的有效改进和实战案例,包括AFPN——一种解决特征金字塔网络信息丢失问题的新方法。AFPN通过非相邻层直接融合和自适应空间融合处理多尺度特征,提高检测性能。此外,还展示了YOLOv8中引入的MPDIoU和ASFF模块的代码实现。详情可参考提供的专栏链接。
|
2月前
|
机器学习/深度学习 存储 测试技术
【YOLOv8改进】 YOLOv8 更换骨干网络之 GhostNet :通过低成本操作获得更多特征 (论文笔记+引入代码).md
YOLO目标检测专栏探讨了卷积神经网络的创新改进,如Ghost模块,它通过低成本运算生成更多特征图,降低资源消耗,适用于嵌入式设备。GhostNet利用Ghost模块实现轻量级架构,性能超越MobileNetV3。此外,文章还介绍了SegNeXt,一个高效卷积注意力网络,提升语义分割性能,参数少但效果优于EfficientNet-L2。专栏提供YOLO相关基础解析、改进方法和实战案例。
|
1月前
|
监控 安全
计算机网络:关键性能指标与非性能特征解析
计算机网络:关键性能指标与非性能特征解析
229 0
|
2月前
|
编解码 计算机视觉 网络架构
【YOLOv8改进】BiFPN:加权双向特征金字塔网络 (论文笔记+引入代码)
该专栏深入研究了YOLO目标检测的神经网络架构优化,提出了加权双向特征金字塔网络(BiFPN)和复合缩放方法,以提升模型效率。BiFPN通过双向跨尺度连接和加权融合增强信息传递,同时具有自适应的网络拓扑结构。结合EfficientNet,构建了EfficientDet系列检测器,在效率和准确性上超越先前技术。此外,介绍了YOLOv8如何引入MPDIoU并应用BiFPN进行可学习权重的特征融合。更多详情可参考提供的专栏链接。
|
2月前
|
编解码 算法 计算机视觉
yolo3的特征金字塔网络具体是指?
yolo3的特征金字塔网络具体是指?