进行图像增广(数据扩充)的15种功能总结和Python代码实现(一)

简介: 进行图像增广(数据扩充)的15种功能总结和Python代码实现

python代码可以自己扩充图像数据集。

640.png

无论我们喜欢Keras还是Pytorch,我们都可以使用丰富的资料库来有效地增广我们的图像。但是如果遇到特殊情况:

  • 我们的数据集结构复杂(例如3个输入图像和1-2个分段输出)。
  • 我们需要完全的自由透明度
  • 我们希望进行这些库未提供的扩充方法。

对于这些情况以及其他特殊情况,我们必须能够掌握我们自己的图像增广函数。而且,我每次都使用自己的函数。因此,在本文中,我将介绍并提供执行图像增广的功能。

640.png

我将使用朋友的照片来提醒我在加拿大度过的美好时光作为示例。希望您喜欢这张照片,因为这是您在本文中看到的唯一一张照片。

我将增广过程细分为一个实际的案例,将我们的函数与图像和目标图像一起使用。这将使您对将要描述的方法的灵活性有所了解:

  • 翻转
  • 裁剪
  • 过滤和锐化
  • 模糊
  • 旋转,平移,剪切,缩放
  • 剪下
  • 色彩
  • 亮度
  • 对比
  • 均匀和高斯噪声
  • 渐变
  • 镜头变形

本文的目的不是为了证明增广技术是如何设计的,而是理解它们的用法。

一些有用的函数

在开始之前,我想解释每种方法具有的通用结构。它实际上是一个要初始化的对象。该对象将以我们的样本作为参数调用,并将返回我们的扩充样本。这就是全部?是的,仅此而已!然后,让我们从增广功能之前的一些有用函数开始。

Resize

640.png

第一个有用的函数允许我们使用(宽度,高度)形状调整图像大小。这个使我们看到了所有其他的初始化方式。我们实例化一个对象,该对象的大小被参数化。在我们的例子中,所有样本(图像和目标)将以相同的尺寸返回。使用此类型的功能,我们可以轻松地以所需方式处理图像和目标。

class Resize(object):
   def __init__(self, output_size):
       self.output_size = output_size
   def __call__(self, X, Y):
       _X = cv2.resize(X, self.output_size)
       w, h = self.output_size
       c = Y.shape[-1]
       _Y = np.zeros((h, w, c))
       for i in range(Y.shape[-1]):
           _Y[..., i] = cv2.resize(Y[..., i], self.output_size)
       return _X, _Y

Clip

剪辑函数是一项非常有用的函数,尤其是当您需要从一种颜色空间切换到另一种颜色空间或在0和1或0和255之间重置图像时。

640.png

默认情况下,如果仅指定一个阈值,则最小阈值为0。

class Clip(object):
   def __init__(self, mini, maxi=None):
       if maxi is None:
           self.mini, self.maxi = 0, mini
       else:
           self.mini, self.maxi = mini, maxi
   def __call__(self, X, Y):
       mini_mask = np.where(X < self.mini)
       maxi_mask = np.where(X > self.maxi)
       X[mini_mask] = self.mini
       X[maxi_mask] = self.maxi
       return X, Y

Normalize or Standardize

在传递模型中的输入之前,我们通常希望对数据进行标准化规范化。当然,这些操作可以在特定的上完成。

640.png

默认情况下,对整个图像执行标准化和规范化。

class Normalize(object):
   def __init__(self, axis=None):
       self.axis = axis
   def __call__(self, X, Y):
       mini = np.min(X, self.axis)
       maxi = np.max(X, self.axis)
       X = (X - mini) / (maxi - mini)
       return X, Y
class Standardize(object):
   def __init__(self, axis=None):
       self.axis = axis
   def __call__(self, X, Y):
       mean =  np.mean(X, self.axis)
       std = np.std(X, self.axis)
       X = (X - mean) / std
       return X, Y

ToTensor

最后,如果您使用的是Pytorch,则需要将图像转换为Torch.Tensor。唯一需要注意的是,使用Pytorch,我们的图像维度中首先是通道,而不是最后是通道。最后,我们还可以选择张量的输出类型

class ToTensor(object):
   def __init__(self, X_type=None, Y_type=None):
       # must bu torch types
       self.X_type = X_type
       self.Y_type = Y_type
   def __call__(self, X, Y):
       # swap color axis because
       # numpy img_shape: H x W x C
       # torch img_shape: C X H X W
       X = X.transpose((2, 0, 1))
       Y = Y.transpose((2, 0, 1))
       # convert to tensor
       X = torch.from_numpy(X)
       Y = torch.from_numpy(Y)
       if self.X_type is not None:
           X = X.type(self.X_type)
       if self.Y_type is not None:
           Y = Y.type(self.Y_type)
       return X, Y

怎么使用?

我们要做的就是定义我们要在样本中进行的转换的列表,仅此而已。之后我们什么也别碰。请注意,转换顺序很重要。而且由你决定

X, Y = get_next_sample()
   for t in transform: # data augmentation
       X, Y = t(X, Y)
   pred = model.predict(X, Y)

现在,我们可以深入研究本文的目的,并查看图像增广技术。

旋转

640.gif

第一个,也是最简单的一个,包括在图像的水平垂直轴上随机执行翻转。换句话说,执行垂直翻转的机会为50/100,执行水平翻转的机会为50/100。

class Flip(object):
   def __call__(self, X, Y):
       for axis in [0, 1]:
           if np.random.rand(1) < 0.5:
               X = np.flip(X, axis)
               Y = np.flip(Y, axis)
       return X, Y

裁剪

要进行图像增广,通常会随机裁剪图像。换句话说,我们在随机区域上裁剪了一部分随机大小的图像。

640.gif

可以从尺寸的比例(高度,宽度)中选择裁剪图像的尺寸。如果未指定裁剪的比例最大大小,则默认情况下,我们将认为它是图像的大小。

class Crop(object):
   def __init__(self, min_size_ratio, max_size_ratio=(1, 1)):
       self.min_size_ratio = np.array(list(min_size_ratio))
       self.max_size_ratio = np.array(list(max_size_ratio))
   def __call__(self, X, Y):
       size = np.array(X.shape[:2])
       mini = self.min_size_ratio * size
       maxi = self.max_size_ratio * size
       # random size
       h = np.random.randint(mini[0], maxi[0])
       w = np.random.randint(mini[1], maxi[1])
       # random place
       shift_h = np.random.randint(0, size[0] - h)
       shift_w = np.random.randint(0, size[1] - w)
       X = X[shift_h:shift_h+h, shift_w:shift_w+w]
       Y = Y[shift_h:shift_h+h, shift_w:shift_w+w]
       return X, Y
目录
相关文章
|
2天前
|
缓存 开发者 Python
探索Python中的装饰器:简化代码,增强功能
【10月更文挑战第35天】装饰器在Python中是一种强大的工具,它允许开发者在不修改原有函数代码的情况下增加额外的功能。本文旨在通过简明的语言和实际的编码示例,带领读者理解装饰器的概念、用法及其在实际编程场景中的应用,从而提升代码的可读性和复用性。
|
4天前
|
设计模式 缓存 监控
Python中的装饰器:代码的魔法增强剂
在Python编程中,装饰器是一种强大而灵活的工具,它允许程序员在不修改函数或方法源代码的情况下增加额外的功能。本文将探讨装饰器的定义、工作原理以及如何通过自定义和标准库中的装饰器来优化代码结构和提高开发效率。通过实例演示,我们将深入了解装饰器的应用,包括日志记录、性能测量、事务处理等常见场景。此外,我们还将讨论装饰器的高级用法,如带参数的装饰器和类装饰器,为读者提供全面的装饰器使用指南。
|
4天前
|
存储 算法 搜索推荐
Python高手必备!揭秘图(Graph)的N种风骚表示法,让你的代码瞬间高大上
在Python中,图作为重要的数据结构,广泛应用于社交网络分析、路径查找等领域。本文介绍四种图的表示方法:邻接矩阵、邻接表、边列表和邻接集。每种方法都有其特点和适用场景,掌握它们能提升代码效率和可读性,让你在项目中脱颖而出。
15 5
|
2天前
|
机器学习/深度学习 数据采集 人工智能
探索机器学习:从理论到Python代码实践
【10月更文挑战第36天】本文将深入浅出地介绍机器学习的基本概念、主要算法及其在Python中的实现。我们将通过实际案例,展示如何使用scikit-learn库进行数据预处理、模型选择和参数调优。无论你是初学者还是有一定基础的开发者,都能从中获得启发和实践指导。
|
4天前
|
数据库 Python
异步编程不再难!Python asyncio库实战,让你的代码流畅如丝!
在编程中,随着应用复杂度的提升,对并发和异步处理的需求日益增长。Python的asyncio库通过async和await关键字,简化了异步编程,使其变得流畅高效。本文将通过实战示例,介绍异步编程的基本概念、如何使用asyncio编写异步代码以及处理多个异步任务的方法,帮助你掌握异步编程技巧,提高代码性能。
13 4
|
3天前
|
机器学习/深度学习 TensorFlow 算法框架/工具
利用Python和TensorFlow构建简单神经网络进行图像分类
利用Python和TensorFlow构建简单神经网络进行图像分类
14 3
|
5天前
|
缓存 开发者 Python
探索Python中的装饰器:简化和增强你的代码
【10月更文挑战第32天】 在编程的世界中,简洁和效率是永恒的追求。Python提供了一种强大工具——装饰器,它允许我们以声明式的方式修改函数的行为。本文将深入探讨装饰器的概念、用法及其在实际应用中的优势。通过实际代码示例,我们不仅理解装饰器的工作方式,还能学会如何自定义装饰器来满足特定需求。无论你是初学者还是有经验的开发者,这篇文章都将为你揭示装饰器的神秘面纱,并展示如何利用它们简化和增强你的代码库。
|
4天前
|
API 数据处理 Python
探秘Python并发新世界:asyncio库,让你的代码并发更优雅!
在Python编程中,随着网络应用和数据处理需求的增长,并发编程变得愈发重要。asyncio库作为Python 3.4及以上版本的标准库,以其简洁的API和强大的异步编程能力,成为提升性能和优化资源利用的关键工具。本文介绍了asyncio的基本概念、异步函数的定义与使用、并发控制和资源管理等核心功能,通过具体示例展示了如何高效地编写并发代码。
12 2
|
4天前
|
图形学 Python
SciPy 空间数据2
凸包(Convex Hull)是计算几何中的概念,指包含给定点集的所有凸集的交集。可以通过 `ConvexHull()` 方法创建凸包。示例代码展示了如何使用 `scipy` 库和 `matplotlib` 绘制给定点集的凸包。
12 1
|
5天前
|
JSON 数据格式 索引
Python中序列化/反序列化JSON格式的数据
【11月更文挑战第4天】本文介绍了 Python 中使用 `json` 模块进行序列化和反序列化的操作。序列化是指将 Python 对象(如字典、列表)转换为 JSON 字符串,主要使用 `json.dumps` 方法。示例包括基本的字典和列表序列化,以及自定义类的序列化。反序列化则是将 JSON 字符串转换回 Python 对象,使用 `json.loads` 方法。文中还提供了具体的代码示例,展示了如何处理不同类型的 Python 对象。