进行图像增广(数据扩充)的15种功能总结和Python代码实现(三)

简介: 进行图像增广(数据扩充)的15种功能总结和Python代码实现

剪下

640.gif

在整个输入上用0替换进行抠图并同时裁剪目标

抠图非常直观。它涉及随机删除输入图像的区域。它的工作方式与我们之前提到的裁剪相同。但是,我们不删除相关区域。因此,我们可以再次允许用户提供每个比例的要删除区域的最小和最大大小最大区域数,以同时或不同时从目标剪切区域,我们可以剪切每个通道,还选择已删除区域的默认替换值。

640.gif

输入剪切通道替换为1,不裁剪目标

class Cutout(object):
   def __init__(self,
                min_size_ratio,
                max_size_ratio,
                channel_wise=False,
                crop_target=True,
                max_crop=10,
                replacement=0):
       self.min_size_ratio = np.array(list(min_size_ratio))
       self.max_size_ratio = np.array(list(max_size_ratio))
       self.channel_wise = channel_wise
       self.crop_target = crop_target
       self.max_crop = max_crop
       self.replacement = replacement
   def __call__(self, X, Y):
       size = np.array(X.shape[:2])
       mini = self.min_size_ratio * size
       maxi = self.max_size_ratio * size
       for _ in range(self.max_crop):
           # random size
           h = np.random.randint(mini[0], maxi[0])
           w = np.random.randint(mini[1], maxi[1])
           # random place
           shift_h = np.random.randint(0, size[0] - h)
           shift_w = np.random.randint(0, size[1] - w)
           if self.channel_wise:
               c = np.random.randint(0, X.shape[-1])
               X[shift_h:shift_h+h, shift_w:shift_w+w, c] = self.replacement
               if self.crop_target:
                   Y[shift_h:shift_h+h, shift_w:shift_w+w] = self.replacement
           else:
               X[shift_h:shift_h+h, shift_w:shift_w+w] = self.replacement
               if self.crop_target:
                   Y[shift_h:shift_h+h, shift_w:shift_w+w] = self.replacement
       return X, Y

色彩空间

640.gif

现在,我们进入最有趣的部分。也是很少考虑的部分。如果我们知道色彩空间,则可以利用它们的属性来增广图像。举一个简单的例子,借助HSV颜色空间,我们可以很容易地提取树叶的颜色,并根据我们的意愿随机更改其颜色。那是一件很酷的事情!并且我们可以了解自己的图像增广功能的原理。当然,这需要更多的创造力。因此,重要的是要了解我们的色彩空间,以充分利用它们。特别是因为它们对于我们(深度)机器学习模型的预处理至关重要。

class Leaf(object):
   def __init__(self):
       pass
   def __call__(self, X, Y):
       blur = cv2.GaussianBlur(X, (7, 7), 0)
       hsv_blur = cv2.cvtColor(blur, cv2.COLOR_BGR2HSV)
       # lower mask (0-10)
       lower_red = np.array([0,130,130])
       upper_red = np.array([20,255,255])
       mask_0 = cv2.inRange(hsv_blur, lower_red, upper_red)
       # upper mask (170-180)
       lower_red = np.array([165,130,130])
       upper_red = np.array([185,255,255])
       mask_1 = cv2.inRange(hsv_blur, lower_red, upper_red)
       hsv_blur[np.where(mask_1)] = hsv_blur[np.where(mask_1)] - np.array([165, 0, 0])
       mask = mask_0 + mask_1
       # change color
       turn_color = np.random.randint(0, 255)
       hsv_blur[np.where(mask)] = hsv_blur[np.where(mask)] + np.array([turn_color, 0, 0])
       X_blur = cv2.cvtColor(hsv_blur, cv2.COLOR_HSV2BGR)
       X[np.where(mask)] = X_blur[np.where(mask)]
       return X, Y

亮度

640.gif

亮度从-100到100

图像增广的一个伟大经典就是能够改变亮度。有几种方法可以做到这一点,最简单的就是简单地添加一个随机偏差

class Brightness(object):
   def __init__(self, range_brightness=(-50, 50)):
       self.range_brightness = range_brightness
   def __call__(self, X, Y):
       brightness = np.random.randint(*self.range_brightness)
       X = X + brightness
       return X, Y

对比度

640.gif

对比度从-100到100

同样,使用对比非常简单。这也可以通过随机数完成。

class Contrast(object):
   def __init__(self, range_contrast=(-50, 50)):
       self.range_contrast = range_contrast
   def __call__(self, X, Y):
       contrast = np.random.randint(*self.range_contrast)
       X = X * (contrast / 127 + 1) - contrast
       return X, Y

噪声注入

最后一种相当常见的图像增广技术是噪声注入。实际上,我们只添加与输入大小相同的矩阵。该矩阵由遵循随机分布的元素组成。可以从任何随机分布中进行噪声注入。实际上,我们只看到其中两个。但是随时可以进一步😃

一般方法

640.gif

class UniformNoise(object):
   def __init__(self, low=-50, high=50):
       self.low = low
       self.high = high
   def __call__(self, X, Y):
       noise = np.random.uniform(self.low, self.high, X.shape)
       X = X + noise
       return X, Y

高斯方法

640.gif

class GaussianNoise(object):
   def __init__(self, center=0, std=50):
       self.center = center
       self.std = std
   def __call__(self, X, Y):
       noise = np.random.normal(self.center, self.std, X.shape)
       X = X + noise
       return X, Y

渐晕

640.gif

最后,更少使用但并非没有用的一种方法。有些相机会产生渐晕效果。考虑如何通过随机模仿这种现象来增广图像也很有趣。我们还将尝试为用户提供灵活性。我们将能够确定距离效果和可以随机开始的最小距离,确定其强度,甚至可以确定效果是朝着黑色还是向白色方向发展。

class Vignetting(object):
   def __init__(self,
                ratio_min_dist=0.2,
                range_vignette=(0.2, 0.8),
                random_sign=False):
       self.ratio_min_dist = ratio_min_dist
       self.range_vignette = np.array(range_vignette)
       self.random_sign = random_sign
   def __call__(self, X, Y):
       h, w = X.shape[:2]
       min_dist = np.array([h, w]) / 2 * np.random.random() * self.ratio_min_dist
       # create matrix of distance from the center on the two axis
       x, y = np.meshgrid(np.linspace(-w/2, w/2, w), np.linspace(-h/2, h/2, h))
       x, y = np.abs(x), np.abs(y)
       # create the vignette mask on the two axis
       x = (x - min_dist[0]) / (np.max(x) - min_dist[0])
       x = np.clip(x, 0, 1)
       y = (y - min_dist[1]) / (np.max(y) - min_dist[1])
       y = np.clip(y, 0, 1)
       # then get a random intensity of the vignette
       vignette = (x + y) / 2 * np.random.uniform(*self.range_vignette)
       vignette = np.tile(vignette[..., None], [1, 1, 3])
       sign = 2 * (np.random.random() < 0.5) * (self.random_sign) - 1
       X = X * (1 + sign * vignette)
       return X, Y

镜头变形

最后,这是一种非常好的方法。我很惊讶它不经常被使用。但是它可以模仿相机镜头的失真。就像透过圆形玻璃看。在我们看来,由于透镜(玻璃)是圆形的,因此失真了。因此,如果我们的图像是从带镜头的相机拍摄的,为什么不模拟它们。默认情况下,应将其用于图像。至少我是这样认为的。

640.gif

因此,我建议在最后一个函数中,通过播放径向系数k1,k2,k3和切向系数p1,p2,可以随机模拟我们的镜头失真。在该方法中,系数的顺序如下:k1,k2,p1,p2,k3。

class LensDistortion(object):
   def __init__(self, d_coef=(0.15, 0.15, 0.1, 0.1, 0.05)):
       self.d_coef = np.array(d_coef)
   def __call__(self, X, Y):
       # get the height and the width of the image
       h, w = X.shape[:2]
       # compute its diagonal
       f = (h ** 2 + w ** 2) ** 0.5
       # set the image projective to carrtesian dimension
       K = np.array([[f, 0, w / 2],
                    [0, f, h / 2],
                    [0, 0,     1]])
       d_coef = self.d_coef * np.random.random(5) # value
       d_coef = d_coef * (2 * (np.random.random(5) < 0.5) - 1) # sign
       # Generate new camera matrix from parameters
       M, _ = cv2.getOptimalNewCameraMatrix(K, d_coef, (w, h), 0)
       # Generate look-up tables for remapping the camera image
       remap = cv2.initUndistortRectifyMap(K, d_coef, None, M, (w, h), 5)
       # Remap the original image to a new image
       X = cv2.remap(X, *remap, cv2.INTER_LINEAR)
       Y = cv2.remap(Y, *remap, cv2.INTER_LINEAR)
       return X, Y

希望对您有用!请随时关注我或就您喜欢或不喜欢的内容给我反馈。✏️待会儿见!😘

目录
相关文章
|
3天前
|
数据采集 Web App开发 数据挖掘
使用Python和BeautifulSoup轻松抓取表格数据
使用Python和BeautifulSoup,结合代理IP,可以从网页抓取表格数据,如中国气象局的天气信息。通过requests库发送HTTP请求,BeautifulSoup解析HTML提取表格。安装必要库后,设置代理IP,发送请求,解析HTML找到表格,提取数据并存储。通过Pandas进行数据分析,如计算平均气温。这种方法让数据抓取和分析变得更加便捷。
使用Python和BeautifulSoup轻松抓取表格数据
|
4天前
|
数据采集 Web App开发 数据处理
一步步教你用Python Selenium抓取动态网页任意行数据
使用Python Selenium爬取动态网页,结合代理IP提升抓取效率。安装Selenium,配置代理(如亿牛云),设置User-Agent和Cookies以模拟用户行为。示例代码展示如何使用XPath提取表格数据,处理异常,并通过隐式等待确保页面加载完成。代理、模拟浏览器行为和正确配置增强爬虫性能和成功率。
一步步教你用Python Selenium抓取动态网页任意行数据
|
3天前
|
数据安全/隐私保护 Python
Python装饰器是高阶函数,用于在不修改代码的情况下扩展或修改函数行为。它们提供可重用性、模块化和无侵入性的功能增强。
【6月更文挑战第20天】Python装饰器是高阶函数,用于在不修改代码的情况下扩展或修改函数行为。它们提供可重用性、模块化和无侵入性的功能增强。例如,`@simple_decorator` 包装`my_function`,在调用前后添加额外操作。装饰器还能接受参数,如`@logged(&quot;INFO&quot;, &quot;msg&quot;)`,允许动态定制功能。
11 6
|
1天前
|
人工智能 数据挖掘 大数据
538个代码示例!麻省理工教授的Python程序设计+人工智能案例实践
Python简单易学,且提供了丰富的第三方库,可以用较少的代码完成较多的工作,使开发者能够专注于如何解决问题而只花较少的时间去考虑如何编程。 此外,Python还具有免费开源、跨平台、面向对象、胶水语言等优点,在系统编程、图形界面开发、科学计算、Web开发、数据分析、人工智能等方面有广泛应用。 尤其是在数据分析和人工智能方面,Python已成为最受开发者欢迎的编程语言之一,不仅大量计算机专业人员选择使用Python进行快速开发,许多非计算机专业人员也纷纷选择Python语言来解决专业问题。 由于Python应用广泛,关于Python的参考书目前已经有很多,但将Python编程与数据分析、人工智
|
3天前
|
SQL Oracle 关系型数据库
Python连接数据库进行数据查询的操作代码
mysql数据库(mariadb) 连接数据库 首先,你需要使用MySQLdb.connect()函数建立与MySQL数据库的连接。你需要提供数据库服务器的地址(host),用户名(user),密码(passwd),以及你想要操作的数据库名称(db)。 创建Cursor对象 一旦建立了数据库连接,你可以使用连接对象的cursor()方法来创建一个cursor对象。这个方法返回一个cursor实例,你可以使用这个实例来执行SQL查询和命令。
|
4天前
|
IDE 前端开发 开发工具
怎么在isort Python 代码中的导入语句进行排序和格式化
`isort` 是一个Python工具,用于自动排序和格式化代码中的导入语句,提高代码整洁度和可读性。它支持自动排序、保留空白和注释、自定义排序规则、与多种编辑器集成以及命令行使用。安装`isort`可通过`pip install isort`,使用时可直接在Python代码中导入或通过命令行处理文件。示例展示了如何在代码中使用`isort`进行导入排序,包括基本排序、自定义设置和处理多个文件。`isort`适用于标准库、第三方库和自定义模块的导入排序,还可忽略特定导入,并能与IDE和编辑器插件集成,提升开发效率。
|
1天前
|
JSON API 数据库
Python使用Quart作为web服务器的代码实现
Quart 是一个异步的 Web 框架,它使用 ASGI 接口(Asynchronous Server Gateway Interface)而不是传统的 WSGI(Web Server Gateway Interface)。这使得 Quart 特别适合用于构建需要处理大量并发连接的高性能 Web 应用程序。与 Flask 类似,Quart 也非常灵活,可以轻松地构建 RESTful API、WebSockets、HTTP/2 服务器推送等。
|
1月前
|
算法 编译器 开发者
如何提高Python代码的性能:优化技巧与实践
本文探讨了如何提高Python代码的性能,重点介绍了一些优化技巧与实践方法。通过使用适当的数据结构、算法和编程范式,以及利用Python内置的性能优化工具,可以有效地提升Python程序的执行效率,从而提升整体应用性能。本文将针对不同场景和需求,分享一些实用的优化技巧,并通过示例代码和性能测试结果加以说明。
|
6天前
|
算法 搜索推荐 开发者
解锁Python代码的速度之谜:性能瓶颈分析与优化实践
探索Python性能优化,关注解释器开销、GIL、数据结构选择及I/O操作。使用cProfile和line_profiler定位瓶颈,通过Cython减少解释器影响,多进程避开GIL,优化算法与数据结构,以及借助asyncio提升I/O效率。通过精准优化,Python可应对高性能计算挑战。【6月更文挑战第15天】
12 1
|
1月前
|
人工智能 Python
Python中的反对称矩阵:理论、应用与代码实践
Python中的反对称矩阵:理论、应用与代码实践
40 1