python 插值算法

简介: 最近在做时间序列预测时,在突增或者突降的变化剧烈的情况下,拟合参数的效果不好,有用到插值的算法补全一些数据来平滑剧烈变化过程。还有在图像处理中,也经常有用到插值算法来改变图像的大小,在图像超分(Image Super-Resolution)中上采样也有插值的身影【2月更文挑战第8天】

python 插值算法

1. 什么是插值

最近在做时间序列预测时,在突增或者突降的变化剧烈的情况下,拟合参数的效果不好,有用到插值的算法补全一些数据来平滑剧烈变化过程。还有在图像处理中,也经常有用到插值算法来改变图像的大小,在图像超分(Image Super-Resolution)中上采样也有插值的身影。

插值(interpolation),顾名思义就是插入一些新的数据,当然这些值是根据已有数据生成。插值算法有很多经典算法, 本文分享如下:

  • 线性插值
  • 双线性插值
  • 双三次插值bicubic interpolation

2. 插值算法原理和实现

2.1 线性插值

线性插值是最简单的插值算法。如下图已知(x0, y0) (x1, y1),在x处插值一点(x, y)。

yyq-2021-07-10-23-00-11.png

可以通过简单几何知识来推出公式

yyq-2021-07-10-23-07-09.png
yyq-2021-07-10-23-08-02.png

实现上直接套公式,如果想插值多个点,可以利用线性回归的方式。

import os
import numpy as np
from sklearn.linear_model import LinearRegression

def linear_interpolation(data, inter_num=4):
    clf = LinearRegression()
    X = np.array([[1], [inter_num+2]])
    y = data
    clf.fit(X, y)
    inter_values = clf.predict(np.array([ [i+2] for i in range(inter_num)]))
    return inter_values
data = [[10], [20]]
linear_interpolation(data, 1)
# array([[15.]])

def manual_linear_interpolation(x0, y0, x1, y1, x):
    return y0+(x-x0)*(y1-y0)/(x1-x0)
manual_linear_interpolation(1, 10, 3, 20, 2)
# 15.0

线性插值算法经常用在平滑数据上,也用在缺失值预处理中。

2.2 双线性插值

双线性插值是在两个方向上同时进行线性插值,经常用在图像处理中。双线性插值是已知2*2个点,插值生成一个点的过程。

如下图所示,双线性插值已知(x0, y1)(x0, y0)(x1, y1)(x1, y0)4个点,插值计算(x, y)。

  • 先插值生成(x, y1)(x, y0)

    yyq-2021-07-10-23-25-32.png

  • 在插值生成(x, y)

    yyq-2021-07-10-23-25-59.png

yyq-2021-07-10-23-20-39.png

import cv2
lean_img = cv2.imread('./lena.jpg')
lena_x2 = cv2.resize(lean_img, (0, 0), fx=2, fy=2, interpolation=cv2.INTER_LINEAR)

2.3 双三次插值

双线性插值利用22个点插值生成一个新的点,而双三次插值利用44个点来插值一个新的点。插值的过程就是如何估计aij, aij可以认为是16个点对插值点的影响因子。

yyq-2021-07-11-23-17-40.png

影响因子设计来自于Cubic Convolution Interpolation For Digital Image Processing,

以下为Bicubic函数

yyq-2021-07-11-23-45-50.png
yyq-2021-07-11-23-46-32.png

import cv2
lean_img = cv2.imread('./lena.jpg')
lena_x2_cubic = cv2.resize(lean_img, (0, 0), fx=2, fy=2, interpolation=cv2.INTER_CUBIC)

左边为双线性插值,右边有双三次插值,可以看出双三次插值效果好,双线性插值更平滑一点,清晰度不足。

yyq-2021-07-12-23-21-24.png
yyq-2021-07-12-23-24-03.png

3. 总结

本文介绍了三种常见的插值算法以及在数字图像处理中的应用。总结如下:

  • 线性插值:通过2点插值新的点,可以利用线性回归计算插值点
  • 双线性插值:通过4个点插值新的点
  • 双三次插值:通过16个点插值新的点,插值权重利用bicubic函数
目录
相关文章
|
10天前
|
监控 算法 安全
深度洞察内网监控电脑:基于Python的流量分析算法
在当今数字化环境中,内网监控电脑作为“守城卫士”,通过流量分析算法确保内网安全、稳定运行。基于Python的流量分析算法,利用`scapy`等工具捕获和解析数据包,提取关键信息,区分正常与异常流量。结合机器学习和可视化技术,进一步提升内网监控的精准性和效率,助力企业防范潜在威胁,保障业务顺畅。本文深入探讨了Python在内网监控中的应用,展示了其实战代码及未来发展方向。
|
27天前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
眼疾识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了4种常见的眼疾图像数据集(白内障、糖尿病性视网膜病变、青光眼和正常眼睛) 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Django框架搭建了一个Web网页平台可视化操作界面,实现用户上传一张眼疾图片识别其名称。
89 4
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
|
2月前
|
机器学习/深度学习 人工智能 算法
猫狗宠物识别系统Python+TensorFlow+人工智能+深度学习+卷积网络算法
宠物识别系统使用Python和TensorFlow搭建卷积神经网络,基于37种常见猫狗数据集训练高精度模型,并保存为h5格式。通过Django框架搭建Web平台,用户上传宠物图片即可识别其名称,提供便捷的宠物识别服务。
312 55
|
2月前
|
存储 缓存 监控
局域网屏幕监控系统中的Python数据结构与算法实现
局域网屏幕监控系统用于实时捕获和监控局域网内多台设备的屏幕内容。本文介绍了一种基于Python双端队列(Deque)实现的滑动窗口数据缓存机制,以处理连续的屏幕帧数据流。通过固定长度的窗口,高效增删数据,确保低延迟显示和存储。该算法适用于数据压缩、异常检测等场景,保证系统在高负载下稳定运行。 本文转载自:https://www.vipshare.com
127 66
|
9天前
|
存储 算法 安全
控制局域网上网软件之 Python 字典树算法解析
控制局域网上网软件在现代网络管理中至关重要,用于控制设备的上网行为和访问权限。本文聚焦于字典树(Trie Tree)算法的应用,详细阐述其原理、优势及实现。通过字典树,软件能高效进行关键词匹配和过滤,提升系统性能。文中还提供了Python代码示例,展示了字典树在网址过滤和关键词屏蔽中的具体应用,为局域网的安全和管理提供有力支持。
36 17
|
18天前
|
存储 监控 算法
员工电脑监控屏幕场景下 Python 哈希表算法的探索
在数字化办公时代,员工电脑监控屏幕是保障信息安全和提升效率的重要手段。本文探讨哈希表算法在该场景中的应用,通过Python代码例程展示如何使用哈希表存储和查询员工操作记录,并结合数据库实现数据持久化,助力企业打造高效、安全的办公环境。哈希表在快速检索员工信息、优化系统性能方面发挥关键作用,为企业管理提供有力支持。
41 20
|
12天前
|
存储 人工智能 算法
深度解密:员工飞单需要什么证据之Python算法洞察
员工飞单是企业运营中的隐性风险,严重侵蚀公司利润。为应对这一问题,精准搜集证据至关重要。本文探讨如何利用Python编程语言及其数据结构和算法,高效取证。通过创建Transaction类存储交易数据,使用列表管理订单信息,结合排序算法和正则表达式分析交易时间和聊天记录,帮助企业识别潜在的飞单行为。Python的强大功能使得从交易流水和沟通记录中提取关键证据变得更加系统化和高效,为企业维权提供有力支持。
|
12天前
|
存储 算法 安全
U 盘管控情境下 Python 二叉搜索树算法的深度剖析与探究
在信息技术高度发达的今天,数据安全至关重要。U盘作为常用的数据存储与传输工具,其管控尤为关键。本文探讨Python中的二叉搜索树算法在U盘管控中的应用,通过高效管理授权U盘信息,防止数据泄露,保障信息安全。二叉搜索树具有快速插入和查找的优势,适用于大量授权U盘的管理。尽管存在一些局限性,如树结构退化问题,但通过优化和改进,如采用自平衡树,可以有效提升U盘管控系统的性能和安全性。
20 3
|
26天前
|
存储 算法 Serverless
剖析文件共享工具背后的Python哈希表算法奥秘
在数字化时代,文件共享工具不可或缺。哈希表算法通过将文件名或哈希值映射到存储位置,实现快速检索与高效管理。Python中的哈希表可用于创建简易文件索引,支持快速插入和查找文件路径。哈希表不仅提升了文件定位速度,还优化了存储管理和多节点数据一致性,确保文件共享工具高效运行,满足多用户并发需求,推动文件共享领域向更高效、便捷的方向发展。
|
2月前
|
存储 运维 监控
探索局域网电脑监控软件:Python算法与数据结构的巧妙结合
在数字化时代,局域网电脑监控软件成为企业管理和IT运维的重要工具,确保数据安全和网络稳定。本文探讨其背后的关键技术——Python中的算法与数据结构,如字典用于高效存储设备信息,以及数据收集、异常检测和聚合算法提升监控效率。通过Python代码示例,展示了如何实现基本监控功能,帮助读者理解其工作原理并激发技术兴趣。
58 20