猿创征文|时间序列分析算法之二次指数平滑法和三次指数平滑法详解+Python代码实现

简介: 猿创征文|时间序列分析算法之二次指数平滑法和三次指数平滑法详解+Python代码实现

前言


好久没来更时间序列分析算法了,今天把平滑法这一个常用且宽泛的时序算法给补完。这篇文章完结了就代表整个传统时序预测算法讲完了。文章内容是紧接着上篇文章:


一文速学-时间序列分析算法之指数平滑法详解+Python代码实现_fanstuck的博客-CSDN博客_指数平滑法python


ffcc7ff817f54fc28f3e0e7afcfe2413.png


下篇文章就是详解单变量时间序列预测的所有模型和算法了。此系列将会一直写到现在比较火热的LSTM短时时序预测以及更多先进且方便的时序预测算法。

希望读者看完能够在评论区提出错误或者看法,博主会长期维护博客做及时更新。


二次指数平滑法(Holt’s linear trend method)


从我们之前学过的简单移动平均法和在此基础之上衍生出来的二次移动平均法(又称趋势移动平均法),一次指数平滑法和二次指数平滑法二者关系与之类似,可以说原理都一样。


1.定义


在一次指数平滑法的基础之上再去做趋势移动。当时间序列的变动出现直线趋势时,用一次指数平滑法来进行预测仍将存在着明显的滞后偏差。修正的方法也是在一次指数平滑的基础上再进行二次指数平滑,利用滞后偏差的规律找出曲线的发展方向和发展趋势,然后建立直线趋势预测模型,故称为二次指数平滑法。


2.公式

我们再来看看一次指数平滑法的公式:

设时间序列为gif.gif为加权系数,gif.gif,一次指数平滑公式为:

cc2d423be48c4a2eb4381d072abf45f8.pnga0b73ac45a104f978c6d1fff7943afbc.png


gif.gif为t+1时刻的预测值,即t时刻的平滑值gif.gifgif.gif为t时刻的实际值gif.gif为t时刻的预测值,即为上一时刻的平滑值gif.gif.很明显该公式是由移动平均公式改进而来。

我们和二次移动平均法一样如法炮制计算。


二次指数平滑值

c68684917f41484f8f259c4fd7706333.png


公式中:

  • gif.gif:第t周期的二次指数平滑值
  • S^{(1)}_t:第t周期的一次指数平滑值
  • :gif.gif第t-1周期的二次指数平滑值
  • :gif.gif加权系数(平滑系数)

很容易看出二次指数平滑法是对一次指数平滑值再一次指数平滑的方法。所以说还得使用一次指数平滑法之后再作计算。


二次指数平滑数学模型:


4bdcdb46dc494b01889a5e749f805ff5.png

3.案例实现


这里我们不再使用上次化学实验的案例1,换个一个案例:

以我国 1965~1985 年的发电总量资料为例,试用二次指数平滑法预 测 1986 年和 1987 年的发电总量:



d62090598ae9495486fe83a76fb2ccb3.png

那么我们只需要读入数据再将我们之前写的SES一次平滑指数法引入就好了:

import pandas as pd
import numpy as np
import Ipynb_importer
import SES
df=pd.read_excel('try_test2.xlsx')

首先我们获取一次平滑值,平滑系数还是为0.3:

df=pd.read_excel('try_test2.xlsx')
x=df['t']
y=df['发电总量y']
y_1=SES(y,1,0.3)
y_1


29832afea2b043f2a87ab304791eddf5.png


我们获取二次平滑值只需要将一次平滑值再次代入就可以得到:

y_2=SES(y_2,1,0.3)
y_2

50b5417c1ab6458ca92a0da844d27c02.png


那么如果我们要预测t为21时刻的值时,我们需要得到a和b两个参数的值:

#我们需要传入一次平滑预测值和二次平滑预测值,以及t值、平滑系数a和给予的T
def SES_quadratic(y_1,y_2,s,t,T):
    a=2*y_1[t-1]-y_2[t-1]
    b=(s/(1-s))*(y_1[t-1]-y_2[t-1])
    y=a+b*T
    return y
SES_quadratic(y_1,y_2,0.3,21,1)


这样我们就得到了 t为22时刻的预测值:



b994568c019644399e7d5fa81674f647.png

3b62fc610ef3493a9151d32a476a7d8a.png


三次指数平滑法(Holt-Winters’ seasonal method)


1.定义


一次指数平滑法针对没有趋势和季节性的序列,二次指数平滑法针对有趋势但是没有季节特性的时间序列,三次指数平滑法则可以预测具有趋势和季节性的时间序列。术语“Holt-Winter”指的是三次指数平滑。该方法分为预测方程和三个平滑方程,一个是水平,一个是趋势,一个是季节性成分,采用平滑参数和,用代表季节性周期,例如一年中季节的数量,季的数量,月的数量。


直接我们在将时间序列数据的时候谈到,时间序列有一下四个时序特性:


长期趋势(Trend)

季节变化(Season)

循环波动(Cyclic)

不规则波动(Irregular)

其中季节变化也正是三次指数平滑法所代表的平滑。下面网址就是全述季节性预测算法:


7.3 Holt-Winters’ seasonal method | Forecasting: Principles and Practice (2nd ed)


之前我在第一篇文章也说过:


四种影响因素通常有两种组合方式:


一种是加法模型:Y=T+S+C+I,认为数据的发展趋势是4种影响因素相互叠加的结果


一种是乘法模型:Y=T*S*C*I,认为数据的发展趋势是4种因素相互综合的结果


该方法有两种变体,根据季节性成分的性质不同而不同。当季节变化在整个系列中大致恒定时,优选加法模型,而当季节变化与系列水平成比例时,优选乘法模型。使用相加法,季节性分量在观测序列的尺度中以绝对值表示,在水平方程中,通过减去季节性分量对序列进行季节性调整。在每年内,季节性成分的总和将接近零。使用乘法方法,季节性成分以相对项(百分比)表示,通过除以季节性成分对序列进行季节性调整。每年内,季节性成分总计约为m。


那么Holt-Winters 加法模型为:


e71d5c54a46c439ea8ec3b92f99bf89b.png


其中k是(h−1) /m的整数部分,这确保用于预测的季节性指数的估计来自样本的最后一年。水平方程显示了经季节性调整的观测值(gif.gif)之间的加权平均值,以及非季节性预测(gif.gif)对于时间t,趋势方程与Holt的线性方法相同。季节方程显示当前季节指数(gif.gif)之间的加权平均值 ,以及去年同一季节(即m个时间段之前)的季节性指数。


季节性分量的方程通常表示为:

2a4dad749ea649ceaadeb26d98380d13.png

如果我们替换ℓ从上述分量形式的水平的平滑方程,我们得到


5491b9bca3cd47229d7dd28447872110.png

相应的,乘法模型为:

6575b0729dfa4cdb98c8e0c95a177a2b.png


2.公式


我们大可不需要再次重新认识三次指数平滑法,三次平滑法无非就是在二次平滑法的基础之上再次平滑一次而已。那么推导公式就更加简单了:


0352da113e494eaa85dc1487a08a5f2a.png

其三次平滑值的公式为:

94d9fb2e5be64f83955f6f1b7c9a584d.png


式中gif.gif为三次指数平滑值。

三次指数平滑法的预测模型为:


2fa434a79fca43db9d180e5d553b7087.png

3.案例实现


我们的案例依旧和二次指数平滑法的案例一样,省的大家再去理解其他案例场景。

我们可以先进行绘图描点看看这些数据是否用三次指数平滑法更合适:


import matplotlib.pyplot as plt
df=pd.read_excel('try_test2.xlsx')
x=df['t']
y=df['发电总量y']
plot1 = plt.plot(x, y, '*', label='origin data')
plt.title('metric_polyfit')
plt.show()

7d44751793c941d5989c3cf4ff67bb4f.png


那么我们发现这个案例的数据是呈线性递增趋势,那么我们还得换个案例。这里选用上次化学反应的案例最好用。


以在某化学反应里,测得生成物浓度y(%)与时间t(min)的数据为例子:


290aa62a71134009b8819aa7e7dc92e6.png

8065625a4d6541c0979e99466019dc80.png

通过实际数据序列呈非线性递增趋势,采用三次指数平滑预测方法。


确定指数平滑的初始值和权系数(平滑系数)a。设一次、二次、三次指数平滑的初始值为最早三个数据的平均值。即:


gif.gif


gif.gif为0.3,那么我们将gif.gif先求出来:

y_1=SES(y,3,0.3)
y_2=SES(y_1,3,0.3)
y_3=SES(y_2,3,0.3)


之后我们使用python写出代码就好了:

#我们需要传入一次平滑预测值、二次平滑预测值和三次平滑预测值,以及t值、平滑系数a和给予的T
def SES_triple(y_1,y_2,y_3,s,t,T):
    t=t-1
    a=y_1[t]*3-y_2[t]*3+y_3[t]
    b=(s/(2*((1-s)**2)))*((6-5*s)*y_1[t]-2*(5-4*s)*y_2[t]+(4-3*s)*y_3[t])
    c=((s**2)/(2*((1-s)**2)))*(y_1[t]-2*y_2[t]+y_3[t])
    y=a+b*T+c*T**2
    return y
SES_triple(y_1,y_2,y_3,0.3,16,1)

393ca143bf704bb79ab1966fbfe82e0e.png


加权系数a的选择

在指数平滑法中,预测成功的关键是 a 的选择。a 的大小规定了在新预测值中新数据和原预测值所占的比例。a 值愈大,新数据所占的比重就愈大,原预测值所占比重就愈小,反之亦然。


       理论界一般认为有以下方法可供选择:


       经验判断法。这种方法主要依赖于时间序列的发展趋势和预测者的经验做出判断。


1、当时间序列呈现较稳定的水平趋势时,应选较小的α值,一般可在0.05~0.20之间取值;


2、当时间序列有波动,但长期趋势变化不大时,可选稍大的α值,常在0.1~0.4之间取值;


3、当时间序列波动很大,长期趋势变化幅度较大,呈现明显且迅速的上升或下降趋势时,宜选择较大的α值,如可在0.6~0.8间选值,以使预测模型灵敏度高些,能迅速跟上数据的变化;


4、当时间序列数据是上升(或下降)的发展趋势类型,α应取较大的值,在0.6~1之间。


       试算法。根据具体时间序列情况,参照经验判断法,来大致确定额定的取值范围,然后取几个α值进行试算,比较不同α值下的预测标准误差,选取预测标准误差最小的α。


       在实际应用中预测者应结合对预测对象的变化规律做出定性判断且计算预测误差,并要考虑到预测灵敏度和预测精度是相互矛盾的,必须给予二者一定的考虑,采用折中的α值。

目录
相关文章
|
2月前
|
机器学习/深度学习 算法 数据挖掘
基于GWO灰狼优化的GroupCNN分组卷积网络时间序列预测算法matlab仿真
本项目展示了基于分组卷积神经网络(GroupCNN)和灰狼优化(GWO)的时间序列回归预测算法。算法运行效果良好,无水印展示。使用Matlab2022a开发,提供完整代码及详细中文注释。GroupCNN通过分组卷积减少计算成本,GWO则优化超参数,提高预测性能。项目包含操作步骤视频,方便用户快速上手。
|
2月前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于WOA鲸鱼优化的GroupCNN分组卷积网络时间序列预测算法matlab仿真
本项目展示了一种基于WOA优化的GroupCNN分组卷积网络时间序列预测算法。使用Matlab2022a开发,提供无水印运行效果预览及核心代码(含中文注释)。算法通过WOA优化网络结构与超参数,结合分组卷积技术,有效提升预测精度与效率。分组卷积减少了计算成本,而WOA则模拟鲸鱼捕食行为进行优化,适用于多种连续优化问题。
|
2月前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于GA遗传优化的GroupCNN分组卷积网络时间序列预测算法matlab仿真
该算法结合了遗传算法(GA)与分组卷积神经网络(GroupCNN),利用GA优化GroupCNN的网络结构和超参数,提升时间序列预测精度与效率。遗传算法通过模拟自然选择过程中的选择、交叉和变异操作寻找最优解;分组卷积则有效减少了计算成本和参数数量。本项目使用MATLAB2022A实现,并提供完整代码及视频教程。注意:展示图含水印,完整程序运行无水印。
|
2月前
|
算法
动态规划算法学习四:最大上升子序列问题(LIS:Longest Increasing Subsequence)
这篇文章介绍了动态规划算法中解决最大上升子序列问题(LIS)的方法,包括问题的描述、动态规划的步骤、状态表示、递推方程、计算最优值以及优化方法,如非动态规划的二分法。
76 0
动态规划算法学习四:最大上升子序列问题(LIS:Longest Increasing Subsequence)
|
3月前
|
算法 数据可视化
基于SSA奇异谱分析算法的时间序列趋势线提取matlab仿真
奇异谱分析(SSA)是一种基于奇异值分解(SVD)和轨迹矩阵的非线性、非参数时间序列分析方法,适用于提取趋势、周期性和噪声成分。本项目使用MATLAB 2022a版本实现从强干扰序列中提取趋势线,并通过可视化展示了原时间序列与提取的趋势分量。代码实现了滑动窗口下的奇异值分解和分组重构,适用于非线性和非平稳时间序列分析。此方法在气候变化、金融市场和生物医学信号处理等领域有广泛应用。
177 19
|
3月前
|
机器学习/深度学习 PyTorch TensorFlow
Python实现深度学习学习率指数衰减的方法与参数介绍
学习率指数衰减提供了一种高效的动态调整学习率的手段,帮助模型在不同训练阶段以不同的学习速度优化,有利于提升模型性能和训练效率。通过合理设置衰减策略中的参数,可以有效地控制学习率的衰减过程,实现更加精确的模型训练调优。
55 0
|
3月前
|
算法 数据可视化 数据安全/隐私保护
基于LK光流提取算法的图像序列晃动程度计算matlab仿真
该算法基于Lucas-Kanade光流方法,用于计算图像序列的晃动程度。通过计算相邻帧间的光流场并定义晃动程度指标(如RMS),可量化图像晃动。此版本适用于Matlab 2022a,提供详细中文注释与操作视频。完整代码无水印。
|
4月前
|
机器学习/深度学习 数据采集 算法
【优秀python算法毕设】基于python时间序列模型分析气温变化趋势的设计与实现
本文介绍了一个基于Python的时间序列模型,用于分析和预测2021-2022年重庆地区的气温变化趋势,通过ARIMA和LSTM模型的应用,揭示了气温的季节性和趋势性变化,并提供了对未来气温变化的预测,有助于气象预报和相关决策制定。
118 1
【优秀python算法毕设】基于python时间序列模型分析气温变化趋势的设计与实现
|
3月前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于PSO粒子群优化的GroupCNN分组卷积网络时间序列预测算法matlab仿真
本项目展示了一种结合粒子群优化(PSO)与分组卷积神经网络(GroupCNN)的时间序列预测算法。该算法通过PSO寻找最优网络结构和超参数,提高预测准确性与效率。软件基于MATLAB 2022a,提供完整代码及详细中文注释,并附带操作步骤视频。分组卷积有效降低了计算成本,而PSO则智能调整网络参数。此方法特别适用于金融市场预测和天气预报等场景。
|
5月前
|
机器学习/深度学习 算法 数据挖掘
算法金 | 欧氏距离算法、余弦相似度、汉明、曼哈顿、切比雪夫、闵可夫斯基、雅卡尔指数、半正矢、Sørensen-Dice
**摘要:** 了解9种距离和相似度算法:欧氏距离、余弦相似度、汉明距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、雅卡尔指数、半正矢距离和Sørensen-Dice系数。这些算法在机器学习、文本分析、图像处理和生物学等领域各有应用。例如,欧氏距离用于KNN和K-Means,余弦相似度用于文本相似性,汉明距离在错误检测中,曼哈顿距离在数据挖掘,切比雪夫距离在棋盘游戏,闵可夫斯基距离通过调整参数适应不同场景,雅卡尔指数和Sørensen-Dice系数用于集合相似度。每种算法有其优缺点,如欧氏距离对异常值敏感,余弦相似度忽略数值大小,汉明距离仅适用于等长数据。
150 2
算法金 | 欧氏距离算法、余弦相似度、汉明、曼哈顿、切比雪夫、闵可夫斯基、雅卡尔指数、半正矢、Sørensen-Dice