时间序列分析实战(五):ARIMA加法(疏系数)模型建模

简介: 时间序列分析实战(五):ARIMA加法(疏系数)模型建模

1 目的

  该篇文章主要展示针对时序进行ARIMA加法模型建模,并根据实际情况进行改进。案例数据同 时间序列分析实战(三):时序因素分解法:某欧洲小镇1963年1月至1976年12月每月旅馆入住的房间数构成时间序列x t x_txt

2 原序列差分处理

  从 时间序列分析实战(三):时序因素分解法一文中可知,该序列具有趋势和季节效应,进行1阶差分提取趋势效应,12步差分提取季节效应。

  运行程序:

#对原数据进行1阶12步差分
y=diff(diff(data1,12))
plot(y,sub='图1 入住房间数差分后序列时序图')

  运行结果:

图1 入住房间数差分后序列时序图

3 差分后序列平稳性检验

  运行程序:

#差分后序列平稳性检验
library(aTSA)
adf.test(y)

  运行结果:

## Augmented Dickey-Fuller Test 
## alternative: stationary 
##  
## Type 1: no drift no trend 
##      lag    ADF p.value
## [1,]   0 -19.56    0.01
## [2,]   1 -11.01    0.01
## [3,]   2 -10.63    0.01
## [4,]   3  -9.08    0.01
## [5,]   4 -10.57    0.01
## Type 2: with drift no trend 
##      lag    ADF p.value
## [1,]   0 -19.50    0.01
## [2,]   1 -10.98    0.01
## [3,]   2 -10.60    0.01
## [4,]   3  -9.05    0.01
## [5,]   4 -10.53    0.01
## Type 3: with drift and trend 
##      lag    ADF p.value
## [1,]   0 -19.44    0.01
## [2,]   1 -10.94    0.01
## [3,]   2 -10.56    0.01
## [4,]   3  -9.01    0.01
## [5,]   4 -10.49    0.01
## ---- 
## Note: in fact, p.value = 0.01 means p.value <= 0.01

4 差分后序列白噪声检验

  运行程序:

#差分后序列纯随机性检验
for(k in 1:2) print(Box.test(y,lag=6*k,type="Ljung-Box"))

  运行结果:

## 
##  Box-Ljung test
## 
## data:  y
## X-squared = 56.87, df = 6, p-value = 1.941e-10
## 
## 
##  Box-Ljung test
## 
## data:  y
## X-squared = 76.751, df = 12, p-value = 1.713e-11

  通过1阶12步差分后序列时序图(图1)显示差分后的序列没有明显趋势和周期特征了,ADF检验结果显示差分后序列平稳,纯随机性检验结果显示差分后序列为非白噪声序列,适合建模。

5 ARIMA模型建立

  考虑建立ARIMA加法模型:

image.png

6 ARIMA模型定阶

  运行程序:

par(mfrow=c(1,2))
acf(y)
title(sub="图2 入住房间数差分后序列自相关图(ACF)")
pacf(y)
title(sub="图2 入住房间数差分后序列偏自相关图(PACF)")

  运行结果:

图2 入住房间数差分后序列自相关图(ACF)(左)& 偏自相关图(PACF)(右)

  差分后序列的自相关图和偏自相关图(图2)显示,自相关系数和偏自相关系数都显示出拖尾的性质。经过多次尝试之后,直到ARMA(1,6),模型才通过了显著性检验,再考虑到之前的差分运算,实际上拟合的是加法模型:ARIMA(1,1,6)×(0,1,0)12

7 ARIMA模型拟合

  运行程序:

#拟合加法ARIMA模型
fit2=arima(data1,order = c(1,1,6),seasonal = list(order=c(0,1,0),period=12),transform.pars = F)
fit2

  运行结果:

## 
## Call:
## arima(x = data1, order = c(1, 1, 6), seasonal = list(order = c(0, 1, 0), period = 12), 
##     transform.pars = F)
## 
## Coefficients:
##           ar1      ma1      ma2      ma3      ma4      ma5     ma6
##       -0.3848  -0.5833  -0.5015  -0.2828  -0.0814  -0.0647  0.5148
## s.e.   0.1739   0.1663   0.1787   0.0933   0.1072   0.0893  0.0941
## 
## sigma^2 estimated as 221.7:  log likelihood = -645.52,  aic = 1307.03

8 ARIMA模型显著性检验

  运行程序:

#模型显著性检验
ts.diag(fit2)
title(sub="图3 ARIMA(1,(1,12),6)模型显著性检验")

  运行结果:

图3 ARIMA(1,(1,12),6)模型显著性检验

  此时,参数θ 4 \theta_4θ4θ 5 \theta_5θ5的估计值在两倍标准差外,未通过显著性检验,所以考虑拟合疏系数模型ARIMA(1,(1,2,3,6)),再考虑到之前的差分运算,实际上拟合的是加法模型ARIMA(1,1,(1,2,3,6))×(0,1,0)12

9 ARIMA加法疏系数模型

  运行程序:

#拟合加法ARIMA模型
fit3=arima(data1,order = c(1,1,6),seasonal = list(order=c(0,1,0),period=12),
           transform.pars = F,fixed=c(NA,NA,NA,NA,0,0,NA))
fit3

  运行结果:

## 
## Call:
## arima(x = data1, order = c(1, 1, 6), seasonal = list(order = c(0, 1, 0), period = 12), 
##     transform.pars = F, fixed = c(NA, NA, NA, NA, 0, 0, NA))
## 
## Coefficients:
##           ar1      ma1      ma2      ma3  ma4  ma5     ma6
##       -0.4201  -0.6015  -0.5797  -0.2909    0    0  0.4730
## s.e.   0.1958   0.1918   0.2185   0.0997    0    0  0.0982
## 
## sigma^2 estimated as 211.5:  log likelihood = -646.01,  aic = 1304.02

10 ARIMA加法疏系数模型显著性检验

  运行程序:

#模型显著性检验
ts.diag(fit3)
title(sub="图4 ARIMA(1,(1,12),(1,2,3,6))模型显著性检验")

  运行结果:

图4 ARIMA(1,(1,12),(1,2,3,6))模型显著性检验

image.png


相关文章
|
6月前
|
机器学习/深度学习
R语言自适应LASSO 多项式回归、二元逻辑回归和岭回归应用分析(下)
R语言自适应LASSO 多项式回归、二元逻辑回归和岭回归应用分析
|
6月前
|
数据可视化 vr&ar
时间序列分析实战(七):多个变量的ARIMA模型拟合
时间序列分析实战(七):多个变量的ARIMA模型拟合
|
6月前
|
机器学习/深度学习
数据分享|R语言广义线性模型GLM:线性最小二乘、对数变换、泊松、二项式逻辑回归分析冰淇淋销售时间序列数据和模拟-1
数据分享|R语言广义线性模型GLM:线性最小二乘、对数变换、泊松、二项式逻辑回归分析冰淇淋销售时间序列数据和模拟
|
3月前
|
机器学习/深度学习 算法 数据挖掘
【机器学习】聚类算法中的距离度量有哪些及公式表示?
聚类算法中常用的距离度量方法及其数学表达式,包括欧式距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、余弦相似度等多种距离和相似度计算方式。
281 1
|
6月前
时间序列分析实战(六):ARIMA乘法(疏系数)模型建模及预测
时间序列分析实战(六):ARIMA乘法(疏系数)模型建模及预测
|
6月前
|
机器学习/深度学习 人工智能 算法
数据分享|R语言广义线性模型GLM:线性最小二乘、对数变换、泊松、二项式逻辑回归分析冰淇淋销售时间序列数据和模拟-2
数据分享|R语言广义线性模型GLM:线性最小二乘、对数变换、泊松、二项式逻辑回归分析冰淇淋销售时间序列数据和模拟
|
6月前
使用R语言进行多项式回归、非线性回归模型曲线拟合
使用R语言进行多项式回归、非线性回归模型曲线拟合
|
6月前
|
机器学习/深度学习 数据可视化 算法
R语言拟合改进的稀疏广义加性模型(RGAM)预测、交叉验证、可视化
R语言拟合改进的稀疏广义加性模型(RGAM)预测、交叉验证、可视化
|
6月前
|
数据可视化
R语言lasso惩罚稀疏加法(相加)模型SPAM拟合非线性数据和可视化
R语言lasso惩罚稀疏加法(相加)模型SPAM拟合非线性数据和可视化
|
6月前
|
机器学习/深度学习 人工智能 算法
数据分享|R语言广义线性模型GLM:线性最小二乘、对数变换、泊松、二项式逻辑回归分析冰淇淋销售时间序列数据和模拟
数据分享|R语言广义线性模型GLM:线性最小二乘、对数变换、泊松、二项式逻辑回归分析冰淇淋销售时间序列数据和模拟