【视频】时间序列分析:ARIMA-ARCH / GARCH模型分析股票价格-1

简介: 【视频】时间序列分析:ARIMA-ARCH / GARCH模型分析股票价格

原文链接:http://tecdat.cn/?p=18860


简介

时间序列分析是统计学中的一个主要分支,主要侧重于分析数据集以研究数据的特征并提取有意义的统计信息来预测序列的未来值。时序分析有两种方法,即频域和时域。前者主要基于傅立叶变换,而后者则研究序列的自相关,并且使用Box-Jenkins和ARCH / GARCH方法进行序列的预测。

本文将提供使用时域方法对R环境中的金融时间序列进行分析和建模的过程。第一部分涵盖了平稳的时间序列。第二部分为ARIMA和ARCH / GARCH建模提供了指南。接下来,它将研究组合模型及其在建模和预测时间序列方面的性能和有效性。最后,将对时间序列分析方法进行总结。

时间序列数据集的平稳性和差异:

1.平稳性:

对时间序列数据建模的第一步是将非平稳时间序列转换为平稳时间序列。这是很重要的,因为许多统计和计量经济学方法都基于此假设,并且只能应用于平稳时间序列。非平稳时间序列是不稳定且不可预测的,而平稳过程是均值回复的,即它围绕具有恒定方差的恒定均值波动。此外,随机变量的平稳性和独立性密切相关,因为许多适用于独立随机变量的理论也适用于需要独立性的平稳时间序列。这些方法大多数都假设随机变量是独立的(或不相关的)。噪声是独立的(或不相关的);变量和噪声彼此独立(或不相关)。那么什么是平稳时间序列?

粗略地说,平稳时间序列没有长期趋势,均值和方差不变。更具体地说,平稳性有两种定义:弱平稳性和严格平稳性。

a.平稳性弱:如果满足以下条件,则称时间序列{Xt,t∈Z}(其中Z是整数集)是平稳的

image.png

b.严格平稳:如果(Xt1,Xt2,...,Xtk)的联合分布与(Xt1 + h,Xt2 + h)的联合分布相同,则时间序列{Xt. ……Xtk + h),t∈Z}被认为是严格平稳的。

通常在统计文献中,平稳性是指平稳时间序列满足三个条件的弱平稳性:恒定均值,恒定方差和自协方差函数仅取决于(ts)(不取决于t或s)。另一方面,严格平稳性意味着时间序列的概率分布不会随时间变化。

例如,白噪声是平稳的,意味着随机变量是不相关的,不一定是独立的。但是,严格的白噪声表示变量之间的独立性。另外,由于高斯分布的特征是前两个时刻,所以高斯白噪声是严格平稳的,因此,不相关也意味着随机变量的独立性。

在严格的白噪声中,噪声项{et}不能线性或非线性地预测。在一般的白噪声中,可能无法线性预测,但可由稍后讨论的ARCH / GARCH模型非线性预测。有三点需要注意:

•严格的平稳性并不意味着平稳性弱,因为它不需要有限的方差

•平稳性并不意味着严格的平稳性,因为严格的平稳性要求概率分布不会随时间变化

•严格平稳序列的非线性函数也严格平稳,不适用于弱平稳

2.区别:

为了将非平稳序列转换为平稳序列,可以使用差分方法,从原始序列中减去该序列滞后1期:例如:

image.png

在金融时间序列中,通常会对序列进行转换,然后执行差分。这是因为金融时间序列通常会经历指数增长,因此对数转换可以使时间序列平滑(线性化),而差分将有助于稳定时间序列的方差。以下是苹果股票价格的示例:

•左上方的图表是苹果股票价格从2007年1月1日到2012年7月24日的原始时间序列,显示出指数级增长。

•左下方的图表显示了苹果股票价格的差分。可以看出,该系列是价格相关的。换句话说,序列的方差随着原始序列的级别增加而增加,因此不是平稳的

•右上角显示Apple的log价格图。与原始序列相比,该序列更线性。

•右下方显示了苹果log价格的差分。该系列似乎更具有均值回复性,并且方差是恒定的,并且不会随着原始系列级别的变化而显着变化。

image.png

image.png

image.png

image.png

要执行R中的差分,请执行以下步骤:

•读取R中的数据文件并将其存储在变量中

appl.close=appl$Adjclose #在原始文件中读取并存储收盘价

•绘制原始股票价格

plot(ap.close,type='l')

•与原始序列不同

diff.appl=diff(ap.close)

•原始序列的差分序列图

plot(diff.appl,type='l')

•获取原始序列的对数并绘制对数价格

log.appl=log(appl.close)

•不同的log价格和图

difflog.appl=diff(log.appl)

log价格的差分代表收益,与股票价格的百分比变化相似。

ARIMA模型:

image.png

模型识别:

通过观察时间序列的自相关建立并实现时域方法。因此,自相关和偏自相关是ARIMA模型的核心。BoxJenkins方法提供了一种根据序列的自相关和偏自相关图来识别ARIMA模型的方法。ARIMA的参数由三部分组成:p(自回归参数),d(差分数)和q(移动平均参数)。

识别ARIMA模型有以下三个规则:

•如果滞后n后ACF(自相关图)被切断,则PACF(偏自相关图)消失:ARIMA(0,d,n)确定MA(q)

•如果ACF下降,则滞后n阶后PACF切断:ARIMA(n,d,0),识别AR(p)

•如果ACF和PACF失效:混合ARIMA模型,需要区别

注意,即使引用相同的模型,ARIMA中的差异数也用不同的方式书写。例如,原始序列的ARIMA(1,1,0)可以写为差分序列的ARIMA(1,0,0)。同样,有必要检查滞后1阶自相关为负(通常小于-0.5)的过差分。差分过大会导致标准偏差增加。

以下是Apple时间序列中的一个示例:

•左上方以对数苹果股票价格的ACF表示,显示ACF缓慢下降(而不是下降)。该模型可能需要差分。

•左下角是Log Apple的PACF,表示滞后1处的有效值,然后PACF截止。因此,Log Apple股票价格的模型可能是ARIMA(1,0,0)

•右上方显示对数Apple的差分的ACF,无明显滞后(不考虑滞后0)

•右下角是对数Apple差分的PACF,无明显滞后。因此,差分对数Apple序列的模型是白噪声,原始模型类似于随机游走模型ARIMA(0,1,0)

image.png

image.png

在拟合ARIMA模型中,简约的思想很重要,在该模型中,模型应具有尽可能小的参数,但仍然能够解释级数(p和q应该小于或等于2,或者参数总数应小于等于鉴于Box-Jenkins方法3)。参数越多,可引入模型的噪声越大,因此标准差也越大。


因此,当检查模型的AICc时,可以检查p和q为2或更小的模型。要在R中执行ACF和PACF,以下代码:

•对数的ACF和PACF

acf.appl=acf(log.appl)
pacf.appl=pacf(log.appl,main='PACF Apple',lag.max=100

•差分对数的ACF和PACF

acf.appl=acf(difflog.appl,main='ACF Diffe 
pacf.appl=pacf(difflog.appl,main='PACF D

除了Box-Jenkins方法外,AICc还提供了另一种检查和识别模型的方法。AICc为赤池信息准则,可以通过以下公式计算:

AICC = N log(SS / N)+ 2(p + q + 1) N /(N – p – q – 2),如果模型中没有常数项

AICC = N log(SS / N)+ 2(p + q + 2) N /(N – p – q – 3),如果模型中为常数项

N:求异后的项目数(N = n – d)

SS:差平方和

p&q:自回归模型和移动平均模型的顺序

根据这种方法,将选择具有最低AICc的模型。在R中执行时间序列分析时,程序将提供AICc作为结果的一部分。但是,在其他软件中,可能需要通过计算平方和并遵循上述公式来手动计算数字。当使用不同的软件时,数字可能会略有不同。

Model  AICc 
0 1 0  -6493
1 1 0  -6491.02
0 1 1  -6493.02
1 1 1  -6489.01
0 1 2  -6492.84
1 1 2  -6488.89
2 1 0  -6491.1
2 1 1  -6489.14
2 1 2  -6501.86

基于AICc,我们应该选择ARIMA(2,1,2)。这两种方法有时可能会得出不同的结果,因此,一旦获得所有估计,就必须检查和测试模型。以下是在R中执行ARIMA的代码:

summary(arima212)

参数估计

要估算参数,请执行与先前所示相同的代码。结果将提供模型每个元素的估计。使用ARIMA(2,1,2)作为选定模型,结果如下:

Series: log.appl
ARIMA(2,1,2)
Coefficients:
 ar1 ar2 ma1 ma2
 -0.0015 -0.9231 0.0032 0.8803
s.e. 0.0532 0.0400 0.0661 0.0488
sigma^2 estimated as 0.000559: log likelihood=3255.95
AIC=-6501.9 AICc=-6501.86 BIC=-6475.68

完整模型:

(Yt –Yt-1)= -0.0015(Yt-1 – Yt-2)-0.9231(Yt-2 – Yt-3)+0.0032εt-1+0.8803εt-2+εt

注意,当执行带差分的ARIMA模型时,R将忽略均值。以下是Minitab的输出:

Final Estimates of Parameters
Type Coef SE Coef T P
AR 1 0.0007 0.0430 0.02 0.988
AR 2 -0.9259 0.0640 -14.47 0.000
MA 1 0.0002 0.0534 0.00 0.998
MA 2 -0.8829 0.0768 -11.50 0.000
Constant 0.002721 0.001189 2.29 0.022
Differencing: 1 regular difference
Number of observations: Original series 1401, after differencing 1400
Residuals: SS = 0.779616 (backforecasts excluded)
MS = 0.000559 DF = 1395
Modified Box-Pierce (Ljung-Box) Chi-Square statistic
Lag 12 24 36 48
Chi-Square 6.8 21.2 31.9 42.0
DF 7 19 31 43
P-Value 0.452 0.328 0.419 0.516

请注意,根据我们编写代码的方式,R将对同一模型给出不同的估计。例如:arima(log.appl,order = c(2,1,2))

arima(difflog.appl,order = c(2,0,2))

从这两条代码行得出的ARIMA(2,1,2)的参数估计值在R中将有所不同,即使它引用的是同一模型。但是,在Minitab中,结果是相似的,因此对用户的混淆较少。

诊断检查

该过程包括观察残差图及其ACF和PACF图,并检查Ljung-Box结果。

如果模型残差的ACF和PACF没有显着滞后,则选择合适的模型。

image.png

image.png

残差图ACF和PACF没有任何明显的滞后,表明ARIMA(2,1,2)是表示该序列的良好模型。

此外,Ljung-Box测试还提供了另一种方法来仔细检查模型。基本上,Ljung-Box是一种自相关检验,其中它检验时间序列的自相关是否不同于0。换句话说,如果结果拒绝了假设,则意味着数据是独立且不相关的;否则,序列中仍然存在序列相关性,需要修改模型。

Modified Box-Pierce (Ljung-Box) Chi-Square statistic
Lag 12 24 36 48
Chi-Square 6.8 21.2 31.9 42.0
DF 7 19 31 43
P-Value 0.452 0.328 0.419 0.516

Minitab的输出显示p值均大于0.05,因此我们不能拒绝自相关性不同于0的假设。因此,所选模型是Apple股票价格的合适模型之一。


【视频】时间序列分析:ARIMA-ARCH / GARCH模型分析股票价格-2

https://developer.aliyun.com/article/1485748

相关文章
时间序列分析实战(二):时序的ARMA模型拟合与预测
时间序列分析实战(二):时序的ARMA模型拟合与预测
|
7月前
|
机器学习/深度学习 存储 数据建模
R语言中的时间序列分析模型:ARIMA-ARCH / GARCH模型分析股票价格
R语言中的时间序列分析模型:ARIMA-ARCH / GARCH模型分析股票价格
|
7月前
|
API vr&ar Python
Python 用ARIMA、GARCH模型预测分析股票市场收益率时间序列(上)
Python 用ARIMA、GARCH模型预测分析股票市场收益率时间序列
|
7月前
|
机器学习/深度学习 数据采集 数据可视化
python用回归、arima、随机森林、GARCH模型分析国债期货波动性、收益率、价格预测
python用回归、arima、随机森林、GARCH模型分析国债期货波动性、收益率、价格预测
|
7月前
|
vr&ar Python
Python 用ARIMA、GARCH模型预测分析股票市场收益率时间序列(下)
Python 用ARIMA、GARCH模型预测分析股票市场收益率时间序列
|
7月前
|
资源调度 数据挖掘 vr&ar
Python 用ARIMA、GARCH模型预测分析股票市场收益率时间序列(中)
Python 用ARIMA、GARCH模型预测分析股票市场收益率时间序列
|
7月前
|
机器学习/深度学习 数据挖掘 vr&ar
R语言时间序列:ARIMA / GARCH模型的交易策略在外汇市场预测应用
R语言时间序列:ARIMA / GARCH模型的交易策略在外汇市场预测应用
|
7月前
|
数据可视化
R语言ARMA GARCH COPULA模型拟合股票收益率时间序列和模拟可视化
R语言ARMA GARCH COPULA模型拟合股票收益率时间序列和模拟可视化
R语言ARMA GARCH COPULA模型拟合股票收益率时间序列和模拟可视化
|
7月前
|
机器学习/深度学习 数据可视化 Linux
ARIMA模型预测CO2浓度时间序列-python实现
ARIMA模型预测CO2浓度时间序列-python实现
|
7月前
ARIMA、ARIMAX、 动态回归和OLS 回归预测多元时间序列
ARIMA、ARIMAX、 动态回归和OLS 回归预测多元时间序列
ARIMA、ARIMAX、 动态回归和OLS 回归预测多元时间序列