前言
时间序列是指将对某一个或某一组统计指标 x(t)的在一系列时刻 t1,t2,…,tn 的观察 值按照时间顺序排列而组成的序列,用于解释变量和相互关系的数学表达式,也成为 动态数据,在自然,经济及社会等领域都有重要的应用。
时间序列分析与传统的回归问题有着较大的区别,研究方法和应用范围也不同, 其主要体现在:
1、时间序列是跟时间有关的。所以基于线性回归模型的假设:观察结果是独立的。在这种情况下是不成立的。
2、随着上升或者下降的趋势,更多的时间序列出现季节性趋势的形式。
现实生活中对于一个观察值序列,我们往往无法直观的观测出其变化趋势和季节 性波动规律,所以需要进行时间序列的数据处理9操作,使得数据趋向平稳化和随机 化。具体方法是对观察值序列进行平稳性和纯随机性检验,根据检验结果将序列分为 不同的类型,进而采取不同的分析方法。
时间序列的预处理
(1)平稳化处理
平稳化处理就是使得观察值序列围绕一个常数上下波动并且波动范围有限,即有 常数均值和常数方差。如果观察值序列具有明显的周期性或者趋势性,那它将不是平 稳序列,这个时候就需要对其进行平稳化处理,目前,常采用的检验平稳性的方法有 三种:
a.时序图检验: 即将观察值序列按照时间为 x 轴,值为 y 轴作折线图,观察,观 察图形是否有明显的周期性或趋势性。
b.利用自相关、偏相关系数检验: 自相关系数度量的是同一事件在两个不同时期 之间的相关程度,偏相关系数是在排除了其他变量的影响下计算变量间的相关系数。 使用统计工具可以计算并画出时间序列的自相关图及偏相关图,通过分析可以判断该 序列是否为平稳序列。
c.单位根检验: 又称 ADF 检验,是指检验序列中是否存在单位根,如果存在单位 根则原序列是非平稳序列。它是一种较为常用的单位根检验方法,它的原假设为序列 非平稳,即具有单位根,而对于一个平稳的时间序列,判断是否拒绝原假设就需要在 给定的置信水平上显著,若检验结果中 p 值非常接近于 0(小于 0.05),则基本可认 定为序列平稳。
对于非平稳序列,可以通过 k 阶差分10将数据转化为平稳序列,从而使其适用于 相关模型。如果观察值序列经过 k 阶差分运算之后具有了平稳性,则完成序列平稳化 操作,处理后的序列就可应用于相关时间序列模型进行分析,例如 ARIMA 模型等。
(2)随机化处理
如果观察值序列为纯随机序列11,则认为序列在进行完全无序的随机波动,可以 终止对该序列的分析。白噪声序列是没有信息可提取的平稳序列,对于此类观察值序 列,它的均值和方差是常数,通常通过建立一个线性模型来拟合该序列的发展趋势, 借此来提取出有用信息以适用于相关时间序列模型。
平稳时间序列建模
在观察值序列经过平稳化与随机化处理之后,成为了平稳非白噪声序列,满足了 时间序列的建模的要求,针对平稳时间序列的建模步骤如下:
1.初步确定模型中可能的参数值组合:根据平稳后的时间序列自相关(ACF)及 偏相关图(PACF)确定模型类别及参数,若平稳序列的偏相关图是截尾12的,而自相 关图是拖尾13的,可断定序列适合 AR 模型;若平稳序列的偏相关图是拖尾的,而自 相关图是截尾的,则可断定序列适合 MA 模型;若平稳序列的偏相关图和自相关图均是拖尾的,则序列适合 ARMA 模型。同时根据 ACF 与 PACF 图确定各项参数的可能 取值,组成待选的几组参数值组合供后续步骤进行选择。
2.模型检验:根据第一步中所选定的参数组合来分别构建模型,并使用时间序列 模型的选择标准来比较各模型的优劣,主流的选择标准如下: