数学建模——平稳时间序列分析方法

简介: 数学建模——平稳时间序列分析方法

1、平稳性的Daniel检验

(1)Spearman相关系数假设检验

设二维总体(X,Y)的样本观测值为:(x1,y1),(x2,y2),…,(xn,yn), 得各分量X,Y的样本为(x1,…,xn),(y1,…,yn),设(x1,…,xn)的秩统计量为R1,R2,…,Rn;(y1,y2,…,yn)的秩统计量为S1,S2,…,Sn。当X,Y紧密相关时,这两组秩统计量也是紧密相关的

向量的秩:

向量的秩是指矩阵中非零行向量组成的最大线性无关组的向量个数。在线性代数中,我们常常将向量表示为列向量,也即 n×1的矩阵。

一个矩阵的秩是指它的列向量或行向量中线性无关的向量的个数。可以用初等变换将矩阵变换为行最简形,行最简形的矩阵就是阶梯型矩阵。阶梯型矩阵的非零行的个数即为矩阵的秩。

对于 n × m 的矩阵 A,它的秩记作 rank(A)。秩的性质包括:

1. rank(A) ≤ min(n, m),即矩阵的秩不会超过它的行数和列数中的较小值。

2. 对于同型矩阵 A 和 B,如果 A 可以通过基本行(列)运算转换为 B,那么它们的秩相等。

3. 对于同型矩阵 A 和 B,有 rank(A + B) ≤ rank(A) + rank(B)。

秩的求解方法包括高斯消元法、矩阵的特征值特征向量等。

(x1,…,xn)的秩统计量为R1,R2,…,Rn:

在统计学中,对于给定的一组数据 (x1, x2, ..., xn),可以计算出一系列的秩统计量 R1, R2, ..., Rn,用于描述数据的排序性质。每个秩统计量 Ri 表示对应数据 xi 在原始数据中的排名。

秩统计量常用于非参数统计方法,特别是在样本数据不服从正态分布或具有明显偏斜的情况下。它们提供了一种基于排序的方法来分析数据,不受异常值的影响,并可以在不依赖具体分布的情况下得到一些推断性的结论。

以下是对每个秩统计量的解释:

- R1 表示 x1 在排序后的数据中的排名。

- R2 表示 x2 在排序后的数据中的排名。

- ...

- Rn 表示 xn 在排序后的数据中的排名。

对于具体的数据样本,可以通过对原始数据进行排序,然后分配相应的秩统计量来计算每个数据的排名。排名方式可以根据需要选择是按升序还是降序进行排列。

通过计算秩统计量,可以进行一系列非参数的统计检验、回归分析和描述性统计分析,例如秩和检验、秩相关分析和秩和相关系数等。这些方法可以提供一种有效的手段来处理各种类型的数据,特别是对于小样本或不满足正态分布假设的情况下。

定义Spearman相关系数

经过运算,可以证明

对Spearman相关系数,可以作假设检验:

在H0成立时,统计量

对给你的显著水平α,查自由度为n-2的t分布的临界值tα/2(n-2),当|T|≤tα/2(n-2)时,接受H0,否则决绝H0.

(2)时间序列平稳性的Danniel假设检验

设时间序列样本a1,a2,…,an为Xt的样本,记at的秩为Rt=R(at),考虑变量(t,Rt),t=1,2,…,n的Spearman相关系数为

构造统计量

作假设检验:H0:序列Xt平稳;H1:序列Xt非平稳(上升或下降)

(H0的意思t和Rt不相关,即相关系数为0,H1的意思t和Rt相关,即Rt随t增大呈线性递增或递减)

Danniel检验方法:对给定的显著系数α,查自由度为n-2的t分布的临界值tα/2(n-2),若统计量T满足|T|>tα/2(n-2),则拒绝H 0,即认为序列非平稳,若|T|≤tα/2(n-2),接受H0,即Xt是平稳的。

案例

月份t

1

2

3

4

5

6

销售收入yt

533.8

574.6

606.9

649.8

705.1

772.0

月份t

7

8

9

10

11

销售收入yt

816.4

892.7

963.9

1015.1

1102.7

用AR模型预测12月份的销售额。

【模型分析】

1、原始数据at的平稳性检验

设1-11月份销售数据为at,根据公式计算得到Spearman相关系数为qt=1.根据公式

α=0.05,计算得到T统计量为+∞,即|T|> tα/2(11-2)=2.2622,即拒绝H0,认为Xt非平稳。即at非平稳时间序列。

at=[533.8 574.6 606.9 649.8 705.1 772 816.4 892.7 963.9 1015.1 1102.7];
Rt=tiedrank(at);
n=length(Rt);
t=1:n;
dt=t-Rt;
qt=1-6/n/(n^2-1)*sum(dt.^2);
T=qt*(n-2)^0.5/(1-qt^2)^0.5;
2、一阶差分序列的平稳性检验

令bt=at-at-1,t=2,3,…,11,将bt代入【4】和【5】,计算得到T统计量为T= 3.6934>tα/2(10-2)=2.3,即bt也非平稳序列。

at=[533.8 574.6 606.9 649.8 705.1 772 816.4 892.7 963.9 1015.1 1102.7];
bt=diff(at);
Rt=tiedrank(bt);
n=length(Rt);
t=1:n;
dt=t-Rt;
qt=1-6/n/(n^2-1)*sum(dt.^2);
T=qt*(n-2)^0.5/(1-qt^2)^0.5;
3、二阶差分序列的平稳性检验

取ct=bt-bt-1,t=2,3,…,10,将ct代入【4】和【5】,计算,得到统计量T= 0.4934<tα/2(9-2)=2.36,即ct是平稳序列。

at=[533.8 574.6 606.9 649.8 705.1 772 816.4 892.7 963.9 1015.1 1102.7];
bt=diff(at);
ct=diff(bt);
Rt=tiedrank(ct);
n=length(Rt);
t=1:n;
dt=t-Rt;
qt=1-6/n/(n^2-1)*sum(dt.^2);
T=qt*(n-2)^0.5/(1-qt^2)^0.5;
4、建立AR(2)模型

根据上面的检验,可建立自回归模型AR(2)对at进行预测:e1,e2是待定参数,εt是随机扰动。

【模型求解】

根据表中数据,采用最小二乘拟合,求得模型为

at=[533.8 574.6 606.9 649.8 705.1 772 816.4 892.7 963.9 1015.1 1102.7];
m=ar(at',2);
>> m
m =
Discrete-time AR model:  A(z)y(t) = e(t)
  A(z) = 1 - 1.95 z^-1 + 0.9431 z^-2  

将a10,a11代入上公式,预测12月份销售额为a12=1192.9。并将预测值和实测值对比显示在下图。

at=[533.8 574.6 606.9 649.8 705.1 772 816.4 892.7 963.9 1015.1 1102.7];
for k=3:12
    at1(k)=1.95*at(k-1)-0.9431*at(k-2);
end
t=1:9;
at=at(3:end);
at1=at1(3:end-1);
plot(t,at,‘*’,t,at1,‘+’),legend(‘实测值’,‘预测值')

另外:matlab时间序列工具箱有AR(2)拟合函数m=ar(at',2);


相关文章
|
8月前
|
机器学习/深度学习 数据可视化 Python
机器学习之利用线性回归预测波士顿房价和可视化分析影响房价因素实战(python实现 附源码 超详细)
机器学习之利用线性回归预测波士顿房价和可视化分析影响房价因素实战(python实现 附源码 超详细)
554 0
|
Serverless
数学建模——确定性时间序列分析方法(一)
数学建模——确定性时间序列分析方法
184 0
|
8月前
|
机器学习/深度学习 算法
MATLAB随机森林优化贝叶斯预测分析汽车燃油经济性
MATLAB随机森林优化贝叶斯预测分析汽车燃油经济性
|
8月前
|
数据可视化
matlab用高斯曲线拟合模型分析疫情数据
matlab用高斯曲线拟合模型分析疫情数据
|
8月前
|
存储
R语言分布滞后非线性模型(DLNM)研究发病率,死亡率和空气污染示例
R语言分布滞后非线性模型(DLNM)研究发病率,死亡率和空气污染示例
|
8月前
|
大数据 vr&ar Windows
R语言使用ARIMAX预测失业率经济时间序列数据
R语言使用ARIMAX预测失业率经济时间序列数据
|
8月前
R语言相关分析和稳健线性回归分析
R语言相关分析和稳健线性回归分析
数学建模——确定性时间序列分析方法(二)
数学建模——确定性时间序列分析方法
100 0
Transformer 时间序列预测 价格预测产量预测 精讲完整代码数据 毕业设计
Transformer 时间序列预测 价格预测产量预测 精讲完整代码数据 毕业设计
346 0
|
机器学习/深度学习 数据采集 人工智能
金融时间序列预测方法合集:CNN、LSTM、随机森林、ARMA预测股票价格(适用于时序问题)、相似度计算、各类评判指标绘图(数学建模科研适用)
金融时间序列预测方法合集:CNN、LSTM、随机森林、ARMA预测股票价格(适用于时序问题)、相似度计算、各类评判指标绘图(数学建模科研适用)