数据分享|Eviews用ARIMA、指数曲线趋势模型对中国进出口总额时间序列预测分析

简介: 数据分享|Eviews用ARIMA、指数曲线趋势模型对中国进出口总额时间序列预测分析

众自20世纪80年代至今,随着改革开放的深入以及中国最终加入WTO,我国的对外贸易实现了跨越式的发展,中国已经成为世界第一大出口国和第二大进口国,中国经济对世界经济做出了重大贡献点击文末“阅读原文”获取完整代码数据

相关视频

image.png

image.png

image.png

与此同时,中国经济自身的外贸依存度也已经达到了很高的水平,因此正确分析预测我国的进出口贸易额将对我国对外贸易的发展起着举足轻重的作用。

本文帮助客户在分析了我国出口总额的数据基础上查看文末了解数据免费获取方式,根据其数据特征建立ARIMA模型和指数曲线趋势外推模型,主要利用Eviews对模型进行检验分析,从而预测了中国出口贸易总额。

数据的选取与描述性统计

本文选取了进出口总额数据(X),(见图1)通过对数据的初步观察可得出:中国进出口总额带有明显的趋势性,这个社会经济现象可以看成是随机过程在现实中的一次样本实现。


cede689bf5b2a4141491cc15b97faaad.png

图中显示,中国进出口总额保持指数增长趋势,特别是1978年改革开放以后,呈现出较强劲的增长趋势。从中国进出口总额的变化特征来看,这是一个非平稳序列,明显呈现上升趋势。

9121b4eacaba40d2481ed4ca32f444d2.png

以下为利用软件相关过程:

第一步:读取中国进出口总额数据建模及预测

在workfile中新建序列im_ex,并录入数据(点击File/Import/Read Text-Lotus-Excel…,

找到相应的Excel数据集,打开数据集,出现如下图的窗口,在“Data order”选项中选择“By observation-series in columns”即按照观察值顺序录入 ,本例只有一列数据,在“Names for series or number if named in file”中输入序列的名字im_ex,点击ok,则录入了数据):

第二步:时序图判断平稳性

   双击序列im_ex,点击view/Graph/line,得到下列对话框:

得到如下该序列的时序图,由图形可以看出该序列呈指数上升趋势,直观来看,显著非平稳。

得到图1所示,中国进出口总额变化趋势图。

中国进出口总额的趋势模型应用

y序列显著非平稳,现对其一阶差分序列进行ADF检验。在对y的一阶差分序列进行ADF单位根检验之前,需要明确y的一阶差分序列的趋势特征。在Eviews命令框中输入相应的命令“series dy1=D(y)”就得到对数序列的一阶差分序列dy1,其时序图见下图

294fd5415967c52f0650fd369ee77591.png

检验结果见下图,可以看出在显著性水平0.05下,拒绝存在单位根的原假设,说明序列y的一阶差分序列是平稳序列,因此d=1


点击标题查阅往期内容


基于ARIMA、SVM、随机森林销售的时间序列预测



左右滑动查看更多

c5e1b55a10ee211925719b7e68d8b514.png

ccd8b705a2c30dc2800a1b0a6df64312.png

变量 检验类型 Adf统计量 5%临界值 Prob 结论
Ex-im C(0,0) 2.3275 -2.91  0.99 非平稳
D(ex-im) C(0,0) -4.839 -2.91 0.0002 平稳

在Eviews对话框中输入“series x=y-y(-1)”或“series x=y-y(-1)”,并点击“回车”,便得到了经过一阶差分处理后的新序列x,其时序图见下图,从直观上来看,序列x也是平稳的,这就可以对x序列进行ARMA模型分析了。

43d71b578a39ea1fcd4fb30ea9953ad0.png

结果如下:

ed9a9736c9a80489a5a7402a22ece89a.png

PACF为拖尾的,ACF二阶截尾,故模型为MA(2)。

接下来估计模型参数:

得到了以下结果:

e66b0ed41668b0d485020db6d768146f.png

对模型参数进行显著性检验,计算其T统计量,显然参数在5%的显著水平下拒绝零假设。

模型的适应性检验与预测

参数估计后,应对拟合模型的适应性进行检验,实质是对模型残差序列进行白噪声检验。若残差序列不是白噪声,说明还有一些重要信息没被提取,应重新设定模型。可以对残差进行纯随机性检验,也可用针对残差的检验。

残差序列采用拟合的ARMA(1,6)模型生成。

将该方程的残差序列定义为a_eq01_06_1即可,可以得到从1978至2012年采用拟合的ARMA(1,6)模型生成的残差序列。

a_eq01_06_1 (2)=x(2)-0.151676-0.785440*0+0.463391*0+0.428391*0-0.454978*0

这样得到的序列a_eq01_06_1即为ARMA(1,6)模型的残差序列,a_eq01_06_1序列的自相关偏自相关图如下:

d376d211e80f94b83c70bc0cac0b3f4c.png

(偏)相关函数值、以及Q-Stat及其p值显示,残差序列不存在自相关,为白噪声,因此模型是适合的模型。模型拟合图如下

57ad640a94b9514d319998a355205674.png

检验结果表明

LB统计量的P值均大于0.05(或其ACF均落在区间内),说明残差序列无自相关,模型为适应的。

接下来做模型预测:

首先需要扩展样本期,在命令栏输入expand 1952 2015,回车则样本序列长度就变成64了,且最后面4个变量值为空。在方程估计窗口点击Forecast,出现下图对话框,

(1)进行样本内(1978-2012)静态预测,在方程估计窗口点击Forecast,出现下图对话框,预测序列记为xf_static_eq01_06_1,预测方法选择“Static forecast”,预测样本区间为“1952-2015”,点击OK,得到下列预测图

76858e650dbdfeb6be255085b4d1517c.png

(2)将序列的估计值x_fit_eq01_06_1和这里的静态预测序列xf_static_eq01_06_1以组的形式打开,并将组命名为x_fit_xf_static,组序列图形如下

65160bf7911c8d20a618434d5f9d8d74.png

可见,样本内的静态预测序列值严格落在拟合值序列x_fit的曲线上,说明在样本期内(1978-2012)静态预测值与模型的拟合值(估计值)是相等的。

(3)进行样本外动态预测,在方程估计窗口点击Forecast

预测序列记为xf_dynamic_eq01_06_1,预测方法选择“Dynamic forecast”,预测样本区间为样本外区间“2012-2015”,点击OK,得到下列预测图

537503ec4c2551aec00cc75291543715.png

(4)建立新的序列x_fit_f存放序列的静态和动态预测值,将序列xf_dynamic_eq01_06_1中第2012-2015年的数值复制到序列x_fit_f的对应位置,这样得到的序列x_fit_f就是序列x的预测值。

(5)将序列的实际值x和这里的预测序列x_fit_f以组的形式打开,并将组命名为x_x_fit_f,组序列图形,即x的实际值与预测值图形如下

17e420946c0345695949a77c0d1d2856.png

95f4021026f4ef3b048f90ecd027197d.png

指数平滑模型

除了趋势拟合外,平滑法也是消除短期随机波动反应长期趋势的方法,而其平滑法可以追踪数据的新变化。平滑法主要有移动平均方法和指数平滑法两种,这里主要使用指数平滑方法。

对已经平稳了的时间序列,通过Eviews进行指数平滑。

步骤如下:

feb82ff4ead97f9f5f785d3257155048.png

给定方法为选择使残差平方和最小的平滑系数,该例中平滑系数0.88,超过0.5用一次平滑效果不太好

edcc84a7c14d59676cbd7d79c610a7d5.png

e8d207850ea845e9d124589790ff8246.png

可以看出,平滑系数为0.1 ,修匀或者趋势预测效果不错。

dc0915850559caac52b860b19377340f.png

结论

2005 年进口总额预测值6438.752 亿美元, 根据 《 海关统计》 数据, 2005年两项指标实际值分别为63169.8亿元、6601亿美元, 误差分别为1.66% , 2.45% 0误差非常之小, 因此预测模型有相当的可信度。时间序列预测法是一种重要的预测方法, 其模型比较简单 , 对资料的要求比较单一, 只需变量本身的历史数据, 在实际中有着广泛的适用性。

相关文章
|
6月前
|
机器学习/深度学习 数据可视化 安全
Python随机森林、线性回归对COVID-19疫情、汇率数据预测死亡率、病例数、失业率影响可视化(下)
Python随机森林、线性回归对COVID-19疫情、汇率数据预测死亡率、病例数、失业率影响可视化
|
6月前
|
机器学习/深度学习 数据可视化 Python
Python随机森林、线性回归对COVID-19疫情、汇率数据预测死亡率、病例数、失业率影响可视化(上)
Python随机森林、线性回归对COVID-19疫情、汇率数据预测死亡率、病例数、失业率影响可视化
|
6月前
|
存储 数据挖掘
R语言用GARCH模型波动率建模和预测、回测风险价值 (VaR)分析股市收益率时间序列
R语言用GARCH模型波动率建模和预测、回测风险价值 (VaR)分析股市收益率时间序列
|
6月前
|
算法 数据可视化 数据挖掘
R语言指数平滑预测法分析南京出租车打车软件空载率时间序列补贴政策可行性
R语言指数平滑预测法分析南京出租车打车软件空载率时间序列补贴政策可行性
|
6月前
|
算法
R语言MCMC-GARCH、风险价值VaR模型股价波动分析上证指数时间序列
R语言MCMC-GARCH、风险价值VaR模型股价波动分析上证指数时间序列
R语言MCMC-GARCH、风险价值VaR模型股价波动分析上证指数时间序列
|
6月前
|
数据可视化 Perl
R语言: GARCH模型股票交易量的研究道琼斯股票市场指数
R语言: GARCH模型股票交易量的研究道琼斯股票市场指数
|
6月前
|
vr&ar
时间序列和ARIMA模型预测拖拉机销售的制造案例研究
时间序列和ARIMA模型预测拖拉机销售的制造案例研究
时间序列和ARIMA模型预测拖拉机销售的制造案例研究
|
6月前
|
机器学习/深度学习 算法
R语言用随机森林模型的酒店收入和产量预测误差分析
R语言用随机森林模型的酒店收入和产量预测误差分析
|
6月前
|
安全 vr&ar
R语言非线性动态回归模型ARIMAX、随机、确定性趋势时间序列预测个人消费和收入、用电量、国际游客数量
R语言非线性动态回归模型ARIMAX、随机、确定性趋势时间序列预测个人消费和收入、用电量、国际游客数量
|
6月前
|
数据可视化
Eviews用向量自回归模型VAR实证分析公路交通通车里程与经济发展GDP协整关系时间序列数据和脉冲响应可视化
Eviews用向量自回归模型VAR实证分析公路交通通车里程与经济发展GDP协整关系时间序列数据和脉冲响应可视化