R语言单位根、协整关系Granger因果检验、RESET分析汇率在岸和离岸数据时间序列

简介: R语言单位根、协整关系Granger因果检验、RESET分析汇率在岸和离岸数据时间序列

全文链接:http://tecdat.cn/?p=32188


单位根的随机性趋势与协整关系对实证分析中时间序列的影响是不容小觑的点击文末“阅读原文”获取完整代码数据


检验的目的在于更好的分辨数据特性、甄选模型,以达到或能预测或能证实因果关系或否定以上两者的结果。


单位根检验


基本思路

在进行时间序列分析时,传统上要求所用的时间序列必须是平稳的,否则将会产生伪回归。但是,在现实经济中的时间序列通常是非平稳的,因为各类经济变量一般都随经济增长而产生周期性变化。如果直接采用最小二乘法进行回归分析,即使两个变量之间不存在相关性,也有可能得到一个很高的拟和优度,这就是所谓的谬误回归现象。

为了帮助客户使回归得到的方程更有意义,可以通过差分得到平稳化的序列,然后再进行回归。为了判断时间序列是否平稳,可以使用单位根检验。对于时间序列yt可用如下自回归模型检验单位根。


协整检验


基本思路:

20世纪80年代,Engle和Granger等人提出了协整(Co-integration)的概念,指出两个或多个非平稳(non-stationary)的时间序列的线性组合可能是平稳的或是较低阶单整的。有些时间序列,虽然它们自身非平稳,但其线性组合却是平稳的。非平稳时间序列的线性组合如果平稳,则这种组合反映了变量之间长期稳定的比例关系,称为协整关系。协整关系表达的是两个线性增长量的稳定的动态均衡关系,更是多个线性增长的经济量相互影响及自身演化的动态均衡关系。协整分析是在时间序列的向量自回归分析的基础上发展起来的空间结构与时间动态相结合的建模方法与理论分析方法。

实证模型

本文选取了BLOOMBERG系统报价的一个月期和一年期的人民币离岸NDF汇率收盘价、以及国家外汇管理局公布的人民币对美元即期汇率中间价,分别作为人民币离岸NDF汇率与境内人民币汇率的代理变量。考虑到NDF监管政策与我国新的《外汇管理条例》可能对人民币离岸NDF与境内人民币即期汇率的影响,本文样本人民币离岸NDF汇率数据来源于BLOOMBERG系统,即期汇率数据来源于国家外汇管理局网站。由于境内外节假日的不同,当境内外人民币汇率日期不匹配时,将对应日期的数据删除。由于境内外节假日的不同,当境内外人民币汇率日期不匹配时,将对应日期的数据删除。


数据:USDCNH在岸与USDCNH离岸月度同比数据


读取数据

library(openxlsx)
setwd("E:/USDCNH离岸")
#在岸
data1=read.csv("历史在岸人民币美元.csv")
#离岸
data2=read.csv("USDCNH离岸.csv")

1、单位根检验


需要进行季节调整,给出输出结果

(1)若存在单位根,用差分后序列进行2、3、4 步;

(2)若不存在单位根,就用原序列。


USDCNH在岸数据

首先,对USDCNH在岸数据和离岸数据时间序列进行线性拟合,看数据随时间变化的趋势。对在岸数据的线性拟合模型结果如下。从下面的结果可以看到时间对在岸数据有较大影响,因此该数据不是平稳的序列。

## Residuals:  
##      Min       1Q   Median       3Q      Max  
## -0.15097 -0.06398  0.01261  0.06016  0.12913  
##  
## Coefficients:  
##              Estimate Std. Error t value Pr(>|t|)     
## (Intercept) 6.040e+00  9.331e-03  647.33   <2e-16 ***  
## t           1.565e-03  6.685e-05   23.41   <2e-16 ***  
## ---  
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1  
##  
## Residual standard error: 0.0722 on 239 degrees of freedom  
## Multiple R-squared:  0.6963, Adjusted R-squared:  0.695  
## F-statistic: 547.9 on 1 and 239 DF,  p-value: < 2.2e-16

对USDCNH在岸数据和离岸数据时间序列进行ADF单位根检验,选择水平值,包含趋势项和漂移项,最大滞后期数按照SIC(Schwarz Info Criterinon)准则,单位根检验结果如下:

##  Augmented Dickey-Fuller Test  
##  
## data:  x  
## Dickey-Fuller = -1.3371, Lag order = 0, p-value = 0.1453  
## alternative hypothesis: explosive
## Residuals:  
##       Min        1Q    Median        3Q       Max  
## -0.036883 -0.004066 -0.001072  0.002078  0.109471  
##  
## Coefficients:  
##               Estimate Std. Error t value Pr(>|t|)   
## (Intercept)  8.724e-02  6.561e-02   1.330   0.1849   
## z.lag.1     -1.452e-02  1.086e-02  -1.337   0.1825   
## tt           3.925e-05  2.032e-05   1.932   0.0545 .  
## ---  
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1  
##  
## Residual standard error: 0.01209 on 237 degrees of freedom  
## Multiple R-squared:  0.01648,    Adjusted R-squared:  0.008183  
## F-statistic: 1.986 on 2 and 237 DF,  p-value: 0.1395  
##  
##  
## Value of test-statistic is: -1.3371 2.6159 1.9859  
##  
## Critical values for test statistics:  
##       1pct  5pct 10pct  
## tau3 -3.99 -3.43 -3.13  
## phi2  6.22  4.75  4.07  
## phi3  8.43  6.49  5.47

接受原假设H 0 :序列x t 非平稳

数据差分

本文用 ADF (Augmented Dick-ey-Fuller Test) 单位根检验来检验时间序列的平稳性。上面列出了人民币在岸汇率水平变量的单位根检验结果。从结果中 可以看到人民币 在岸汇率的 ADF 统计量均大于临界值, 且 P值都较大, 表明它们是非平稳变量, 而它们的一阶差分值的 ADF 统计量均小于临界值, 且 P 值都是 0,表明它们的一阶差分变量是平稳的, 因此可知在岸汇率均为一阶单整过程, 即 I (1) 过程。

USDCNH离岸数据

首先,对USDCNH离岸数据时间序列进行线性拟合,看数据随时间变化的趋势。对在岸数据的线性拟合模型结果如下。从下面的结果可以看到时间对离岸数据有较大影响,因此该数据不是平稳的序列。

## Residuals:  
##       Min        1Q    Median        3Q       Max  
## -0.122283 -0.059687 -0.008484  0.067933  0.158961  
##  
## Coefficients:  
##              Estimate Std. Error t value Pr(>|t|)     
## (Intercept) 6.153e+00  9.250e-03  665.22   <2e-16 ***  
## t           1.269e-03  6.627e-05   19.14   <2e-16 ***  
## ---  
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1  
##  
## Residual standard error: 0.07157 on 239 degrees of freedom  
## Multiple R-squared:  0.6053, Adjusted R-squared:  0.6037  
## F-statistic: 366.5 on 1 and 239 DF,  p-value: < 2.2e-16

首先,对USDCNH离岸数据时间序列进行ADF单位根检验,选择水平值,包含趋势项和漂移项,最大滞后期数按照SIC(Schwarz Info Criterinon)准则,单位根检验结果如下:

##  Augmented Dickey-Fuller Test  
##  
## data:  x  
## Dickey-Fuller = -1.8566, Lag order = 0, p-value = 0.3638  
## alternative hypothesis: explosive
 ##  
## ###############################################  
## # Augmented Dickey-Fuller Test Unit Root Test #  
## ###############################################  
##  
## Test regression trend  
##
## Residuals:  
##       Min        1Q    Median        3Q       Max  
## -0.078389 -0.007280 -0.002134  0.006500  0.182221  
##  
## Coefficients:  
##               Estimate Std. Error t value Pr(>|t|)   
## (Intercept)  1.910e-01  1.034e-01   1.847   0.0659 .  
## z.lag.1     -3.119e-02  1.680e-02  -1.857   0.0646 .  
## tt           5.848e-05  2.726e-05   2.145   0.0330 *  
## ---  
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1  
##  
## Residual standard error: 0.0185 on 237 degrees of freedom  
## Multiple R-squared:  0.01943,    Adjusted R-squared:  0.01115  
## F-statistic: 2.348 on 2 and 237 DF,  p-value: 0.09778  
##  
##  
## Value of test-statistic is: -1.8566 2.0347 2.348  
##  
## Critical values for test statistics:  
##       1pct  5pct 10pct  
## tau3 -3.99 -3.43 -3.13  
## phi2  6.22  4.75  4.07  
## phi3  8.43  6.49  5.47

因此,采用ADF检验分别对在岸与离岸汇率收益率序列进行单位根检验,结果表明各序列都是非平稳序列,一阶差分数据为平稳序列。


点击标题查阅往期内容


R语言EG(Engle-Granger)两步法协整检验、RESET、格兰杰因果检验、VAR模型分析CPI和PPI时间序列关系


01

02

03

04



由于,原来两个时间序列都是非平稳的,但经过二次差分后变为平稳序列,也就是说它们都是二阶单整的,满足协整检验的前提。因此,下面进行Granger因果检验。

这里我们采用Granger因果检验对上述在岸数据和离岸数据之间的因果关系进行检验。


2.检验协整关系——EG两步法


给出输出结果

(1)若存在长期协整,用VECM法线性过滤,利用利用过滤后的“残差成分”再进行3,4 步;

(2)若不存在长期协整,就不用过滤,直接进行3、4步。

由于在岸数据与离岸数据之间可能存在相互影响,以致采用简单的双变量协整检验,结果可能出现一定的偏差。为此,分别估计以在岸数据为被解释变量的双变量VECM模型和以离岸数据为被解释变量双变量VECM模型,得到基于VECM模型中在岸数据的回归残差和基于VECM模型中离岸数据的回归残差,进一步采用RESET检验等检验方法,对经VECM模型线性过滤后的残差进行检验。表的检验结果表明,所有检验均显著拒绝线性关系的原假设,这说明在岸数据与离岸数据并不是呈现线性的变化趋势,而可能是存在着显著的动态变化趋势。因此,有必要采用Granger因果关系检验,进一步考察在岸数据与离岸数据之间可能存在的关系。

## Residuals:  
##       Min        1Q    Median        3Q       Max  
## -0.090676 -0.005832 -0.000346  0.007055  0.097828  
##  
## Coefficients:  
##              Estimate Std. Error t value Pr(>|t|)     
## (Intercept) 0.0002001  0.0010342   0.194    0.847     
## USDCNH在岸  0.7911232  0.0848505   9.324   <2e-16 ***  
## ---  
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1  
##  
## Residual standard error: 0.01593 on 239 degrees of freedom  
## Multiple R-squared:  0.9667, Adjusted R-squared:  0.2637  
## F-statistic: 86.93 on 1 and 239 DF,  p-value: < 2.2e-16

从上面的结果可以看到长期均衡方程的拟合优度高达0.9667,说明该方程有很强的可靠性。通过该方程我们可以看到,USDCNH在岸与USDCNH离岸之间有显著的影响。USDCNH在岸每增加一个单位,USDCNH离岸增长0.7911232亿元。


绘制长期残差

基于VECM模型回归残差的检验结果表明在岸数据与离岸数据呈现的动态变化趋势,为了揭示在岸数据与离岸数据之间的关系,文章分别格兰杰因果检验方法,对经VECM模型线性过滤后的残差进行Granger因果关系检验,基于共同滞后阶数Lx=Ly,并将检验窗宽设置为e=1.5σ的检验结果如表所示


3、    检验——RESET 检验方法


##  RESET test  
##  
## data:  data$USDCNH离岸 ~ data$USDCNH在岸  
## RESET = 35.913, df1 = 1, df2 = 238, p-value = 7.585e-09

用RESET检验等检验方法,对经VECM模型线性过滤后的残差进行检验。的检验结果表明,所有检验均显著拒绝线性关系的原假设,这说明在岸数据与离岸数据并不是呈现线性的变化趋势,而可能是存在着显著的动态变化趋势。


4、    格兰杰因果检验


##           日期 USDCNH在岸 USDCNH离岸  
## 1   2015-01-05     0.0000     0.0000  
## 2   2015-01-06     0.0008    -0.0012  
## 3   2015-01-07     0.0013    -0.0150  
## 4   2015-01-08     0.0033     0.0041  
## 5   2015-01-09    -0.0006     0.0018  
## 6   2015-01-12    -0.0063    -0.0128  
。。。
## 228 2015-12-14     0.0137     0.0178  
## 229 2015-12-15     0.0064    -0.0155  
## 230 2015-12-16     0.0067    -0.0162  
## 231 2015-12-17     0.0131     0.0446  
## 232 2015-12-18     0.0057    -0.0108  
## 233 2015-12-21    -0.0061    -0.0055  
## 234 2015-12-22    -0.0007    -0.0255  
## 235 2015-12-23    -0.0015     0.0182  
## 236 2015-12-24     0.0024    -0.0009  
## 237 2015-12-25    -0.0042    -0.0014  
## 238 2015-12-28     0.0037     0.0182  
## 239 2015-12-29     0.0114     0.0154  
## 240 2015-12-30     0.0031    -0.0085  
## 241 2015-12-31     0.0041     0.0013

以进行格兰杰因果检验。对在岸和离岸汇率收益率序列进行Granger因果检验,最优滞后期数是根据AIC信息准则和SC信息准则确定的。在岸人民币汇率、离岸市场汇率的Granger因果关系检验结果见表。该结果显示:在岸人民币汇率和离岸市场人民币汇率具有双向溢出效应,两个市场可以相互引导汇率的变动,并且该变动信息在滞后七期以后可以在1%的显著性水平下影响对方市场当期的汇率。综合各市场之间的报酬溢出关系,认为人民币离岸市场位于价格主导地位,而且人民币离岸市场对在岸人民币汇率的引导滞后期较短。

##  Granger causality H0: USDCNH在岸 do not Granger-cause USDCNH离岸  
##  
## data:  VAR object var.2c  
## F-Test = 0.6178, df1 = 2, df2 = 468, p-value = 0.5396  
##  
##  
## $Instant  
##  
##  H0: No instantaneous causality between: USDCNH在岸 and USDCNH离岸  
##  
## data:  VAR object var.2c  
## Chi-squared = 64.173, df = 1, p-value = 1.11e-15
## $Granger  
##  
##  Granger causality H0: USDCNH离岸 do not Granger-cause USDCNH在岸  
##  
## data:  VAR object var.2c  
## F-Test = 9.2651, df1 = 2, df2 = 468, p-value = 0.0001132  
##  
##  
## $Instant  
##  
##  H0: No instantaneous causality between: USDCNH离岸 and USDCNH在岸  
##  
## data:  VAR object var.2c  
## Chi-squared = 64.173, df = 1, p-value = 1.11e-15

从检验统计量来看,拒绝“在岸数据不是离岸数据的Granger因果原因”的原假设,而都显著拒绝了“离岸数据不是在岸数据的Granger因果原因”的原假设,表明存在着由离岸数据到在岸数据的双向Granger因果关系。这说明离岸数据是引起在岸数据变化的Granger因果原因。意味着价格上升,可能通过生产链向下游的消费商品价格传导,从而加大物价上涨的压力,也增大了“成本推动型通货膨胀”引发的风险。即两个市场的人民币汇率存在双向的聚集度和持久度的波动溢出,该结果印证了人民币离岸市场由于自由化程度较高,没有政府外汇管制,在这两个市场间信息传递程度最高。

相关文章
|
3月前
|
数据采集 机器学习/深度学习 数据可视化
R语言从数据到决策:R语言在商业分析中的实践
【9月更文挑战第1天】R语言在商业分析中的应用广泛而深入,从数据收集、预处理、分析到预测模型构建和决策支持,R语言都提供了强大的工具和功能。通过学习和掌握R语言在商业分析中的实践应用,我们可以更好地利用数据驱动企业决策,提升企业的竞争力和盈利能力。未来,随着大数据和人工智能技术的不断发展,R语言在商业分析领域的应用将更加广泛和深入,为企业带来更多的机遇和挑战。
|
2月前
|
数据挖掘 C语言 C++
R语言是一种强大的统计分析工具,提供了丰富的函数和包用于时间序列分析。
【10月更文挑战第21天】时间序列分析是一种重要的数据分析方法,广泛应用于经济学、金融学、气象学、生态学等领域。R语言是一种强大的统计分析工具,提供了丰富的函数和包用于时间序列分析。本文将介绍使用R语言进行时间序列分析的基本概念、方法和实例,帮助读者掌握R语言在时间序列分析中的应用。
46 3
|
3月前
R语言基于表格文件的数据绘制具有多个系列的柱状图与直方图
【9月更文挑战第9天】在R语言中,利用`ggplot2`包可绘制多系列柱状图与直方图。首先读取数据文件`data.csv`,加载`ggplot2`包后,使用`ggplot`函数指定轴与填充颜色,并通过`geom_bar`或`geom_histogram`绘图。参数如`stat`, `position`, `alpha`等可根据需要调整,实现不同系列的图表展示。
|
3月前
|
数据采集 数据可视化 数据挖掘
R语言在金融数据分析中的深度应用:探索数据背后的市场智慧
【9月更文挑战第1天】R语言在金融数据分析中展现出了强大的功能和广泛的应用前景。通过丰富的数据处理函数、强大的统计分析功能和优秀的可视化效果,R语言能够帮助金融机构深入挖掘数据价值,洞察市场动态。未来,随着金融数据的不断积累和技术的不断进步,R语言在金融数据分析中的应用将更加广泛和深入。
|
4月前
|
机器学习/深度学习 数据采集 数据可视化
R语言在数据科学中的应用实例:探索与预测分析
【8月更文挑战第31天】通过上述实例,我们展示了R语言在数据科学中的强大应用。从数据准备、探索、预处理到建模与预测,R语言提供了完整的解决方案和丰富的工具集。当然,数据科学远不止于此,随着技术的不断发展和业务需求的不断变化,我们需要不断学习和探索新的方法和工具,以更好地应对挑战,挖掘数据的潜在价值。 未来,随着大数据和人工智能技术的普及,R语言在数据科学领域的应用将更加广泛和深入。我们期待看到更多创新的应用实例,为各行各业的发展注入新的动力。
|
4月前
|
数据采集 存储 数据可视化
R语言时间序列分析:处理与建模时间序列数据的深度探索
【8月更文挑战第31天】R语言作为一款功能强大的数据分析工具,为处理时间序列数据提供了丰富的函数和包。从数据读取、预处理、建模到可视化,R语言都提供了灵活且强大的解决方案。然而,时间序列数据的处理和分析是一个复杂的过程,需要结合具体的应用场景和需求来选择合适的方法和模型。希望本文能为读者在R语言中进行时间序列分析提供一些有益的参考和启示。
|
7月前
|
数据可视化 数据挖掘 API
【R语言实战】聚类分析及可视化
【R语言实战】聚类分析及可视化
|
7月前
|
机器学习/深度学习 数据可视化
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为2
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为
|
4月前
|
资源调度 数据挖掘
R语言回归分析:线性回归模型的构建与评估
【8月更文挑战第31天】线性回归模型是统计分析中一种重要且实用的工具,能够帮助我们理解和预测自变量与因变量之间的线性关系。在R语言中,我们可以轻松地构建和评估线性回归模型,从而对数据背后的关系进行深入的探索和分析。
|
4月前
|
机器学习/深度学习 数据采集
R语言逻辑回归、GAM、LDA、KNN、PCA主成分分类分析预测房价及交叉验证
上述介绍仅为简要概述,每个模型在实施时都需要仔细调整与优化。为了实现高度精确的预测,模型选择与调参是至关重要的步骤,并且交叉验证是提升模型稳健性的有效途径。在真实世界的房价预测问题中,可能还需要结合地域经济、市场趋势等宏观因素进行综合分析。
72 3