R语言提取时间序列的周期性成分应用EMD,小波滤波器,Baxter过滤器等

简介: R语言提取时间序列的周期性成分应用EMD,小波滤波器,Baxter过滤器等

介绍

对商业周期的分析需要提取时间序列的周期性成分,该时间序列通常也受到诸如潜在趋势或噪声等其他因素的影响。本文介绍了一些在最近的文献中用于从给定系列中提取商业周期的方法。它基于Stock and Watson(1999)在“宏观经济学手册”中关于商业周期的章节。我还介绍了相对较新的方法,如小波滤波器或经验模式分解,这些方法未在手册中介绍。由于这篇文章的重点是在R中实现某些过滤技术,我不会涉及数学。相反,我将参考各自的文献。对于这些例子,我使用了美国实际GDP的季度数据,这是我直接从FRED获得的。

names(gdp) <- c("Time","GDP") # Rename variables

gdp[,"GDP"] <- log(gdp[,"GDP"]) # Take logs

为了直观地了解提取时间序列的周期性成分意味着什么,请查看下图中随时间变化的对数实际GDP的发展情况。

library(reshape2)

ggplot(gdp,aes(x=Time,y=GDP)) + geom_line(size=.5) + theme_classic() + labs(title="Log Real US GDP")



数据有明显的增长趋势,到目前为止似乎逐渐变小。此外,该系列似乎以一种或多或少的常规方式围绕这一趋势波动。该系列与趋势的偏差非常小,这种偏差经常发生,但也有相当大的偏差,这种偏差可能会持续几个后续时期。后者是与商业周期分析相关的波动。


时间趋于衰退

从一系列中排除趋势的第一种方法是在时间变量上回归感兴趣的变量并获得剩余值。这些在下图中绘制,其中线性趋势被移除。

dat <- data.frame("Time"=gdp[,"Time"],"Linearly.Detrended"=time.detrend)

ggplot(dat,aes(x=Time,y=Linearly.Detrended)) + geom_hline(yintercept=0,colour="grey80") + geom_line(size=.5) + theme_classic() + labs(title="Linearly Detrended",y="")


这种方法相对有争议,因为它假设存在一个恒定的线性时间趋势。正如我们上面所看到的,鉴于趋势增长率随时间的稳步下降,这种情况不太可能发生。然而,仍然可以假设时间趋势的不同函数形式,例如添加二次项,以摆脱趋势。这种方法的另一个缺点是它只能排除趋势,而不能排除噪声,即系列中的非常小的波动。


差分

接下来的方法是采用第一个差异,因为它通常被教导以获得固定的时间序列。这假设数据是不稳定的。取得第一个差异的结果显示在下图中,其中它也与时间趋势系列进行比较。差异数据在零线附近波动得更多,但它也包含很多噪声。



 g <- melt(dat,id.vars="Time",na.rm=TRUE)

levels(g[,2]) <- c("Linear Trend","First Difference")



#定义画图函数

plot.cycles <- function(d,t) {



axis.line=element_line(size=.3,colour="black"), #

axis.text=element_text(colour="black"), #

panel.grid=element_blank()) #

}



# 画图

plot.cycles(d=g,t="Linearly Detrended vs. First Difference")

Hodrick Prescott过滤器

Hodrick和Prescott(1981)开发了一种滤波器,它将时间序列分为趋势,周期和噪声分量。该hpfilter功能包含在mFilter包中,需要时间序列和平滑参数。文献表明后者的值为1600。但是,也可以选择更高的值。下图显示了Hodrick-Prescott滤波器获得的实际GDP的周期性成分值,并将其与线性去趋势系列的值进行了比较。两个系列的行为看起来非常相似,只是HP系列在零附近波动较大,而线性去趋势系列仍然包含趋势的组成部分。此外,循环HP系列还包括一些类似噪音的组件。

dat <- cbind(dat,data.frame("Hodrick.Prescott"=hp))

g <- melt(dat[,c(1,4,3)],id.vars="Time",na.rm=TRUE)

levels(g[,2]) <- c("Hodrick Prescott","Linearly Detrended")



plot.cycles(g,"Hodrick Prescott vs. Linearly Detrended")

Baxter过滤器

Baxter和King(1994,1999)提出了一种滤波器,它可以产生与HP滤波器类似的结果,但它可以消除上面显示的许多类似噪声的行为。该功能bkfilter也包含在mFilter包中。它需要系列,周期数量的下限和上限,假定周期发生(plpu),以及平滑因子nfix。文献(参见NBER,Stock和Watson(1999))表明商业周期持续6至32个月。这些值用于指定循环周期的下限和上限。BK滤波器的结果如下图所示。该方法的一个相对系列的缺点是平滑因子导致在系列的开始和结束时观察的丢失。这可能是小样本的问题。

dat <- cbind(dat,data.frame("Baxter.King"=bk))

g <- melt(dat[,c(1,5,4)],id.vars="Time",na.rm=TRUE)

levels(g[,2]) <- c("Baxter King","Hodrick Prescott")



plot.cycles(g,"Baxter King vs. Hodrick Prescott")

小波滤波器

Yogo(2008)提出使用小波滤波器从时间序列数据中提取商业周期。这种方法的优点是该功能不仅可以提取系列的趋势,周期和噪声,而且可以更加具体地说明周期发生的周期。然而,由于该技术只能捕获2的幂的周期性,即2,4,8,16,32等,所以没有完全的自由度。

R中的方法实现也很简洁,但在使用之前需要一些额外的数据转换。一个有用的功能包含在waveslim包中并被称为mra(“多分辨率分析”)。它需要时间序列的不同版本和分解的深度。

该函数给出了多个系列,必须将它们累积起来cumsum,将它们转换回反映周期性模式的数据。此外,一些系列可以结合使用rowSums。当应该一起分析持续8到16和16到32个周期的周期时,这很有用,如下图所示。毫不奇怪,小波滤波器产生与BK滤波器类似的结果,因为循环周期的上限在两者中相等,下限仅相差2。

g <- melt(dat[,c(1,6,5)],id.vars="Time",na.rm=TRUE)

levels(g[,2]) <- c("Wavelet","Baxter King")



plot.cycles(g,"Wavelet vs. Baxter King")

经验模式分解(EMD)

基于Huang等人。(1998)Kozic和Sever(2014)提出经验模式分解作为商业周期提取的另一种方法。该函数emd可以在EMD包中找到,并且需要不同的时间序列,边界条件和规则,该规则指定迭代过程在哪个点获得了足够令人满意的结果并且可以停止。该滤波器方法的结果与HP,BK和小波滤波器相比有所不同。每项研究的任务都是评估使用这种方法是否合理。

emd <- as.data.frame(emd(xt=diff(gdp[,2]),boundary="wave",stoprule="type2")$imf)g <- melt(dat[,c(1,7,4)],id.vars="Time",na.rm=TRUE)
plot.cycles(g,"EMD vs. Hodrick Prescott")

相关文章
|
9月前
|
数据采集 机器学习/深度学习 数据可视化
探索大数据分析的无限可能:R语言的应用与实践
探索大数据分析的无限可能:R语言的应用与实践
344 9
【R语言实战】——fGARCH包在金融时序上的模拟应用
【R语言实战】——fGARCH包在金融时序上的模拟应用
|
存储 数据可视化 数据挖掘
R语言在生物信息学中的应用
【10月更文挑战第21天】生物信息学是生物学、计算机科学和信息技术相结合的交叉学科,主要研究生物大分子信息的存储、处理、分析和解释。R语言作为一种强大的统计分析工具,被广泛应用于生物信息学领域。本文将介绍R语言在生物信息学中的应用,包括基因组学、转录组学、蛋白质组学、代谢组学等方面,帮助读者了解R语言在生物信息学中的重要性和应用前景。
619 4
|
数据挖掘 C语言 C++
R语言是一种强大的统计分析工具,提供了丰富的函数和包用于时间序列分析。
【10月更文挑战第21天】时间序列分析是一种重要的数据分析方法,广泛应用于经济学、金融学、气象学、生态学等领域。R语言是一种强大的统计分析工具,提供了丰富的函数和包用于时间序列分析。本文将介绍使用R语言进行时间序列分析的基本概念、方法和实例,帮助读者掌握R语言在时间序列分析中的应用。
326 3
|
机器学习/深度学习 数据采集 人工智能
R语言是一种强大的编程语言,广泛应用于统计分析、数据可视化、机器学习等领域
R语言是一种广泛应用于统计分析、数据可视化及机器学习的强大编程语言。本文为初学者提供了一份使用R语言进行机器学习的入门指南,涵盖R语言简介、安装配置、基本操作、常用机器学习库介绍及实例演示,帮助读者快速掌握R语言在机器学习领域的应用。
711 3
|
机器学习/深度学习 并行计算 数据挖掘
R语言是一种强大的统计分析工具,广泛应用于数据分析和机器学习领域
【10月更文挑战第21天】R语言是一种强大的统计分析工具,广泛应用于数据分析和机器学习领域。本文将介绍R语言中的一些高级编程技巧,包括函数式编程、向量化运算、字符串处理、循环和条件语句、异常处理和性能优化等方面,以帮助读者更好地掌握R语言的编程技巧,提高数据分析的效率。
315 2
|
数据采集 数据可视化 数据挖掘
R语言在金融数据分析中的深度应用:探索数据背后的市场智慧
【9月更文挑战第1天】R语言在金融数据分析中展现出了强大的功能和广泛的应用前景。通过丰富的数据处理函数、强大的统计分析功能和优秀的可视化效果,R语言能够帮助金融机构深入挖掘数据价值,洞察市场动态。未来,随着金融数据的不断积累和技术的不断进步,R语言在金融数据分析中的应用将更加广泛和深入。
|
机器学习/深度学习 算法 数据挖掘
R语言中的支持向量机(SVM)与K最近邻(KNN)算法实现与应用
【9月更文挑战第2天】无论是支持向量机还是K最近邻算法,都是机器学习中非常重要的分类算法。它们在R语言中的实现相对简单,但各有其优缺点和适用场景。在实际应用中,应根据数据的特性、任务的需求以及计算资源的限制来选择合适的算法。通过不断地实践和探索,我们可以更好地掌握这些算法并应用到实际的数据分析和机器学习任务中。
|
数据采集 存储 数据可视化
R语言时间序列分析:处理与建模时间序列数据的深度探索
【8月更文挑战第31天】R语言作为一款功能强大的数据分析工具,为处理时间序列数据提供了丰富的函数和包。从数据读取、预处理、建模到可视化,R语言都提供了灵活且强大的解决方案。然而,时间序列数据的处理和分析是一个复杂的过程,需要结合具体的应用场景和需求来选择合适的方法和模型。希望本文能为读者在R语言中进行时间序列分析提供一些有益的参考和启示。
|
机器学习/深度学习 资源调度 算法
R语言逻辑回归与分类模型的深度探索与应用
【8月更文挑战第31天】逻辑回归作为一种经典的分类算法,在R语言中通过`glm()`函数可以轻松实现。其简单、高效且易于解释的特点,使得它在处理二分类问题时具有广泛的应用价值。然而,值得注意的是,逻辑回归在处理非线性关系或复杂交互作用时可能表现不佳,此时可能需要考虑其他更复杂的分类模型。