R语言highfrequency高频金融数据导入

简介: R语言highfrequency高频金融数据导入

R中针对高频数据的添加包highfrequency,用于组织高频数据, 高频数据的清理、整理,高频数据的汇总,使用高频数据建立相关模型 都非常方便。但是其中数据输入的过程中,会使用到包里的函数convert()。该函数支持三类的高频数据:

 NYSE TAQ数据库中的.txt文件

 WRDS数据库中的.csv文件

 Tickdata.com的.asc文件

不易获取,因此,输入数据转换成xts,然后进行时间序列分析的过程中存在困难。

因此对于原始数据,我们可以整理成sample数据的格式,然后使用xts包先将其转换成xts格式。

对于时间序列数据要注意的一点是时间数据不单独作为一列,仅作为行名存在,否则在进行转换的过程中会出现colnames和列的数目不符合的错误。

因此对于数据可以先进行预处理。


对于列数据间分隔建议使用tab制表符,否则在r读取的过程中会将时间的日期时间识别为两列。


sample_tdataraw=read.table("E:\\AA_trades.txt",header=F,skip = 1,stringsAsFactors=FALSE)

其中读取时要注意跳过第一行,列名和列数不符的错误。

读取后,对列名赋值


colnames(sample_tdataraw)=c(" ","SYMBOL","EX","PRICE","SIZE","COND","CORR","G127")

然后将第一列的时间数据赋给行名


row.names(sample_tdataraw)=sample_tdataraw[,1]

sample_tdataraw=sample_tdataraw[,-1]

同时删去第一列。

这样就做好了可以进行转换xts格式的原始数据


library(xts)

Data.xts <- as.xts(sample_tdataraw, descr='my new xts object')

这样xts格式的数据便可以继续使用 highfrequency包中的其他函数进行分析了。

等间隔数据、数据同步


波动率预测

 HAR-模型




相关文章
|
存储 vr&ar
R语言单变量和多变量(多元)动态条件相关系数DCC-GARCH模型分析股票收益率金融时间序列数据波动率-2
R语言单变量和多变量(多元)动态条件相关系数DCC-GARCH模型分析股票收益率金融时间序列数据波动率
R语言单变量和多变量(多元)动态条件相关系数DCC-GARCH模型分析股票收益率金融时间序列数据波动率-1
R语言单变量和多变量(多元)动态条件相关系数DCC-GARCH模型分析股票收益率金融时间序列数据波动率
【R语言实战】——带有高斯新息的金融时序的GARCH模型拟合预测及VAR/ES风险度量
【R语言实战】——带有高斯新息的金融时序的GARCH模型拟合预测及VAR/ES风险度量
【R语言实战】——带有新息为标准学生t分布的金融时序的GARCH模型拟合预测
【R语言实战】——带有新息为标准学生t分布的金融时序的GARCH模型拟合预测
|
数据可视化
【R语言实战】——金融时序分布拟合
【R语言实战】——金融时序分布拟合
【R语言实战】——fGARCH包在金融时序上的模拟应用
【R语言实战】——fGARCH包在金融时序上的模拟应用
|
存储 vr&ar
R语言单变量和多变量(多元)动态条件相关系数DCC-GARCH模型分析股票收益率金融时间序列数据波动率
R语言单变量和多变量(多元)动态条件相关系数DCC-GARCH模型分析股票收益率金融时间序列数据波动率
|
数据采集 数据可视化 数据挖掘
R语言在金融数据分析中的深度应用:探索数据背后的市场智慧
【9月更文挑战第1天】R语言在金融数据分析中展现出了强大的功能和广泛的应用前景。通过丰富的数据处理函数、强大的统计分析功能和优秀的可视化效果,R语言能够帮助金融机构深入挖掘数据价值,洞察市场动态。未来,随着金融数据的不断积累和技术的不断进步,R语言在金融数据分析中的应用将更加广泛和深入。
|
数据可视化
【R语言实战】——金融时序ARIMA建模
【R语言实战】——金融时序ARIMA建模
|
算法 Linux
R语言随机波动率(SV)模型、MCMC的Metropolis-Hastings算法金融应用:预测标准普尔SP500指数
R语言随机波动率(SV)模型、MCMC的Metropolis-Hastings算法金融应用:预测标准普尔SP500指数