R语言股票市场指数:ARMA-GARCH模型和对数收益率数据探索性分析(上):https://developer.aliyun.com/article/1491666
shapiro检验
shapirot(ret_df) ## result ## 2007 5.989576e-07 ## 2008 5.782666e-09 ## 2009 1.827967e-05 ## 2010 3.897345e-07 ## 2011 5.494349e-07 ## 2012 1.790685e-02 ## 2013 8.102500e-03 ## 2014 1.750036e-04 ## 2015 5.531137e-03 ## 2016 1.511435e-06 ## 2017 3.304529e-05 ## 2018 1.216327e-07
正常的零假设在2007-2018年的所有年份均被拒绝。
每周对数收益率探索性分析
可以从每日对数收益率开始计算每周对数收益率。让我们假设分析第{t-4,t-3,t-2,t-1,t}天的交易周,并知道第t-5天(前一周的最后一天)的收盘价。我们将每周的对数收益率定义为:
可以写为:
因此,每周对数收益率是应用于交易周窗口的每日对数收益率之和。
我们来看看每周的对数收益率。
该图显示波动率急剧上升和下降。我们将原始时间序列数据转换为数据框。
head(weekly\_ret\_df) ## year value ## 1 2007 -0.0061521694 ## 2 2007 0.0126690596 ## 3 2007 0.0007523559 ## 4 2007 -0.0062677053 ## 5 2007 0.0132434177 ## 6 2007 -0.0057588519 tail(weekly\_ret\_df) ## year value ## 622 2018 0.05028763 ## 623 2018 -0.04605546 ## 624 2018 -0.01189714 ## 625 2018 -0.07114867 ## 626 2018 0.02711928 ## 627 2018 0.01142764
基本统计摘要
dataframe\_basicstats(weekly\_ret_df) ## 2007 2008 2009 2010 2011 2012 ## nobs 52.000000 52.000000 53.000000 52.000000 52.000000 52.000000 ## NAs 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 ## Minimum -0.043199 -0.200298 -0.063736 -0.058755 -0.066235 -0.035829 ## Maximum 0.030143 0.106977 0.086263 0.051463 0.067788 0.035316 ## 1. Quartile -0.009638 -0.031765 -0.015911 -0.007761 -0.015485 -0.010096 ## 3. Quartile 0.014808 0.012682 0.022115 0.016971 0.014309 0.011887 ## Mean 0.001327 -0.008669 0.003823 0.002011 0.001035 0.001102 ## Median 0.004244 -0.006811 0.004633 0.004529 0.001757 0.001166 ## Sum 0.069016 -0.450811 0.202605 0.104565 0.053810 0.057303 ## SE Mean 0.002613 0.006164 0.004454 0.003031 0.003836 0.002133 ## LCL Mean -0.003919 -0.021043 -0.005115 -0.004074 -0.006666 -0.003181 ## UCL Mean 0.006573 0.003704 0.012760 0.008096 0.008736 0.005384 ## Variance 0.000355 0.001975 0.001051 0.000478 0.000765 0.000237 ## Stdev 0.018843 0.044446 0.032424 0.021856 0.027662 0.015382 ## Skewness -0.680573 -0.985740 0.121331 -0.601407 -0.076579 -0.027302 ## Kurtosis -0.085887 5.446623 -0.033398 0.357708 0.052429 -0.461228 ## 2013 2014 2015 2016 2017 2018 ## nobs 52.000000 52.000000 53.000000 52.000000 52.000000 53.000000 ## NAs 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 ## Minimum -0.022556 -0.038482 -0.059991 -0.063897 -0.015317 -0.071149 ## Maximum 0.037702 0.034224 0.037693 0.052243 0.028192 0.050288 ## 1. Quartile -0.001738 -0.006378 -0.012141 -0.007746 -0.002251 -0.011897 ## 3. Quartile 0.011432 0.010244 0.009620 0.012791 0.009891 0.019857 ## Mean 0.004651 0.001756 -0.000669 0.002421 0.004304 -0.001093 ## Median 0.006360 0.003961 0.000954 0.001947 0.004080 0.001546 ## Sum 0.241874 0.091300 -0.035444 0.125884 0.223790 -0.057950 ## SE Mean 0.001828 0.002151 0.002609 0.002436 0.001232 0.003592 ## LCL Mean 0.000981 -0.002563 -0.005904 -0.002470 0.001830 -0.008302 ## UCL Mean 0.008322 0.006075 0.004567 0.007312 0.006778 0.006115 ## Variance 0.000174 0.000241 0.000361 0.000309 0.000079 0.000684 ## Stdev 0.013185 0.015514 0.018995 0.017568 0.008886 0.026154 ## Skewness -0.035175 -0.534403 -0.494963 -0.467158 0.266281 -0.658951 ## Kurtosis -0.200282 0.282354 0.665460 2.908942 -0.124341 -0.000870
在下文中,我们对上述一些相关指标进行了具体评论。
平均值
每周对数收益呈正平均值的年份是:
## \[1\] "2007" "2009" "2010" "2011" "2012" "2013" "2014" "2016" "2017"
所有平均值按升序排列。
## 2008 2018 2015 2011 2012 2007 2014 ## Mean -0.008669 -0.001093 -0.000669 0.001035 0.001102 0.001327 0.001756 ## 2010 2016 2009 2017 2013 ## Mean 0.002011 0.002421 0.003823 0.004304 0.004651
中位数
中位数是:
## \[1\] "2007" "2009" "2010" "2011" "2012" "2013" "2014" "2015" "2016" "2017" ## \[11\] "2018"
所有中值按升序排列。
## 2008 2015 2012 2018 2011 2016 2014 ## Median -0.006811 0.000954 0.001166 0.001546 0.001757 0.001947 0.003961 ## 2017 2007 2010 2009 2013 ## Median 0.00408 0.004244 0.004529 0.004633 0.00636
偏度
出现正偏的年份是:
stats(stats, "Skewness", 0) ## \[1\] "2009" "2017"
所有偏度按升序排列。
stats\["Skewness",order(stats\["Skewness",,\])\] ## 2008 2007 2018 2010 2014 2015 ## Skewness -0.98574 -0.680573 -0.658951 -0.601407 -0.534403 -0.494963 ## 2016 2011 2013 2012 2009 2017 ## Skewness -0.467158 -0.076579 -0.035175 -0.027302 0.121331 0.266281
峰度
出现正峰度的年份是:
filter_stats(stats, "Kurtosis", 0) ## \[1\] "2008" "2010" "2011" "2014" "2015" "2016"
峰度值都按升序排列。
## 2012 2013 2017 2007 2009 2018 ## Kurtosis -0.461228 -0.200282 -0.124341 -0.085887 -0.033398 -0.00087 ## 2011 2014 2010 2015 2016 2008 ## Kurtosis 0.052429 0.282354 0.357708 0.66546 2.908942 5.446623
2008年也是每周峰度最高的年份。但是,在这种情况下,2017年的峰度为负,而2016年的峰度为第二。
箱形图
密度图
shapiro检验
shapirot(weekly_df) ## result ## 2007 0.0140590311 ## 2008 0.0001397267 ## 2009 0.8701335006 ## 2010 0.0927104389 ## 2011 0.8650874270 ## 2012 0.9934600084 ## 2013 0.4849043121 ## 2014 0.1123139646 ## 2015 0.3141519756 ## 2016 0.0115380989 ## 2017 0.9465281164 ## 2018 0.0475141869
零假设在2007、2008、2016年被拒绝。
QQ图
在2008年尤其明显地违背正态分布的情况。
交易量探索性分析
在这一部分中,本文将分析道琼斯工业平均指数(DJIA)的交易量。
获取数据
每日量探索性分析
我们绘制每日交易量。
vol <- DJI\[,"DJI.Volume"\] plot(vol)
值得注意的是,2017年初的水平跃升,我们将在第4部分中进行研究。我们将时间序列数据和时间轴索引转换为数据框。
head(dj\_vol\_df) ## year value ## 1 2007 327200000 ## 2 2007 259060000 ## 3 2007 235220000 ## 4 2007 223500000 ## 5 2007 225190000 ## 6 2007 226570000 tail(dj\_vol\_df) ## year value ## 3015 2018 900510000 ## 3016 2018 308420000 ## 3017 2018 433080000 ## 3018 2018 407940000 ## 3019 2018 336510000 ## 3020 2018 288830000
基本统计摘要
## 2007 2008 2009 2010 ## nobs 2.510000e+02 2.530000e+02 2.520000e+02 2.520000e+02 ## NAs 0.000000e+00 0.000000e+00 0.000000e+00 0.000000e+00 ## Minimum 8.640000e+07 6.693000e+07 5.267000e+07 6.840000e+07 ## Maximum 4.571500e+08 6.749200e+08 6.729500e+08 4.598900e+08 ## 1. Quartile 2.063000e+08 2.132100e+08 1.961850e+08 1.633400e+08 ## 3. Quartile 2.727400e+08 3.210100e+08 3.353625e+08 2.219025e+08 ## Mean 2.449575e+08 2.767164e+08 2.800537e+08 2.017934e+08 ## Median 2.350900e+08 2.569700e+08 2.443200e+08 1.905050e+08 ## Sum 6.148432e+10 7.000924e+10 7.057354e+10 5.085193e+10 ## SE Mean 3.842261e+06 5.965786e+06 7.289666e+06 3.950031e+06 ## LCL Mean 2.373901e+08 2.649672e+08 2.656970e+08 1.940139e+08 ## UCL Mean 2.525248e+08 2.884655e+08 2.944104e+08 2.095728e+08 ## Variance 3.705505e+15 9.004422e+15 1.339109e+16 3.931891e+15 ## Stdev 6.087286e+07 9.489163e+07 1.157199e+08 6.270480e+07 ## Skewness 9.422400e-01 1.203283e+00 1.037015e+00 1.452082e+00 ## Kurtosis 1.482540e+00 2.064821e+00 6.584810e-01 3.214065e+00 ## 2011 2012 2013 2014 ## nobs 2.520000e+02 2.500000e+02 2.520000e+02 2.520000e+02 ## NAs 0.000000e+00 0.000000e+00 0.000000e+00 0.000000e+00 ## Minimum 8.410000e+06 4.771000e+07 3.364000e+07 4.287000e+07 ## Maximum 4.799800e+08 4.296100e+08 4.200800e+08 6.554500e+08 ## 1. Quartile 1.458775e+08 1.107150e+08 9.488000e+07 7.283000e+07 ## 3. Quartile 1.932400e+08 1.421775e+08 1.297575e+08 9.928000e+07 ## Mean 1.804133e+08 1.312606e+08 1.184434e+08 9.288516e+07 ## Median 1.671250e+08 1.251950e+08 1.109250e+08 8.144500e+07 ## Sum 4.546415e+10 3.281515e+10 2.984773e+10 2.340706e+10 ## SE Mean 3.897738e+06 2.796503e+06 2.809128e+06 3.282643e+06 ## LCL Mean 1.727369e+08 1.257528e+08 1.129109e+08 8.642012e+07 ## UCL Mean 1.880897e+08 1.367684e+08 1.239758e+08 9.935019e+07 ## Variance 3.828475e+15 1.955108e+15 1.988583e+15 2.715488e+15 ## Stdev 6.187468e+07 4.421660e+07 4.459353e+07 5.211034e+07 ## Skewness 1.878239e+00 3.454971e+00 3.551752e+00 6.619268e+00 ## Kurtosis 5.631080e+00 1.852581e+01 1.900989e+01 5.856136e+01 ## 2015 2016 2017 2018 ## nobs 2.520000e+02 2.520000e+02 2.510000e+02 2.510000e+02 ## NAs 0.000000e+00 0.000000e+00 0.000000e+00 0.000000e+00 ## Minimum 4.035000e+07 4.589000e+07 1.186100e+08 1.559400e+08 ## Maximum 3.445600e+08 5.734700e+08 6.357400e+08 9.005100e+08 ## 1. Quartile 8.775250e+07 8.224250e+07 2.695850e+08 2.819550e+08 ## 3. Quartile 1.192150e+08 1.203550e+08 3.389950e+08 4.179200e+08 ## Mean 1.093957e+08 1.172089e+08 3.112396e+08 3.593710e+08 ## Median 1.021000e+08 9.410500e+07 2.996700e+08 3.414700e+08 ## Sum 2.756772e+10 2.953664e+10 7.812114e+10 9.020213e+10 ## SE Mean 2.433611e+06 4.331290e+06 4.376432e+06 6.984484e+06 ## LCL Mean 1.046028e+08 1.086786e+08 3.026202e+08 3.456151e+08 ## UCL Mean 1.141886e+08 1.257392e+08 3.198590e+08 3.731270e+08 ## Variance 1.492461e+15 4.727538e+15 4.807442e+15 1.224454e+16 ## Stdev 3.863238e+07 6.875709e+07 6.933572e+07 1.106550e+08 ## Skewness 3.420032e+00 3.046742e+00 1.478708e+00 1.363823e+00 ## Kurtosis 1.612326e+01 1.122161e+01 3.848619e+00 3.277164e+00
在下文中,我们对上面显示的一些相关指标进行了评论。
平均值
每日交易量具有正平均值的年份是:
## \[1\] "2007" "2008" "2009" "2010" "2011" "2012" "2013" "2014" "2015" "2016" ## \[11\] "2017" "2018"
所有每日交易量均值按升序排列。
## 2014 2015 2016 2013 2012 2011 2010 ## Mean 92885159 109395714 117208889 118443373 131260600 180413294 201793373 ## 2007 2008 2009 2017 2018 ## Mean 244957450 276716364 280053730 311239602 359371036
中位数
每日交易量中位数为正的年份是:
## \[1\] "2007" "2008" "2009" "2010" "2011" "2012" "2013" "2014" "2015" "2016" ## \[11\] "2017" "2018"
所有每日成交量中值均按升序排列。
## 2014 2016 2015 2013 2012 2011 2010 ## Median 81445000 94105000 102100000 110925000 125195000 167125000 190505000 ## 2007 2009 2008 2017 2018 ## Median 235090000 244320000 256970000 299670000 341470000
偏度
每日交易量出现正偏的年份是:
## \[1\] "2007" "2008" "2009" "2010" "2011" "2012" "2013" "2014" "2015" "2016" ## \[11\] "2017" "2018"
每日交易量偏度值均按升序排列。
## 2007 2009 2008 2018 2010 2017 2011 ## Skewness 0.94224 1.037015 1.203283 1.363823 1.452082 1.478708 1.878239 ## 2016 2015 2012 2013 2014 ## Skewness 3.046742 3.420032 3.454971 3.551752 6.619268
峰度
有正峰度的年份是:
## \[1\] "2007" "2008" "2009" "2010" "2011" "2012" "2013" "2014" "2015" "2016" ## \[11\] "2017" "2018"
按升序排列。
## 2009 2007 2008 2010 2018 2017 2011 ## Kurtosis 0.658481 1.48254 2.064821 3.214065 3.277164 3.848619 5.63108 ## 2016 2015 2012 2013 2014 ## Kurtosis 11.22161 16.12326 18.52581 19.00989 58.56136
箱形图
从2010年开始交易量开始下降,2017年出现了显着增长。2018年的交易量甚至超过了2017年和其他年份。
密度图
shapiro检验
## result ## 2007 6.608332e-09 ## 2008 3.555102e-10 ## 2009 1.023147e-10 ## 2010 9.890576e-13 ## 2011 2.681476e-16 ## 2012 1.866544e-20 ## 2013 6.906596e-21 ## 2014 5.304227e-27 ## 2015 2.739912e-21 ## 2016 6.640215e-23 ## 2017 4.543843e-12 ## 2018 9.288371e-11
正态分布的零假设被拒绝。
QQ图
QQplots直观地确认了每日交易量分布的非正态情况。
每日交易量对数比率探索性分析
与对数收益类似,我们可以将交易量对数比率定义为
vt:= ln(Vt/Vt−1)
我们可以通过PerformanceAnalytics包中的CalculateReturns对其进行计算并将其绘制出来。
plot(vol\_log\_ratio)
将交易量对数比率时间序列数据和时间轴索引映射到数据框。
head(dvol_df) ## year value ## 1 2007 -0.233511910 ## 2 2007 -0.096538449 ## 3 2007 -0.051109832 ## 4 2007 0.007533076 ## 5 2007 0.006109458 ## 6 2007 0.144221282 tail(vol_df) ## year value ## 3014 2018 0.44563907 ## 3015 2018 -1.07149878 ## 3016 2018 0.33945998 ## 3017 2018 -0.05980236 ## 3018 2018 -0.19249224 ## 3019 2018 -0.15278959
基本统计摘要
## 2007 2008 2009 2010 2011 ## nobs 250.000000 253.000000 252.000000 252.000000 252.000000 ## NAs 0.000000 0.000000 0.000000 0.000000 0.000000 ## Minimum -1.606192 -1.122526 -1.071225 -1.050181 -2.301514 ## Maximum 0.775961 0.724762 0.881352 1.041216 2.441882 ## 1. Quartile -0.123124 -0.128815 -0.162191 -0.170486 -0.157758 ## 3. Quartile 0.130056 0.145512 0.169233 0.179903 0.137108 ## Mean -0.002685 0.001203 -0.001973 -0.001550 0.000140 ## Median -0.010972 0.002222 -0.031748 -0.004217 -0.012839 ## Sum -0.671142 0.304462 -0.497073 -0.390677 0.035162 ## SE Mean 0.016984 0.016196 0.017618 0.019318 0.026038 ## LCL Mean -0.036135 -0.030693 -0.036670 -0.039596 -0.051141 ## UCL Mean 0.030766 0.033100 0.032725 0.036495 0.051420 ## Variance 0.072112 0.066364 0.078219 0.094041 0.170850 ## Stdev 0.268536 0.257612 0.279677 0.306661 0.413341 ## Skewness -0.802037 -0.632586 0.066535 -0.150523 0.407226 ## Kurtosis 5.345212 2.616615 1.500979 1.353797 14.554642 ## 2012 2013 2014 2015 2016 ## nobs 250.000000 252.000000 252.000000 252.000000 252.000000 ## NAs 0.000000 0.000000 0.000000 0.000000 0.000000 ## Minimum -2.158960 -1.386215 -2.110572 -1.326016 -1.336471 ## Maximum 1.292956 1.245202 2.008667 1.130289 1.319713 ## 1. Quartile -0.152899 -0.145444 -0.144280 -0.143969 -0.134011 ## 3. Quartile 0.144257 0.149787 0.134198 0.150003 0.141287 ## Mean 0.001642 -0.002442 0.000200 0.000488 0.004228 ## Median -0.000010 -0.004922 0.013460 0.004112 -0.002044 ## Sum 0.410521 -0.615419 0.050506 0.123080 1.065480 ## SE Mean 0.021293 0.019799 0.023514 0.019010 0.019089 ## LCL Mean -0.040295 -0.041435 -0.046110 -0.036952 -0.033367 ## UCL Mean 0.043579 0.036551 0.046510 0.037929 0.041823 ## Variance 0.113345 0.098784 0.139334 0.091071 0.091826 ## Stdev 0.336667 0.314299 0.373274 0.301780 0.303028 ## Skewness -0.878227 -0.297951 -0.209417 -0.285918 0.083826 ## Kurtosis 8.115847 4.681120 9.850061 4.754926 4.647785 ## 2017 2018 ## nobs 251.000000 251.000000 ## NAs 0.000000 0.000000 ## Minimum -0.817978 -1.071499 ## Maximum 0.915599 0.926101 ## 1. Quartile -0.112190 -0.119086 ## 3. Quartile 0.110989 0.112424 ## Mean -0.000017 0.000257 ## Median -0.006322 0.003987 ## Sum -0.004238 0.064605 ## SE Mean 0.013446 0.014180 ## LCL Mean -0.026500 -0.027671 ## UCL Mean 0.026466 0.028185 ## Variance 0.045383 0.050471 ## Stdev 0.213032 0.224658 ## Skewness 0.088511 -0.281007 ## Kurtosis 3.411036 4.335748
在下文中,我们对一些相关的上述指标进行了具体评论。
平均值
每日交易量对数比率具有正平均值的年份是:
## \[1\] "2008" "2011" "2012" "2014" "2015" "2016" "2018"
所有每日成交量比率的平均值均按升序排列。
## 2007 2013 2009 2010 2017 2011 2014 ## Mean -0.002685 -0.002442 -0.001973 -0.00155 -1.7e-05 0.00014 2e-04 ## 2018 2015 2008 2012 2016 ## Mean 0.000257 0.000488 0.001203 0.001642 0.004228
中位数
每日交易量对数比率具有正中位数的年份是:
## \[1\] "2008" "2014" "2015" "2018"
道琼斯所有每日成交量比率的中位数均按升序排列。
## 2009 2011 2007 2017 2013 2010 ## Median -0.031748 -0.012839 -0.010972 -0.006322 -0.004922 -0.004217 ## 2016 2012 2008 2018 2015 2014 ## Median -0.002044 -1e-05 0.002222 0.003987 0.004112 0.01346
偏度
每日成交量比率具有正偏的年份是:
## \[1\] "2009" "2011" "2016" "2017"
所有每日成交量比率的平均值均按升序排列。
## 2012 2007 2008 2013 2015 2018 ## Skewness -0.878227 -0.802037 -0.632586 -0.297951 -0.285918 -0.281007 ## 2014 2010 2009 2016 2017 2011 ## Skewness -0.209417 -0.150523 0.066535 0.083826 0.088511 0.407226
R语言股票市场指数:ARMA-GARCH模型和对数收益率数据探索性分析(下):https://developer.aliyun.com/article/1491671