本文在股市可视化中可视化相关矩阵 :最小生成树
在本文示例中,我将使用日数据和1分钟数据来可视化股票数据 。
我发现以下概念定义非常有用:
- 连通图:在无向图中,若任意两个顶点vivi与vjvj都有路径相通,则称该无向图为连通图。
- 强连通图:在有向图中,若任意两个顶点vivi与vjvj都有路径相通,则称该有向图为强连通图。
- 连通网:在连通图中,若图的边具有一定的意义,每一条边都对应着一个数,称为权;权代表着连接连个顶点的代价,称这种连通图叫做连通网。
- 生成树:一个连通图的生成树是指一个连通子图,它含有图中全部n个顶点,但只有足以构成一棵树的n-1条边。一颗有n个顶点的生成树有且仅有n-1条边,如果生成树中再添加一条边,则必定成环。
- 最小生成树:在连通网的所有生成树中,所有边的代价和最小的生成树,称为最小生成树。
#***************************************************************** # 加载历史数据 #***************************************************************** getSymbols(tickers, src = 'yahoo', from = '1970-01-01', env = data, auto.assign = for(i in ls(data)) data[[i]] = adjustOHLC(data[[i] # 删除历史数据很少的样本 remove.min.history(data) # 显示已删除的 print(setdiff(tickers,names(data$prices))) #***************************************************************** # 可视化关联矩阵 #***************************************************************** prices = data$prices ret = diff(log(prices)) ret = last(ret, 252) plt(ret, 0.5)
接下来,让我们获取1分钟的收盘价数据,并基于最近5天可视化相关性:
#***************************************************************** # 加载历史数据 #***************************************************************** if(!file.exists(filename)) { data1[[ticker]] = getSymbol.intraday.google(ticker, #***************************************************************** # 可视化关联矩阵 #***************************************************************** print(join(c( ,format(range(index(ret)), '%d-%b-%Y %H-%M')), ' ')) plot.cor(ret, 0.5)
辅助函数:
#***************************************************************** #函数创建相关矩阵 #***************************************************************** clncor = function(ret, threshold = 0.5) { cor(coredata(ret), use='complete.obs',method='pearson') cor_mat[ abs(cor_mat) < threshold] = 0 #***************************************************************** # 绘制最小生成树 #***************************************************************** plco = function(ho = 0.5) { cor_mat = clean.cor(ret, threshold