R语言用相关网络图可视化分析汽车配置和饮酒习惯

简介: R语言用相关网络图可视化分析汽车配置和饮酒习惯

我们经常使用的一个关系性指标是相关性。通过可以利用数据框架和绘图来帮助探索相关关系。

本文先创建了相关关系的关系数据框,然后绘制了关系结构。

我们将使用以下库。

library(tidyverse)
library(igraph)

基本方法

给定一个由数字变量组成的数据框d,我们想在网络中绘制其相关性,这里有一个基本方法。

# 创建相关数据框
d %>% 
  correlate() %>% 
# 将强于某个值的相关关系转换成转换为一个无向图的对象
cors %>% 
  filter(abs(r) 
# 绘制
plot(cors)

例子1:汽车参数配置关联变量

让我们按照这个方法来处理MTCars数据集。默认情况下,所有的变量都是数字的,所以我们不需要做任何预处理。

我们首先创建一个相关性数据框,并将其转换为一个图形对象。

correlate() %>% 
  stretch()

接下来,我们将这些值转换为一个无向图对象。该图是不定向的,因为相关关系没有方向。相关关系没有因果关系。

因为,我们通常不希望看到所有的相关关系,我们首先过滤()出绝对值小于某个阈值的任何相关关系。例如,让我们包括0.3或更强的相关关系(正或负)。

cors %>%
  filter(abs(r) > .3) %>%

我们绘制这个对象。下面是一个基本图。

plot(cors)

改进之后的。

plot(cors,width = abs(r), color = r,title="汽车变量之间的相关关系")

例子2:有类似饮酒习惯的国家

这个例子需要进行一些数据预处理,我们只看强正相关。

让我们来看一个关于世界各国的啤酒、葡萄酒饮用量的数据。

drinkdata

我想找出欧洲和美洲的哪些国家有类似的啤酒、葡萄酒和烈酒饮用习惯,以及澳大利亚在其中的地位。绑定地理信息并找到我感兴趣的国家,把这些数据变成相关数据的形状。

# 标准化数据以检查相对数量。
# 而不是绝对数量
# 啤酒、葡萄酒和烈酒的相对数量
d %>% mutate_if(is.numeric, scale)
# 整理数据
%>% 
  gather(type, litres, -country) %>% 
  drop_na() %>% 
#转换成宽数据以便进行关联分析
 %>% 
  spread(country, litres) %>%

这个数据包括每个国家喝的啤酒、葡萄酒和烈酒数量的Z-scores。

我们现在可以继续使用我们的标准方法。因为我只对哪些国家真正相似感兴趣,我们过滤相关系数低的数据。(r>0.9)

plot(cors,alpha = r, color = r,title = "哪些国家有类似的饮酒习惯?")

这些国家的饮酒行为分为三个群组。

例如澳大利亚与许多西欧和北欧国家如英国、法国、荷兰、挪威和瑞典一起出现在左上方的集群中。


相关文章
|
2天前
|
数据可视化 前端开发 数据挖掘
R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享(上)
R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享
12 0
|
2天前
|
数据采集 数据可视化
R语言关联规则Apriori对杭州空气质量与气象因子数据研究可视化
R语言关联规则Apriori对杭州空气质量与气象因子数据研究可视化
|
2天前
|
数据采集 数据挖掘 测试技术
python、R语言ARIMA-GARCH分析南方恒生中国企业ETF基金净值时间序列分析
python、R语言ARIMA-GARCH分析南方恒生中国企业ETF基金净值时间序列分析
13 1
|
2天前
R语言偏最小二乘回归PLS回归分析制药产品化学制造过程数据、缺失值填充、变量重要性
R语言偏最小二乘回归PLS回归分析制药产品化学制造过程数据、缺失值填充、变量重要性
|
2天前
|
前端开发 数据可视化 算法
r语言Bootstrap自助法重采样构建统计量T抽样分布近似值可视化|代码分享
r语言Bootstrap自助法重采样构建统计量T抽样分布近似值可视化|代码分享
12 2
|
2天前
|
算法 数据挖掘
R语言面板数据回归:含时间固定效应混合模型分析交通死亡率、酒驾法和啤酒税
R语言面板数据回归:含时间固定效应混合模型分析交通死亡率、酒驾法和啤酒税
|
2天前
|
机器学习/深度学习 数据可视化
R语言非线性回归和广义线性模型:泊松、伽马、逻辑回归、Beta回归分析机动车事故、小鼠感染、蛤蜊数据、补剂钠摄入数据|数据分享(下)
R语言非线性回归和广义线性模型:泊松、伽马、逻辑回归、Beta回归分析机动车事故、小鼠感染、蛤蜊数据、补剂钠摄入数据|数据分享
|
2天前
|
机器学习/深度学习
R语言非线性回归和广义线性模型:泊松、伽马、逻辑回归、Beta回归分析机动车事故、小鼠感染、蛤蜊数据、补剂钠摄入数据|数据分享(上)
R语言非线性回归和广义线性模型:泊松、伽马、逻辑回归、Beta回归分析机动车事故、小鼠感染、蛤蜊数据、补剂钠摄入数据|数据分享
|
2天前
|
机器学习/深度学习 数据可视化
R语言逻辑回归、决策树、随机森林、神经网络预测患者心脏病数据混淆矩阵可视化(下)
R语言逻辑回归、决策树、随机森林、神经网络预测患者心脏病数据混淆矩阵可视化
|
2天前
|
机器学习/深度学习 数据采集 数据可视化
R语言逻辑回归、决策树、随机森林、神经网络预测患者心脏病数据混淆矩阵可视化(上)
R语言逻辑回归、决策树、随机森林、神经网络预测患者心脏病数据混淆矩阵可视化
11 0