R实战|卡方检验及其可视化

简介: R实战|卡方检验及其可视化

R实战|卡方检验及其可视化


卡方检验


卡方检验是一种以  分布为基础的用途广泛的假设检验方法。是一种非参数检验方法。  检验就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为0,表明理论值完全符合。它的无效假设  为:观察频数与期望频数没有显著性差异。  检验主要有三个用途:单样本方差的同质性检验、独立性检验和适合性检验。


独立性检验 (Independence)

独立性检验评估的是,在一个列联表中,不成对的观测对象中的两个变量是不是相互独立的。


适合度检验 (Goodness of fit)

适合度检验展示了一个观察到的频率分布是否与一个理论分布不同。


可视化

# 安装并加载ggstatsplot包
install.packages('ggstatsplot')
library(ggstatsplot)


饼图


ggpiestats

该函数为类别变量创建饼图,图的副标题中包含列联表分析的结果(Pearson卡方检验用于受试者间设计,McNemar卡方检验用于受试者内设计)。如果只输入一个类别变量,则单样本比例检验(即卡方拟合优度检验)的结果将显示为副标题。

## 设置种子可重复
set.seed(123)
## 绘制
ggpiestats(
  data         = mtcars,
  x            = am,
  y            = cyl,
  package      = "wesanderson",
  palette      = "Royal1",
  title        = "Dataset: Motor Trend Car Road Tests", ## title for the plot
  legend.title = "Transmission", ## title for the legend
  caption      = "Source: 1974 Motor Trend US magazine"
)

image.png

默认 结果


✅ 描述(频率)✅ 推论统计 ✅ 效应量+置信区间 ✅ 适合度检验 ✅ 贝叶斯假设检验 ✅ 贝叶斯估计


grouped_ggpiestats

##单组内
set.seed(123)
grouped_ggpiestats(
  data         = mtcars,
  x            = cyl,
  grouping.var = am, ##分组变量
  label.repel  = TRUE, 
  package      = "ggsci", 
  palette      = "default_ucscgb"
)

image.png



柱状图


ggbarstats

# install.packages('hrbrthemes') 
set.seed(123)
library(ggplot2)
## plot
ggbarstats(
  data         = mtcars,
  x            = am,
  y            = cyl,
  title        = "Dataset: Motor Trend Car Road Tests", ## title for the plot
  legend.title = "Transmission", 
  xlab             = "am",
  ggtheme          = hrbrthemes::theme_ipsum_pub(),
  ggplot.component = list(ggplot2::scale_x_discrete(guide = ggplot2::guide_axis(n.dodge = 2))),
  palette          = "Set2"
)

image.png

grouped_ggbarstats

set.seed(123)
grouped_ggbarstats(
  data         = mtcars,
  x            = am,
  y            = cyl,
  grouping.var = vs,
  package      = "wesanderson",
  palette      = "Darjeeling2",
  ggtheme      = ggthemes::theme_tufte(base_size = 12)
)

image.png


image.pngimage.png

相关文章
|
7月前
|
数据可视化 数据挖掘 API
【R语言实战】聚类分析及可视化
【R语言实战】聚类分析及可视化
|
7月前
|
机器学习/深度学习 数据采集 数据可视化
R语言回归、anova方差分析、相关性分析 《精品购物指南》调研数据可视化
R语言回归、anova方差分析、相关性分析 《精品购物指南》调研数据可视化
R语言回归、anova方差分析、相关性分析 《精品购物指南》调研数据可视化
|
7月前
|
分布式计算 数据可视化 数据库
R语言进行相关矩阵分析及其可视化
R语言进行相关矩阵分析及其可视化
|
7月前
|
数据采集 机器学习/深度学习 数据可视化
R语言贝叶斯模型预测电影评分数据可视化分析
R语言贝叶斯模型预测电影评分数据可视化分析
|
7月前
|
数据可视化 Python
R语言分析糖尿病数据:多元线性模型、MANOVA、决策树、典型判别分析、HE图、Box's M检验可视化
R语言分析糖尿病数据:多元线性模型、MANOVA、决策树、典型判别分析、HE图、Box's M检验可视化
|
7月前
|
机器学习/深度学习 数据可视化 算法
数据代码分享|R语言用CHAID决策树分析花卉栽培影响因素数据可视化、误差分析
数据代码分享|R语言用CHAID决策树分析花卉栽培影响因素数据可视化、误差分析
|
7月前
|
数据可视化 数据挖掘
R语言APRIORI模型关联规则挖掘分析脑出血急性期用药规律最常配伍可视化
R语言APRIORI模型关联规则挖掘分析脑出血急性期用药规律最常配伍可视化
|
7月前
|
机器学习/深度学习 数据采集 数据可视化
R语言可视化探索BRFSS数据并逻辑回归Logistic回归预测中风
R语言可视化探索BRFSS数据并逻辑回归Logistic回归预测中风
|
7月前
|
数据挖掘
R语言拟合扩展Rasch模型分析试题质量
R语言拟合扩展Rasch模型分析试题质量
|
7月前
|
数据可视化
R语言信用风险回归模型中交互作用的分析及可视化
R语言信用风险回归模型中交互作用的分析及可视化