R实战|卡方检验及其可视化
卡方检验
卡方检验是一种以 分布为基础的用途广泛的假设检验方法。是一种非参数检验方法。 检验就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为0,表明理论值完全符合。它的无效假设 为:观察频数与期望频数没有显著性差异。 检验主要有三个用途:单样本方差的同质性检验、独立性检验和适合性检验。
独立性检验 (Independence)
独立性检验评估的是,在一个列联表中,不成对的观测对象中的两个变量是不是相互独立的。
适合度检验 (Goodness of fit)
适合度检验展示了一个观察到的频率分布是否与一个理论分布不同。
可视化
# 安装并加载ggstatsplot包 install.packages('ggstatsplot') library(ggstatsplot)
饼图
ggpiestats
该函数为类别变量创建饼图,图的副标题中包含列联表分析的结果(Pearson卡方检验用于受试者间设计,McNemar卡方检验用于受试者内设计)。如果只输入一个类别变量,则单样本比例检验(即卡方拟合优度检验)的结果将显示为副标题。
## 设置种子可重复 set.seed(123) ## 绘制 ggpiestats( data = mtcars, x = am, y = cyl, package = "wesanderson", palette = "Royal1", title = "Dataset: Motor Trend Car Road Tests", ## title for the plot legend.title = "Transmission", ## title for the legend caption = "Source: 1974 Motor Trend US magazine" )
默认 结果
✅ 描述(频率)✅ 推论统计 ✅ 效应量+置信区间 ✅ 适合度检验 ✅ 贝叶斯假设检验 ✅ 贝叶斯估计
grouped_ggpiestats
##单组内 set.seed(123) grouped_ggpiestats( data = mtcars, x = cyl, grouping.var = am, ##分组变量 label.repel = TRUE, package = "ggsci", palette = "default_ucscgb" )
柱状图
ggbarstats
# install.packages('hrbrthemes') set.seed(123) library(ggplot2) ## plot ggbarstats( data = mtcars, x = am, y = cyl, title = "Dataset: Motor Trend Car Road Tests", ## title for the plot legend.title = "Transmission", xlab = "am", ggtheme = hrbrthemes::theme_ipsum_pub(), ggplot.component = list(ggplot2::scale_x_discrete(guide = ggplot2::guide_axis(n.dodge = 2))), palette = "Set2" )
grouped_ggbarstats
set.seed(123) grouped_ggbarstats( data = mtcars, x = am, y = cyl, grouping.var = vs, package = "wesanderson", palette = "Darjeeling2", ggtheme = ggthemes::theme_tufte(base_size = 12) )