R语言非线性回归和广义线性模型:泊松、伽马、逻辑回归、Beta回归分析机动车事故、小鼠感染、蛤蜊数据、补剂钠摄入数据|数据分享(上):https://developer.aliyun.com/article/1498787
还有
clam_res <- simulateR......res)
ploals(clam_res)
好的,也许不是很好。但这主要是由于高值的稀疏性导致的,所以没关系。
我们可以使用predict进行绘图,在这里分别绘制每个月的图。
clam_plot +...... facet_wrap(~MONTH)
我们还可以查看其他属性。
summary(clam_gamma)
我们可以重新参数化伽马分布,使得均值=形状/速率。在这种情况下,我们使用该均值和形状参数化伽马分布。离散参数是1/形状。
但是,为了更容易理解,伽马的方差随均值的平方成比例地扩展。离散参数越大,方差扩展得越快。
最后,我们可以使用纳吉尔克计的伪R2来计算R2。
# fit r2(clam_gamma)
这是正态的吗?
你可能会问为什么这里使用伽马分布而不是正态分布?我们可以用正态误差和对数链接进行glm拟合。
clam_glm_norm <- glm(AFD ...... data = clams)
一种判断的方法是寻找过离散。
norm_res <- simulateRe......orm_res)
plotuals(norm_res)
我们可以看到QQ图很好。而且predobs也不糟糕(特别是与上面相比)。这是一些很好的证据,表明这里可能只需要正态误差和对数链接。
逻辑回归
让我们来看看我们的小鼠感染隐孢子虫的例子。请注意,数据被限制在0和1之间。
mouse <- read_csv...... Porportion)) + geom_point() mouse_plot
这是因为虽然N是每个样本的总小鼠数量,但是我们不能有超过N的感染!实际上,每只老鼠就像一次抛硬币。它是否被感染了。
二项分布
二项分布有两个参数,成功的概率和硬币投掷的次数。得到的分布始终介于0和1之间。考虑使用不同概率进行15次硬币投掷的情况。
bin_tibble <- tibble(outcome = rep(0:15, 2),...... geom_col(position = position_dodge())
我们也可以将x轴的范围调整为0到1,来表示比例。
或者,考虑相同的概率,但是不同次数的硬币投掷。
bin_tibble <- tibble(outcome = rep(0:15, 2),...... geom_col(position = position_dodge())
你可以看到两个参数都会影响分布的形状。
二项式逻辑回归
在二项逻辑回归中,我们主要是估计获得正面的概率。然后我们以权重的形式提供(而不是估计)试验次数。这里使用的典型链接函数是logit函数,因为它描述了一个在0和1之间饱和的逻辑函数。
在R中,我们可以使用两种形式来参数化二项逻辑回归 - 这两种形式是等价的,因为它们将结果扩展为成功次数和总试验次数。
mouse_glm_cbind <- glm(cbind(Y,...... data = mouse)
第二种方式使用权重来表示试验次数。
mouse_glm <- glm(Porport...... data = mouse)
这两个模型是相同的。
从这一点开始,工作流程与以往一样 - 假设检验、分析和可视化。
checl(mouse_glm)
binduals(mouse_glm, ......
res_bin <- sim......
plotRes_bin)
summary(moglm)
r2(mouse_glm)
注意,离散参数为1,就像泊松分布一样。
ggplot(mouse, ...... method.args = list(family = binomial))
Beta回归
最后,我们经常会遇到受限数据,但这些数据不是从二项式分布中抽取的 - 也就是说,并不存在独立的“硬币翻转”。
考虑以下关于服用不同补充剂时锻炼后钠摄入比例的分析,2300是推荐摄入量,所以我们将其标准化为这个值。
sodium <- read_csv("laake.csv")
ggplot(sodium, ...... geom_boxplot()
现在,让我们使用Beta回归来观察这个结果。
sodium_beta <- beta...... data = sodium)
soditmb <- glmmTMB(Porport...... data = sodium) chec......a_tmb)
plotQQunif(sodium_beta_tmb)
然后我们可以继续进行所有我们通常的测试和可视化。例如 -
emmeans(sodium_b...... confint(adjust = "none")
如果我们有一个连续的协变量,我们可以获得拟合值和误差,并将它们放入模型中。