混合模型适合需求吗?
混合模型在很多方面与线性模型相似。它估计一个或多个解释变量对响应变量的影响。混合模型的输出将给出一个解释值列表,其效应值的估计值和置信区间,每个效应的p值以及模型拟合程度的至少一个度量。如果您有一个变量将您的数据样本描述为您可能收集的数据的子集,则应该使用混合模型而不是简单的线性模型。
什么概率分布最适合数据?
假设你已经决定要运行混合模型。接下来你要做的是找到最适合你的数据的概率分布。
#lnorm表示对数正态 qqp (recog $ Aggression.t,“lnorm” ) #qqp要求估计负二项式,泊松#和伽玛分布的参数。 可以使用fitdistr #函数生成估计值。
查看我使用qqp生成的图。y轴表示观察值,x轴表示由分布模拟的分位数。红色的实线表示完美的分布拟合,虚线的红色线条表示完美的分布拟合的置信区间。
如何将混合模型拟合到数据
数据是正态分布的
如果你的数据是正态分布的, 你可以使用线性混合模型(LMM)。您将需要加载lme4软件包并调用lmer函数。
如果你的数据不正态分布
用于估计模型中效应大小的REML和最大似然方法会对数据不适用正态性假设,因此您必须使用不同的方法进行参数估计。
结束 :了解你的数据
在熟悉数据之前,您无法真正了解哪些分析适合您的数据,熟悉这些数据的最佳方法是绘制它们。通常我的第一步是做我感兴趣的变量的密度图,按照我最感兴趣的解释变量来分解。
绘图对评估模型拟合也很重要。通过以各种方式绘制拟合值,您可以确定哪种模型适合描述数据。
该图所做的是创建一条代表零的水平虚线:与最佳拟合线平均偏离零。
结果正如我所希望的那样:与最佳拟合线的偏差趋于零。如果这条实线没有覆盖虚线,那意味着最适合的线条不太适合。
MCMC模型图形比较
这些随机效果看起来非常尖锐,不像白色噪音。所以让我们尝试用更多的迭代来重新设计模型。这是计算量更大,但产生更准确的结果。
现在更接近线条周围的白色噪音,这意味着更好的模型。