R语言中广义线性模型(GLM)中的分布和连接函数分析-阿里云开发者社区

R语言中广义线性模型(GLM)中的分布和连接函数分析

2024-04-16 99

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： R语言中广义线性模型(GLM)中的分布和连接函数分析

通常，GLM的连接函数可能比分布更重要。为了说明，考虑以下数据集，其中包含5个观察值



x = c(1,2,3,4,5)
y = c(1,2,4,2,6)
base = data.frame(x,y)

然后考虑具有不同分布的几个模型，以及一个链接


regNId = glm(y~x,family=gaussian(link="identity"),data=base)
regNlog = glm(y~x,family=gaussian(link="log"),data=base)
regPId = glm(y~x,family=poisson(link="identity"),data=base)
regPlog = glm(y~x,family=poisson(link="log"),data=base)
regGId = glm(y~x,family=Gamma(link="identity"),data=base)
regGlog = glm(y~x,family=Gamma(link="log"),data=base)
regIGId = glm(y~x,family=inverse.gaussian(link="identity"),data=base)
regIGlog = glm(y~x,family=inverse.gaussian(link="log"),data=base

还可以考虑一些Tweedie分布，甚至更一般

考虑使用线性链接函数在第一种情况下获得的预测


plot(x,y,pch=19)
abline(regNId,col=darkcols[1])
abline(regPId,col=darkcols[2])
abline(regGId,col=darkcols[3])
abline(regIGId,col=darkcols[4])
abline(regTwId,lty=2)

这些预测非常接近。在指数预测的情况下，我们获得

我们实际上可以近距离看。例如，在线性情况下，考虑使用Tweedie模型获得的斜率（实际上将包括此处提到的所有参数famile）

这里的坡度总是非常接近，如果我们添加一个置信区间，则

对于Gamma回归或高斯逆回归，由于方差是预测的幂，因此，如果预测较小，则方差应该较小。因此，在图的左侧，误差应该较小，并且方差函数的功效更高。







plot(Vgamma,Verreur,type="l",lwd=3,ylim=c(-.1,.04),xlab="power",ylab="error")
abline(h=0,lty=2)

当然，我们可以对指数模型做同样的事情

或者，如果我们添加置信区间，我们将获得

因此，这里的“斜率”也非常相似...如果我们看一下在图表左侧产生的误差，可以得出





plot(Vgamma,Verreur,type="l",lwd=3,ylim=c(.001,.32),xlab="power",ylab="error")

因此，分布通常也不是GLM上最重要的一点。

R语言中广义线性模型(GLM)中的分布和连接函数分析

通常，GLM的连接函数可能比分布更重要。为了说明，考虑以下数据集，其中包含5个观察值

然后考虑具有不同分布的几个模型，以及一个链接

还可以考虑一些Tweedie分布，甚至更一般

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

R语言中广义线性模型(GLM)中的分布和连接函数分析

通常，GLM的连接函数可能比分布更重要。为了说明，考虑以下数据集，其中包含5个观察值

然后考虑具有不同分布的几个模型，以及一个链接

还可以考虑一些Tweedie分布，甚至更一般

热门文章

最新文章

相关课程

相关电子书

相关实验场景