R语言lasso惩罚稀疏加法(相加)模型SPAM拟合非线性数据和可视化

简介: R语言lasso惩罚稀疏加法(相加)模型SPAM拟合非线性数据和可视化

全文链接:https://tecdat.cn/?p=33462


本文将关注R语言中的LASSO(Least Absolute Shrinkage and Selection Operator)惩罚稀疏加法模型(Sparse Additive Model,简称SPAM)。SPAM是一种用于拟合非线性数据的强大工具,它可以通过估计非线性函数的加法组件来捕捉输入变量与响应变量之间的复杂关系点击文末“阅读原文”获取完整代码数据


通过本文,我们将展示如何帮助客户在R语言中使用LASSO惩罚稀疏加法模型(SPAM)来拟合非线性数据,并进行相应的可视化分析。

本文提供了一个代码来设置、拟合和可视化加法模型。数值特征会自动使用样条基函数进行扩展。这个基本思想最早是由Ravikumar等人在2009年提出的,他们称之为SPAM,即稀疏加法模型。最初的提议涉及到组套索lasso惩罚,但grpreg的任何惩罚函数都可以代替。基本用法如下所示。


非线性数据:


image.png

dim(Data$X)
# [1] 1000   16

矩阵包含 16 个数字特征。

生成的对象是一个列表,其中包含扩展矩阵和分组分配,以及一些内部函数所需的元数据。使用具有三个自由度的自然三次样条曲线。

现在可以将扩展后的矩阵传递给 :grpreg()

fit <- grpreg

请注意,在这种情况下不必传递分组信息,因为分组信息包含在对象中。

plot_spline(fit,

偏残差也可包含在这些图中:

plot_splinpartial=TRUE)

image.png

点击标题查阅往期内容


R语言用GAM广义相加模型研究公交专用道对行程时间变异度数据的影响


01

02

03

04


默认情况下,这些图的居中值为 x(的平均值(其中 x表示正在绘制的特征)的平均值为零时,y值为零。另一种情况是,如果指定了plot_spline()x,则将绘制一幅纵轴代表模型预测值的曲线图,所有其他特征都固定为平均值:

plot_spline(fit, "V02, type='conditional')

在比较这两幅图时,请注意总体轮廓是相同的,唯一不同的是纵轴的值。下面是前 9 个系数的曲线图:

image.png

for (i in 1:9) ploline(fit

image.png

在生成模型中,变量 3 和 4 与结果呈线性关系,变量 1、2、5 和 6 呈非线性关系,而所有其他变量均不相关。稀疏加法模型很好地捕捉到了这一点。

进行交叉验证(默认情况下会绘制出使交叉验证误差最小的拟合结果):

cvfit <- cv.grp
plot_line

image.png

最后,这些工具还可用于生存模型和 glm 模型。在这里,所有绘图都以线性预测尺度返回,残差为偏差残差。

相关文章
|
6天前
|
数据可视化 数据挖掘 API
【R语言实战】聚类分析及可视化
【R语言实战】聚类分析及可视化
|
6天前
|
Web App开发 数据可视化 数据挖掘
利用R语言进行聚类分析实战(数据+代码+可视化+详细分析)
利用R语言进行聚类分析实战(数据+代码+可视化+详细分析)
|
6天前
|
数据采集 数据可视化
利用R语言进行因子分析实战(数据+代码+可视化+详细分析)
利用R语言进行因子分析实战(数据+代码+可视化+详细分析)
|
6天前
|
移动开发 数据可视化
广义线性模型beta二项分布的淋巴结疾病风险预测可视化R语言2实例合集|附数据代码
广义线性模型beta二项分布的淋巴结疾病风险预测可视化R语言2实例合集|附数据代码
|
6天前
|
机器学习/深度学习 数据可视化
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为2
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为
|
6天前
利用R语言进行典型相关分析实战
利用R语言进行典型相关分析实战
|
6天前
|
机器学习/深度学习 算法
R语言分类回归分析考研热现象分析与考研意愿价值变现
R语言分类回归分析考研热现象分析与考研意愿价值变现
|
6天前
|
数据可视化 定位技术
R语言贝叶斯INLA空间自相关、混合效应、季节空间模型、SPDE、时空分析野生动物数据可视化
R语言贝叶斯INLA空间自相关、混合效应、季节空间模型、SPDE、时空分析野生动物数据可视化
|
6天前
|
机器学习/深度学习 数据可视化 算法
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为1
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为
|
6天前
|
机器学习/深度学习 数据可视化 算法
R语言聚类分析、因子分析、主成分分析PCA农村农业相关经济指标数据可视化|数据分享
R语言聚类分析、因子分析、主成分分析PCA农村农业相关经济指标数据可视化|数据分享

热门文章

最新文章