R语言中的偏最小二乘PLS回归算法

简介: R语言中的偏最小二乘PLS回归算法

偏最小二乘回归:

我将围绕结构方程建模(SEM)技术进行一些咨询,以解决独特的业务问题。我们试图识别客户对各种产品的偏好,传统的回归是不够的,因为数据集的高度分量以及变量的多重共线性。PLS是处理这些有问题的数据集的强大而有效的方法。

主成分回归是我们将要探索的一种选择,但在进行背景研究时,我发现PLS可能是更好的选择。我们将看看PLS回归和PLS路径分析。我不相信传统的扫描电镜在这一点上是有价值的,因为我们没有良好的感觉或理论来对潜在的结构做出假设。此外,由于数据集中的变量数量众多,我们正在将SEM技术扩展到极限。Haenlein,M&Kaplan,A.,2004年,“初步指南偏最小二乘分析”,Understanding Statistics,3(4),283-297中可以找到关于这个限制的有趣讨论。


[1]“diesel”“turbo”“two.doors”“hatchback”“wheel.base”


[6]“length”“width”“height”“curb.weight”“eng.size”


[ 11]“马力”“峰值.rpm”“价格”“city.mpg”


[16]“ highway.mpg ”

这些数据有16个变量和30个观测值。

关于PLS回归的一个有趣的事情是你可以有多个响应变量,plsdepot可以适应这种类型的分析。在这种情况下,我只想分析一个Y变量,那就是价格。

该包的一个怪癖是你需要将预测变量和响应分开,即将响应变量列放在数据帧的末尾。



#把变量价格(第13列)放在最后


pls1 $ x.scores X分数(T分量)


$ x.loads X-loadings


$ y.scores Y-scores(U-components)


$ y.loads Y-loadings


$ cor.xyt得分相关性


$ raw.wgs原始权重


$ mod.wgs修改权重


$ std.coefs标准系数


$ reg.coefs常规系数


$ R2 R平方


$ R2Xy解释Xy的方差T


$ y.pred y-预测


$ resid 残差


$ T2 T2经济系数

Q2第二季度交叉验证这个包中有很多,我强烈建议阅读优秀的教程来了解更多信息。


>#相关图; 注意什么与价格高度相关


#plot每个观测预测与实际

我们查看不同数量的成分以确定最佳模型,并从实际角度查看潜在变量是否有意义。

目录
打赏
0
0
0
0
111
分享
相关文章
基于最小二乘递推算法的系统参数辨识matlab仿真
该程序基于最小二乘递推(RLS)算法实现系统参数辨识,对参数a1、b1、a2、b2进行估计并计算误差及收敛曲线,对比不同信噪比下的估计误差。在MATLAB 2022a环境下运行,结果显示了四组误差曲线。RLS算法适用于实时、连续数据流中的动态参数辨识,通过递推方式快速调整参数估计,保持较低计算复杂度。
R语言中的支持向量机(SVM)与K最近邻(KNN)算法实现与应用
【9月更文挑战第2天】无论是支持向量机还是K最近邻算法,都是机器学习中非常重要的分类算法。它们在R语言中的实现相对简单,但各有其优缺点和适用场景。在实际应用中,应根据数据的特性、任务的需求以及计算资源的限制来选择合适的算法。通过不断地实践和探索,我们可以更好地掌握这些算法并应用到实际的数据分析和机器学习任务中。
R语言混合SVD模型IBCF协同过滤推荐算法研究——以母婴购物平台为例
R语言混合SVD模型IBCF协同过滤推荐算法研究——以母婴购物平台为例
R语言贝叶斯Metropolis-Hastings采样 MCMC算法理解和应用可视化案例
R语言贝叶斯Metropolis-Hastings采样 MCMC算法理解和应用可视化案例
|
9月前
R语言偏最小二乘回归PLS回归分析制药产品化学制造过程数据、缺失值填充、变量重要性
R语言偏最小二乘回归PLS回归分析制药产品化学制造过程数据、缺失值填充、变量重要性
R语言平滑算法LOESS局部加权回归、三次样条、变化点检测拟合电视节目《白宫风云》在线收视率
R语言平滑算法LOESS局部加权回归、三次样条、变化点检测拟合电视节目《白宫风云》在线收视率
R语言K-Means(K均值聚类)和层次聚类算法对微博用户特征数据研究
R语言K-Means(K均值聚类)和层次聚类算法对微博用户特征数据研究
数据分享|R语言改进的K-MEANS(K-均值)聚类算法分析股票盈利能力和可视化
数据分享|R语言改进的K-MEANS(K-均值)聚类算法分析股票盈利能力和可视化

热门文章

最新文章