R语言PLS-DA模型分析不同中医组别患者间差异指标数据可视化

简介: R语言PLS-DA模型分析不同中医组别患者间差异指标数据可视化

PLS-DA (Partial Least Squares Discriminant Analysis) 是一种多变量统计分析方法,常用于处理具有多个预测变量和多个响应变量的数据点击文末“阅读原文”获取完整代码数据


相关视频

image.png

在本文中,我们帮助客户使用了PLS-DA方法来挖掘两个疾病的不同中医分组方式下存在差异的指标。

首先,我们有两个Excel文件,分别是患者的证素数据。每一列代表一位患者的多个数据,不同颜色代表了不同的分组。我们想要通过PLS-DA挖掘不同组别患者间存在差异的指标。

两个EXCEL分别是患者的证素的数据,由于是评分性质的,所以都是不连续的数字。每一列代表一位患者的多个数据,不同颜色代表了不同的分组,想通过PLS-DA挖掘下不同组别患者间存在差异的指标有哪些。2个EXCEL是分开的2个疾病,每个疾病下包含不同中医的分组方式,主要想挖掘下不同中医分组方式下存在差异的指标。一方面需要找到这些存在差异的指标,每一列代表一位患者的多个数据,不同颜色代表了不同的分组。

数据1

在R语言中,我们首先将数据导入并进行预处理。我们使用read.csv函数将数据1导入,并将不需要的列删除。然后,我们使用na.omit函数删除含有缺失值的行。最后,我们为每个患者指定一个组别,分别为A、B、C、D、E和F。

979712affbe916139eff97a66d220aab.png

data=read.csv("数据1.csv")
X=data  
X=X[,-53]  
#分别设置组别和指标  
X=na.omit(X)  
Y=c(rep("A",29),rep("B",19),rep("C",27),rep("D", 8),rep("E",9),rep("F",4) )

进行PLS-DA模型的建立

接下来,我们使用PLS-DA建立模型。建立PLS-DA模型,并将数据集和组别变量作为输入。建立模型后,我们可以查看不同组别分别有哪些指标,以及哪些指标之间存在显著的差异。

tIndiv(plsda.breast,

fe7aef406ddacb883a38bf81b33a9703.png

从结果中可以看到不同组别分别有哪些指标,以及哪些指标之间存在显著的差异?

从图中可以看到,分组a和分组b之间存在显著的差异,分组cdef之间的差异较小,分组a分组b和分组cdef间均存在显著差异。

指示变量矩阵

st(t(plsda.breast$ind.mat))

626cb6a3c834a510dfaa770576f2a0c3.png

从指示变量矩阵的结果来看,a的特征向量和b的特征向量之间存在显著差异,而cdef之间的差异较小。

数据2

接下来,我们导入数据2,并进行相似的分析步骤。首先,我们使用read.csv函数将数据2导入。然后,我们建立PLS-DA模型,并使用div函数查看不同组别分别有哪些指标,以及哪些指标之间存在显著的差异。

5d4fd4e0d40e10e6459d79198d3b5949.png

进行PLS-DA模型的建立

div(plsda.breast,  
          ellipse = TRUE

7c4ec486383a9cae1acd48c6037e9a3e.png

指示变量矩阵

ist(t(plsda.breast$i

015962cb7e8d61590a91319ee2f4e949.png

从结果中可以看到不同组别分别有哪些指标,以及哪些指标之间存在显著的差异?

从图中可以看到,分组GHEC之间的差异较小,分组ABDFIJK之间差异较小,这两类间均存在显著差异。

从指示变量矩阵的结果来看,GHEC特征向量之间的差异较小距离也较小,分组ABDFIJK之间差异较小距离也较小,这两类间均存在显著差异。

相关文章
|
1月前
【R语言实战】——带有高斯新息的金融时序的GARCH模型拟合预测及VAR/ES风险度量
【R语言实战】——带有高斯新息的金融时序的GARCH模型拟合预测及VAR/ES风险度量
|
1月前
|
数据可视化 数据挖掘 API
【R语言实战】聚类分析及可视化
【R语言实战】聚类分析及可视化
|
1月前
【R语言实战】——带有新息为标准学生t分布的金融时序的GARCH模型拟合预测
【R语言实战】——带有新息为标准学生t分布的金融时序的GARCH模型拟合预测
|
1月前
|
数据采集 数据可视化
利用R语言进行因子分析实战(数据+代码+可视化+详细分析)
利用R语言进行因子分析实战(数据+代码+可视化+详细分析)
|
1月前
利用R语言进行典型相关分析实战
利用R语言进行典型相关分析实战
|
1月前
|
Web App开发 数据可视化 数据挖掘
利用R语言进行聚类分析实战(数据+代码+可视化+详细分析)
利用R语言进行聚类分析实战(数据+代码+可视化+详细分析)
|
1月前
【R语言实战】——Logistic回归模型
【R语言实战】——Logistic回归模型
|
1月前
|
机器学习/深度学习 算法
R语言分类回归分析考研热现象分析与考研意愿价值变现
R语言分类回归分析考研热现象分析与考研意愿价值变现
|
1月前
|
数据可视化
R语言广义线性混合模型GLMMs在生态学中应用可视化2实例合集|附数据代码2
R语言广义线性混合模型GLMMs在生态学中应用可视化2实例合集|附数据代码
|
1月前
|
数据可视化 数据挖掘
R语言广义线性混合模型GLMMs在生态学中应用可视化2实例合集|附数据代码1
R语言广义线性混合模型GLMMs在生态学中应用可视化2实例合集|附数据代码

热门文章

最新文章