R语言稀疏主成分分析、因子分析、KMO检验和Bartlett球度检验分析上市公司财务指标数据

简介: R语言稀疏主成分分析、因子分析、KMO检验和Bartlett球度检验分析上市公司财务指标数据

全文链接:http://tecdat.cn/?p=31080


R中的主成分分析(PCA)和因子分析是统计分析技术,也称为多元分析技术点击文末“阅读原文”获取完整代码数据


当可用的数据有太多的变量无法进行分析时,主成分分析(PCA)和因子分析在R中最有用,它们在不损害他们所传达的信息的情况下减少了需要分析的变量的数量。

我们和一位客户讨论过如何在R软件中实现稀疏主成分分析

稀疏主成分分析会把主成分系数(构成主成分时每个变量前面的系数)变的稀疏,也即是把大多数系数都变成零,通过这样一种方式,我们就可以把主成分的主要的部分凸现出来,这样主成分就会变得较为容易解释。

相关视频


)NO3_H7OQCKJX_72(090}7B.png

上市公司财务分析指标数据

KW1L7VS{$LH8888[S]Q[9GQ.png

KMO检验和Bartlett球度检验

KMO检验

kmo = function( data ){
  
  library(MASS)
  X <- cor(as.matrix(data))
  iX <- ginv(X)
  S2 <- diag(diag((iX^-1)))
  AIS <- S2%*%iX%*%S2

J%HUFR]D8XD1Z00%}6]0T4E.png

Bartlett球形检验:

bartlett(cor(data[,3:(ncol(data)-1)]

0%O]QSGR%D}(TG3MEIZB4$N.png

相关性检验

输出相关系数矩阵

cor(data[,3:(ncol(data) )])

(RS5NG0(%8T3U@VVPGZOS5Q.png

绘制变量两两相关散点图

%EIA1{@PBSVZ1~C%1TX{DSF.png


点击标题查阅往期内容


962(2DRR6_QWYC0`0_$X95R.png

R语言主成分PCA、因子分析、聚类对地区经济研究分析重庆市经济指标


左右滑动查看更多

01

IMM71PV]{8)59O3XG{`PQKL.png

02

FAU[9_[[O)`PXC6H7EPJT90.png

03

ASMI{)Z2%F%)@_@~{P_]PO0.png

04

70)QTEDDE1G)G3G531L7}BW.png



稀疏主成分分析

library(MASS)
set.seed(1)
 #稀疏主成分分析建模
 
nspc <- nsprc(data[,3:

K34T%VBN[WV%R)%R17JVT[J.png

主成分载荷

2A[PMO[0%ZI6[%G1)KQ}]~4.png

绘制前两个主成分的载荷图

plot(load ) # set up plot 
text(load,labels=names(mydata),ce

RGZ8]{)T{A0VD)RL1I6R322.png

因子分析

library(psych)
parallel

YXH~1W@%JLWDHMJVB)B6~HC.png

并行分析表明,因子数=8。

fit <- fa(r=cor

7I4$WW$CE]_)`4[77OBKLJJ.png

因子载荷

(~JK2PLI@8%BUG[(D63XF8O.png

绘制前两个因子载荷

A%2~(7%NH{N19U2QV)WK%3A.png

绘制因子载荷矩阵

因子分析或主成分分析的结果用每个因子上的主要载荷来初步解释。这些结构可以用载荷表表示,也可以用图形表示,其中所有具有绝对值>某个切点的载荷都表示为边(路径)。

SORK[OYVZBA15K8EO%ZZ51O.png

相关文章
|
2月前
|
数据采集 机器学习/深度学习 数据可视化
R语言从数据到决策:R语言在商业分析中的实践
【9月更文挑战第1天】R语言在商业分析中的应用广泛而深入,从数据收集、预处理、分析到预测模型构建和决策支持,R语言都提供了强大的工具和功能。通过学习和掌握R语言在商业分析中的实践应用,我们可以更好地利用数据驱动企业决策,提升企业的竞争力和盈利能力。未来,随着大数据和人工智能技术的不断发展,R语言在商业分析领域的应用将更加广泛和深入,为企业带来更多的机遇和挑战。
|
22天前
|
数据挖掘 C语言 C++
R语言是一种强大的统计分析工具,提供了丰富的函数和包用于时间序列分析。
【10月更文挑战第21天】时间序列分析是一种重要的数据分析方法,广泛应用于经济学、金融学、气象学、生态学等领域。R语言是一种强大的统计分析工具,提供了丰富的函数和包用于时间序列分析。本文将介绍使用R语言进行时间序列分析的基本概念、方法和实例,帮助读者掌握R语言在时间序列分析中的应用。
40 3
|
2月前
R语言基于表格文件的数据绘制具有多个系列的柱状图与直方图
【9月更文挑战第9天】在R语言中,利用`ggplot2`包可绘制多系列柱状图与直方图。首先读取数据文件`data.csv`,加载`ggplot2`包后,使用`ggplot`函数指定轴与填充颜色,并通过`geom_bar`或`geom_histogram`绘图。参数如`stat`, `position`, `alpha`等可根据需要调整,实现不同系列的图表展示。
|
2月前
|
数据采集 数据可视化 数据挖掘
R语言在金融数据分析中的深度应用:探索数据背后的市场智慧
【9月更文挑战第1天】R语言在金融数据分析中展现出了强大的功能和广泛的应用前景。通过丰富的数据处理函数、强大的统计分析功能和优秀的可视化效果,R语言能够帮助金融机构深入挖掘数据价值,洞察市场动态。未来,随着金融数据的不断积累和技术的不断进步,R语言在金融数据分析中的应用将更加广泛和深入。
|
6月前
|
数据可视化 数据挖掘 API
【R语言实战】聚类分析及可视化
【R语言实战】聚类分析及可视化
|
6月前
|
机器学习/深度学习 数据可视化
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为2
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为
|
3月前
|
机器学习/深度学习 数据采集 数据可视化
R语言在数据科学中的应用实例:探索与预测分析
【8月更文挑战第31天】通过上述实例,我们展示了R语言在数据科学中的强大应用。从数据准备、探索、预处理到建模与预测,R语言提供了完整的解决方案和丰富的工具集。当然,数据科学远不止于此,随着技术的不断发展和业务需求的不断变化,我们需要不断学习和探索新的方法和工具,以更好地应对挑战,挖掘数据的潜在价值。 未来,随着大数据和人工智能技术的普及,R语言在数据科学领域的应用将更加广泛和深入。我们期待看到更多创新的应用实例,为各行各业的发展注入新的动力。
|
3月前
|
数据采集 存储 数据可视化
R语言时间序列分析:处理与建模时间序列数据的深度探索
【8月更文挑战第31天】R语言作为一款功能强大的数据分析工具,为处理时间序列数据提供了丰富的函数和包。从数据读取、预处理、建模到可视化,R语言都提供了灵活且强大的解决方案。然而,时间序列数据的处理和分析是一个复杂的过程,需要结合具体的应用场景和需求来选择合适的方法和模型。希望本文能为读者在R语言中进行时间序列分析提供一些有益的参考和启示。
|
3月前
|
资源调度 数据挖掘
R语言回归分析:线性回归模型的构建与评估
【8月更文挑战第31天】线性回归模型是统计分析中一种重要且实用的工具,能够帮助我们理解和预测自变量与因变量之间的线性关系。在R语言中,我们可以轻松地构建和评估线性回归模型,从而对数据背后的关系进行深入的探索和分析。
|
3月前
|
机器学习/深度学习 数据采集
R语言逻辑回归、GAM、LDA、KNN、PCA主成分分类分析预测房价及交叉验证
上述介绍仅为简要概述,每个模型在实施时都需要仔细调整与优化。为了实现高度精确的预测,模型选择与调参是至关重要的步骤,并且交叉验证是提升模型稳健性的有效途径。在真实世界的房价预测问题中,可能还需要结合地域经济、市场趋势等宏观因素进行综合分析。
69 3