数据分享|R语言因子分析、相关性分析大学生兼职现状调查问卷数据可视化报告(上):https://developer.aliyun.com/article/1495635
1.相关性分析
datacor=data #数据转换格式 for(i in 1:ncol(data))data
cor(datacor[,c( "X1.您的性别是...", "X2.您的年级是..", "X3.你认为大学生有必要做兼职吗.", "X4.你是否做过兼职.", "X5.你认为兼职会影响你的学业吗.", "X6.当兼职与上课冲突时.你会怎么做啊.", "X7.您的家长是否同意您做兼职..",
## X1.您的性别是... ## X1.您的性别是... 1.000000000 ## X2.您的年级是.. 0.042512825 ## X3.你认为大学生有必要做兼职吗. -0.030839698 ## X4.你是否做过兼职. -0.123297805 ## X5.你认为兼职会影响你的学业吗. 0.005539643 ## X6.当兼职与上课冲突时.你会怎么做啊. -0.029378056 ## X7.您的家长是否同意您做兼职.. 0.066805816 ## X8.你会选择做哪类兼职工作. -0.137004420 ## X9.你认为兼职过程中.你最大的优势是什么. -0.022770679 ## 第10题.A.海报或广告专门的中介机构网站. -0.042489939 ## 第10题.B.自己寻找. 0.081411714 ## 第10题.C.学校勤工俭学中心.老师等介绍. -0.080161171 ## 第10题.D.经熟人介绍或帮忙.包括家人.亲朋.同学.. 0.147865453 ## X11.若有兼职工作.您一般会选择什么时间的去做... -0.017180008 ## X12.你所做兼职是否与你的专业相关. -0.005813594 ## X13.你的月支出大概是多少. -0.122891632 ## X14.你实际的兼职日收入是多少. 0.031984006 ## X15.您会将您的兼职收入主要用于何处. 0.068084808 ## 第16题.A.提高消费水平. -0.031216500 ## 第16题.B.经济独立.能够自己支付的部分费用.增加自身成就感. 0.015923196 ## 第16题.C.扩大交际圈.接触并认识更多的人.让自己更大胆地与他人交流. -0.090851946 ## 第16题.D.增加工作经验和社会阅历.为以后的工作奠定基础. -0.006566725 ## X17.参加了兼职你觉得自己的社会能力有提高吗. 0.039602685 ## 第18题.A.薪酬较低.或不按时发工资.且工作要求苛刻. -0.066757185 ## 第18题.B.未享受到相关社会福利. -0.028229221 ## 第18题.C.自己的合法权益得不到保护.没有与雇主签订劳动合同等. -0.055186313 ## 第18题.D.技术.技能水平不足. -0.024680535 ## 第18题.E.对岗位信息缺乏了解. -0.052506352 ## 第18题.F.其他. -0.015928568 ## X19.你有过兼职受骗的经历吗. 0.013443674 ## X20..假如.被骗后.你会如何处理. 0.005144417 ## X21.您认为是否需要成立专门的兼职指导机构.为有意兼职的学生提供帮助和安全保障.. 0.090247155 ## X2.您的年级是.. ## X1.您的性别是... 0.04251282 ## X2.您的年级是.. 1.00000000 ## X3.你认为大学生有必要做兼职吗. 0.02328564 ## X4.你是否做过兼职. 0.05841762 ## X5.你认为兼职会影响你的学业吗. -0.05933900 ## X6.当兼职与上课冲突时.你会怎么做啊. -0.01756077 ## X7.您的家长是否同意您做兼职.. 0.04212928 ## X8.你会选择做哪类兼职工作. -0.14379820 ## X9.你认为兼职过程中.你最大的优势是什么. -0.03209377 ## 第10题.A.海报或广告专门的中介机构网站. 0.11800058 ## 第10题.B.自己寻找. 0.01195255 ## 第10题.C.学校勤工俭学中心.老师等介绍. 0.03160803 ## 第10题.D.经熟人介绍或帮忙.包括家人.亲朋.同学.. 0.02014014 ## X11.若有兼职工作.您一般会选择什么时间的去做... -0.07427207 ## X12.你所做兼职是否与你的专业相关. 0.01138039 ## X13.你的月支出大概是多少. -0.09757589 ## X14.你实际的兼职日收入是多少. 0.09443707 ## X15.您会将您的兼职收入主要用于何处. 0.06202746 ## 第16题.A.提高消费水平. -0.12845729 ## 第16题.B.经济独立.能够自己支付的部分费用.增加自身成就感. -0.16314114 ## 第16题.C.扩大交际圈.接触并认识更多的人.让自己更大胆地与他人交流. -0.04307850 ## 第16题.D.增加工作经验和社会阅历.为以后的工作奠定基础. 0.11737488 ## X17.参加了兼职你觉得自己的社会能力有提高吗. 0.03273904 ## 第18题.A.薪酬较低.或不按时发工资.且工作要求苛刻. -0.09408986 ## 第18题.B.未享受到相关社会福利. 0.13129786 ## 第18题.C.自己的合法权益得不到保护.没有与雇主签订劳动合同等. 0.07424595 ## 第18题.D.技术.技能水平不足. 0.07324299 ## 第18题.E.对岗位信息缺乏了解. 0.06286382 ## 第18题.F.其他. -0.05536032 ## X19.你有过兼职受骗的经历吗. -0.06075709 ## X20..假如.被骗后.你会如何处理. 0.05179084 ## X21.您认为是否需要成立专门的兼职指导机构.为有意兼职的学生提供帮助和安全保障.. 0.04950582
数据归一化
data=scale(datacor)
变量间的相关分析
查看性别和大学生有必要做兼职之间是否有相关关系
cor.test您的性别是..., 你认为大学生有必要做兼职吗.)
## ## Pearson's product-moment correlation ## ## data: datacor$X1.您的性别是... and datacor$X3.你认为大学生有必要做兼职吗. ## t = -0.40229, df = 170, p-value = 0.688 ## alternative hypothesis: true correlation is not equal to 0 ## 95 percent confidence interval: ## -0.1796451 0.1193455 ## sample estimates: ## cor ## -0.0308397
检验的结果是,由于P =0.688> =0.05,因此在0.05的显署性水平下,接受原假设,认为两者之间具有相关关系。
查看性别和大学生有必要做兼职之间是否有相关关系
cor.test(X14.你实际的兼职日收入是多少., 2.您的年级是..)
## ## Pearson's product-moment correlation ## ## data: datacor$X14.你实际的兼职日收入是多少. and datacor$X2.您的年级是.. ## t = 1.2368, df = 170, p-value = 0.2179 ## alternative hypothesis: true correlation is not equal to 0 ## 95 percent confidence interval: ## -0.05598853 0.24067056 ## sample estimates: ## cor ## 0.09443707
检验的结果是,由于P =0.2179> =0.05,因此在0.05的显署性水平下,接受原假设,认为两者之间具有相关关系。
查看年级和大学生有必要做兼职之间是否有相关关系
## ## Pearson's product-moment correlation ## ## data: datacor$X2.您的年级是.. and datacor$X3.你认为大学生有必要做兼职吗. ## t = 0.30369, df = 170, p-value = 0.7617 ## alternative hypothesis: true correlation is not equal to 0 ## 95 percent confidence interval: ## -0.1267906 0.1723196 ## sample estimates: ## cor ## 0.02328564
检验的结果是,由于P =0.7617> =0.05,因此在0.05的显署性水平下,接受原假设,认为两者之间具有相关关系。
2.因子分析
因子分析模型
旋转前因子分析
5个因子
## Loading required package: rJava ## Loading required package: xlsxjars
famod1=facal(data, factors =5,na.a
## Uniquenesses: ## X1.您的性别是... ## 0.900 ## X2.您的年级是.. ## 0.932 ## X3.你认为大学生有必要做兼职吗. ## 0.868 ## X4.你是否做过兼职. ## 0.469 ## X5.你认为兼职会影响你的学业吗. ## 0.919 ## X6.当兼职与上课冲突时.你会怎么做啊. ## 0.005 ## X7.您的家长是否同意您做兼职.. ## 0.005 ## X8.你会选择做哪类兼职工作. ## 0.627 ## X9.你认为兼职过程中.你最大的优势是什么. ## 0.903 ## ## Loadings: ## Factor1 Factor2 Factor3 Factor4 ## X1.您的性别是... -0.202 -0.199 ## X2.您的年级是.. -0.245 ## X3.你认为大学生有必要做兼职吗. 0.130 0.305 ## X4.你是否做过兼职. 0.721 ## X5.你认为兼职会影响你的学业吗. 0.192 -0.160 ## X6.当兼职与上课冲突时.你会怎么做啊. 0.993 ## X7.您的家长是否同意您做兼职.. 0.942 0.186 -0.163 ## X8.你会选择做哪类兼职工作. 0.599 ## X9.你认为兼职过程中.你最大的优势是什么. ## Factor5 ## X1.您的性别是... ## X2.您的年级是.. ## X3.你认为大学生有必要做兼职吗. -0.112 ## X4.你是否做过兼职. ## X5.你认为兼职会影响你的学业吗. ## X6.当兼职与上课冲突时.你会怎么做啊. ## X7.您的家长是否同意您做兼职.. 0.213 ## X8.你会选择做哪类兼职工作. ## X9.你认为兼职过程中.你最大的优势是什么. 0.291 ## ## Factor1 Factor2 Factor3 Factor4 Factor5 ## SS loadings 1.040 0.938 0.722 0.500 0.171 ## Proportion Var 0.116 0.104 0.080 0.056 0.019 ## Cumulative Var 0.116 0.220 0.300 0.356 0.375 ## ## Test of the hypothesis that 5 factors are sufficient. ## The chi square statistic is 0.16 on 1 degree of freedom. ## The p-value is 0.686
从 结果 来看,5个主因子所解释的方差基本反映了10个指标的信息,第一个因子在 当兼职与上课冲突时.你会怎么做啊.的变量的载荷值较大,因子该因子反映的是兼职方面的能力,第二个因子在 .您的家长是否同意您做兼职变量的载荷较大。第三个因子在每个变量的载荷相似是一个综合因素,第四个因子在你会选择做哪类兼职工作问题上的载荷较大,而第5个因子在兼职过程中.你最大的优势是什么.上的载荷较大,因此,各个因子分分别可以代表这些的值的含义,从因子分析的结果来看,每个因子的意义比较明显。
plot(famod11)#绘制正交或斜交结果的图形,查看每个样本点再不同因子上的得分情况
fagram(famod11,simple=TRUE) #5个因子与变量之间的关系
$scores #因子得分
## ML2 ML1 ML3 ML4 ML5 ## 1 -3.0490655 -1.262501540 -0.58417383 -0.638971487 -0.1470792180 ## 2 -1.1945134 -0.407219501 1.53050633 -0.775454239 -0.5478973054 ## 3 0.7752151 -1.174287246 -0.56515289 0.194757467 -0.0233325030 ## 4 0.7696996 -0.175321580 -0.53169295 -0.649030083 0.2651034446 ## 5 0.7358433 -0.049096318 -0.47453116 -0.769184711 -0.4437886710 ## 6 -1.2114897 0.596534006 1.45720731 -0.624448954 0.5418134207 ## 7 0.6984950 -0.957581437 -0.42629731 0.678833324 -0.7255935212 ## 8 0.7996831 -1.215915018 -0.56416408 -0.667881871 -0.4843577109 ## 9 -1.3144948 0.879717981 1.69019496 0.203369517 -0.2747347224 ## 10 0.7329114 -0.335048160 1.17288720 -0.677389500 -0.5378620998 ## 11 0.6683811 0.038555664 -0.31728584 1.201085623 0.5316001573 ## 12 -3.1913211 0.018441194 -0.16244176 0.921761649 0.3640902428 ## 13 0.6574275 0.065027716 -0.14243201 0.892851266 0.0268117499 ## 14 0.5969834 2.214819639 -0.01412711 -0.186295749 0.3216652007 ## 15 -1.2562897 0.667520342 1.95971185 -0.654086524 -0.2226140727 ## 16 -1.1982862 -0.046730940 -0.51404964 -0.539145389 -0.1974830556 ## 17 0.7469984 -0.135627742 -0.41704475 -0.225732657 0.3002412238 ## 18 0.6797017 0.071022464 -0.40447546 0.310941885 -0.2111951279 ## 19 0.7212673 -1.101790984 -0.23206494 0.994154106 -0.0137572900 ## 20 0.6324663 2.123915086 -0.14960047 -0.400833936 0.6631493809 ## 21 -1.1150663 -1.309323254 -0.46811501 -0.365610298 0.1143476895 ## 22 -1.1772456 -0.114464666 -0.50358996 -0.714677976 -0.0388520527 ## 23 -1.1469654 -1.245203028 -0.31212551 -0.071517298 -0.0777115866 ## 24 0.7135691 -0.055091067 -0.21248771 -0.187275330 -0.2057817932 ## 25 0.7322209 -1.128263036 -0.40691877 1.302388464 0.4910311174 ## 26 -1.2219955 -0.066394792 -0.21184330 0.213923089 0.1979202156 ## 27 0.6498245 1.081642082 -0.13125944 0.138216600 0.3061473809 ## 28 0.6400693 1.107300720 -0.16077305 0.353800730 0.3838137499 ## 29 0.6699465 0.096681103 -0.43398907 0.526526015 -0.1335287589 ## 30 -1.1997212 -0.060400043 -0.47388675 -0.367986292 -0.0400866623 ## 31 0.7361399 -0.139241242 -0.25059557 -0.107172244 0.2668129506
=famod11$scores %*%)#每个样本的每个因子得分乘以因子方差权重 cbind(s,decre
## [,1] [,2] ## [1,] "0.684292148532709" "49" ## [2,] "0.682922604084486" "145" ## [3,] "0.637282813915165" "83" ## [4,] "0.63264266719218" "169" ## [5,] "0.52614929396462" "107" ## [6,] "0.47469132249647" "14" ## [7,] "0.44897869276371" "20"
绘制正交或斜交结果的图形,查看每个变量在不同因子上的载荷情况 图 中 不同点代表不同的变量,横轴和纵轴代表不同的主因子,如果变量在纵轴对应的因子上具有较高的载荷,则分布在散点图的左上角,若变量在横轴因子上有较大的载荷,则分布在右下角。从 上 图,可以看到5个因子在9个变量上载荷比重的关系,因子和变量之间有联系说明因子在这些变量上有较大的载荷,连线的数字表示该因子在该变量上的载荷值。从因子得分上,我们可以看到每个接受调查的用户在5个因子上的得分情况,从而判断每个接受调查用户在不同的兼职指标上的能力强弱。同时我们可以通过每个因子的方差解释程度作为权重来计算每个用户的综合因子得分。
4个因子分析
## Standardized loadings (pattern matrix) based upon correlation matrix ## ML2 ML1 ML3 ML4 h2 ## X1.您的性别是... 0.07 0.03 -0.20 -0.23 0.098 ## X2.您的年级是.. 0.04 0.02 0.07 -0.28 0.087 ## X3.你认为大学生有必要做兼职吗. 0.17 0.05 0.31 0.00 0.128 ## X4.你是否做过兼职. 0.11 0.14 0.67 -0.03 0.481 ## X5.你认为兼职会影响你的学业吗. -0.20 0.06 -0.17 0.07 0.079 ## X6.当兼职与上课冲突时.你会怎么做啊. -0.69 0.72 0.00 0.00 0.995 ## X7.您的家长是否同意您做兼职.. 0.69 0.72 0.00 0.00 0.995 ## X8.你会选择做哪类兼职工作. -0.20 -0.05 0.07 0.47 0.269 ## X9.你认为兼职过程中.你最大的优势是什么. 0.08 0.07 -0.12 0.13 0.043 ## u2 com ## X1.您的性别是... 0.902 2.2 ## X2.您的年级是.. 0.913 1.2 ## X3.你认为大学生有必要做兼职吗. 0.872 1.6 ## X4.你是否做过兼职. 0.519 1.1 ## X5.你认为兼职会影响你的学业吗. 0.921 2.4 ## X6.当兼职与上课冲突时.你会怎么做啊. 0.005 2.0 ## X7.您的家长是否同意您做兼职.. 0.005 2.0 ## X8.你会选择做哪类兼职工作. 0.731 1.4 ## X9.你认为兼职过程中.你最大的优势是什么. 0.957 3.2 ## ## ML2 ML1 ML3 ML4 ## SS loadings 1.09 1.07 0.64 0.38 ## Proportion Var 0.12 0.12 0.07 0.04 ## Cumulative Var 0.12 0.24 0.31 0.35 ## Proportion Explained 0.34 0.34 0.20 0.12 ## Cumulative Proportion 0.34 0.68 0.88 1.00 ## ## Mean item complexity = 1.9 ## Test of the hypothesis that 4 factors are sufficient. ## ## The degrees of freedom for the null model are 36 and the objective function was 0.31 with Chi Square of 51.93 ## The degrees of freedom for the model are 6 and the objective function was 0 ## ## The root mean square of the residuals (RMSR) is 0.01 ## The df corrected root mean square of the residuals is 0.02 ## ## The harmonic number of observations is 172 with the empirical chi square 0.98 with prob < 0.99 ## The total number of observations was 172 with MLE Chi Square = 0.58 with prob < 1 ## ## Tucker Lewis Index of factoring reliability = 3.152 ## RMSEA index = 0 and the 90 % confidence intervals are NA NA ## BIC = -30.3 ## Fit based upon off diagonal values = 0.99 ## Measures of factor score adequacy ## ML2 ML1 ML3 ML4 ## Correlation of scores with factors 1.00 1.00 0.72 0.57 ## Multiple R square of scores with factors 0.99 1.00 0.52 0.32 ## Minimum correlation of possible factor scores 0.99 0.99 0.04 -0.35
从结果来看,3个主因子所解释的方差占整个方差的80%左右,基本反映了11个指标的信息,第一个因子.当兼职与上课冲突时.你会怎么做啊和您的家长是否同意您做兼职.的变量的载荷值较大,因此该因子反映的是兼职和个人家庭学业方面关系的能力,第5个因子在性别和年级两个变量的载荷较大,反应的是调查者的节本情况。第3个因子在是否做过兼职的载荷较大,所以可以代表兼职经验的能力。因此,各个因子分分别可以代表这些的值的含义,从因子分析的结果来看,每个因子的经济意义比较明显。图中 不同点代表不同的变量,横轴和纵轴代表不同的主因子,如果变量在纵轴对应的因子上具有较高的载荷,则分布在散点图的左上角,若变量在横轴因子上有较大的载荷,则分布在右下角。从上图,可以看到4个因子在11个变量上载荷比重的关系,因子和变量之间有联系说明因子在这些变量上有较大的载荷,连线的数字表示该因子在该变量上的载荷值。