数据分享|R语言因子分析、相关性分析大学生兼职现状调查问卷数据可视化报告(下)

简介: 数据分享|R语言因子分析、相关性分析大学生兼职现状调查问卷数据可视化报告

数据分享|R语言因子分析、相关性分析大学生兼职现状调查问卷数据可视化报告(上):https://developer.aliyun.com/article/1495635


1.相关性分析

datacor=data
#数据转换格式
for(i in 1:ncol(data))data
cor(datacor[,c(  
              "X1.您的性别是...",
              "X2.您的年级是..",
              "X3.你认为大学生有必要做兼职吗.",
              "X4.你是否做过兼职.",
              "X5.你认为兼职会影响你的学业吗.",
              "X6.当兼职与上课冲突时.你会怎么做啊.",
              "X7.您的家长是否同意您做兼职..",
##                                                                               X1.您的性别是...
## X1.您的性别是...                                                                   1.000000000
## X2.您的年级是..                                                                    0.042512825
## X3.你认为大学生有必要做兼职吗.                                                    -0.030839698
## X4.你是否做过兼职.                                                                -0.123297805
## X5.你认为兼职会影响你的学业吗.                                                     0.005539643
## X6.当兼职与上课冲突时.你会怎么做啊.                                               -0.029378056
## X7.您的家长是否同意您做兼职..                                                      0.066805816
## X8.你会选择做哪类兼职工作.                                                        -0.137004420
## X9.你认为兼职过程中.你最大的优势是什么.                                           -0.022770679
## 第10题.A.海报或广告专门的中介机构网站.                                            -0.042489939
## 第10题.B.自己寻找.                                                                 0.081411714
## 第10题.C.学校勤工俭学中心.老师等介绍.                                             -0.080161171
## 第10题.D.经熟人介绍或帮忙.包括家人.亲朋.同学..                                     0.147865453
## X11.若有兼职工作.您一般会选择什么时间的去做...                                    -0.017180008
## X12.你所做兼职是否与你的专业相关.                                                 -0.005813594
## X13.你的月支出大概是多少.                                                         -0.122891632
## X14.你实际的兼职日收入是多少.                                                      0.031984006
## X15.您会将您的兼职收入主要用于何处.                                                0.068084808
## 第16题.A.提高消费水平.                                                            -0.031216500
## 第16题.B.经济独立.能够自己支付的部分费用.增加自身成就感.                           0.015923196
## 第16题.C.扩大交际圈.接触并认识更多的人.让自己更大胆地与他人交流.                  -0.090851946
## 第16题.D.增加工作经验和社会阅历.为以后的工作奠定基础.                             -0.006566725
## X17.参加了兼职你觉得自己的社会能力有提高吗.                                        0.039602685
## 第18题.A.薪酬较低.或不按时发工资.且工作要求苛刻.                                  -0.066757185
## 第18题.B.未享受到相关社会福利.                                                    -0.028229221
## 第18题.C.自己的合法权益得不到保护.没有与雇主签订劳动合同等.                       -0.055186313
## 第18题.D.技术.技能水平不足.                                                       -0.024680535
## 第18题.E.对岗位信息缺乏了解.                                                      -0.052506352
## 第18题.F.其他.                                                                    -0.015928568
## X19.你有过兼职受骗的经历吗.                                                        0.013443674
## X20..假如.被骗后.你会如何处理.                                                     0.005144417
## X21.您认为是否需要成立专门的兼职指导机构.为有意兼职的学生提供帮助和安全保障..      0.090247155
##                                                                               X2.您的年级是..
## X1.您的性别是...                                                                   0.04251282
## X2.您的年级是..                                                                    1.00000000
## X3.你认为大学生有必要做兼职吗.                                                     0.02328564
## X4.你是否做过兼职.                                                                 0.05841762
## X5.你认为兼职会影响你的学业吗.                                                    -0.05933900
## X6.当兼职与上课冲突时.你会怎么做啊.                                               -0.01756077
## X7.您的家长是否同意您做兼职..                                                      0.04212928
## X8.你会选择做哪类兼职工作.                                                        -0.14379820
## X9.你认为兼职过程中.你最大的优势是什么.                                           -0.03209377
## 第10题.A.海报或广告专门的中介机构网站.                                             0.11800058
## 第10题.B.自己寻找.                                                                 0.01195255
## 第10题.C.学校勤工俭学中心.老师等介绍.                                              0.03160803
## 第10题.D.经熟人介绍或帮忙.包括家人.亲朋.同学..                                     0.02014014
## X11.若有兼职工作.您一般会选择什么时间的去做...                                    -0.07427207
## X12.你所做兼职是否与你的专业相关.                                                  0.01138039
## X13.你的月支出大概是多少.                                                         -0.09757589
## X14.你实际的兼职日收入是多少.                                                      0.09443707
## X15.您会将您的兼职收入主要用于何处.                                                0.06202746
## 第16题.A.提高消费水平.                                                            -0.12845729
## 第16题.B.经济独立.能够自己支付的部分费用.增加自身成就感.                          -0.16314114
## 第16题.C.扩大交际圈.接触并认识更多的人.让自己更大胆地与他人交流.                  -0.04307850
## 第16题.D.增加工作经验和社会阅历.为以后的工作奠定基础.                              0.11737488
## X17.参加了兼职你觉得自己的社会能力有提高吗.                                        0.03273904
## 第18题.A.薪酬较低.或不按时发工资.且工作要求苛刻.                                  -0.09408986
## 第18题.B.未享受到相关社会福利.                                                     0.13129786
## 第18题.C.自己的合法权益得不到保护.没有与雇主签订劳动合同等.                        0.07424595
## 第18题.D.技术.技能水平不足.                                                        0.07324299
## 第18题.E.对岗位信息缺乏了解.                                                       0.06286382
## 第18题.F.其他.                                                                    -0.05536032
## X19.你有过兼职受骗的经历吗.                                                       -0.06075709
## X20..假如.被骗后.你会如何处理.                                                     0.05179084
## X21.您认为是否需要成立专门的兼职指导机构.为有意兼职的学生提供帮助和安全保障..      0.04950582

数据归一化

data=scale(datacor)

变量间的相关分析

查看性别和大学生有必要做兼职之间是否有相关关系

cor.test您的性别是...,
         你认为大学生有必要做兼职吗.)
## 
##  Pearson's product-moment correlation
## 
## data:  datacor$X1.您的性别是... and datacor$X3.你认为大学生有必要做兼职吗.
## t = -0.40229, df = 170, p-value = 0.688
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.1796451  0.1193455
## sample estimates:
##        cor 
## -0.0308397

检验的结果是,由于P =0.688> =0.05,因此在0.05的显署性水平下,接受原假设,认为两者之间具有相关关系。

查看性别和大学生有必要做兼职之间是否有相关关系

cor.test(X14.你实际的兼职日收入是多少.,
       2.您的年级是..)
## 
##  Pearson's product-moment correlation
## 
## data:  datacor$X14.你实际的兼职日收入是多少. and datacor$X2.您的年级是..
## t = 1.2368, df = 170, p-value = 0.2179
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.05598853  0.24067056
## sample estimates:
##        cor 
## 0.09443707

检验的结果是,由于P =0.2179> =0.05,因此在0.05的显署性水平下,接受原假设,认为两者之间具有相关关系。

查看年级和大学生有必要做兼职之间是否有相关关系

## 
##  Pearson's product-moment correlation
## 
## data:  datacor$X2.您的年级是.. and datacor$X3.你认为大学生有必要做兼职吗.
## t = 0.30369, df = 170, p-value = 0.7617
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.1267906  0.1723196
## sample estimates:
##        cor 
## 0.02328564

检验的结果是,由于P =0.7617> =0.05,因此在0.05的显署性水平下,接受原假设,认为两者之间具有相关关系。


2.因子分析


因子分析模型

旋转前因子分析

5个因子

## Loading required package: rJava
## Loading required package: xlsxjars
famod1=facal(data, factors =5,na.a

## Uniquenesses:
##                        X1.您的性别是... 
##                                   0.900 
##                         X2.您的年级是.. 
##                                   0.932 
##          X3.你认为大学生有必要做兼职吗. 
##                                   0.868 
##                      X4.你是否做过兼职. 
##                                   0.469 
##          X5.你认为兼职会影响你的学业吗. 
##                                   0.919 
##     X6.当兼职与上课冲突时.你会怎么做啊. 
##                                   0.005 
##           X7.您的家长是否同意您做兼职.. 
##                                   0.005 
##              X8.你会选择做哪类兼职工作. 
##                                   0.627 
## X9.你认为兼职过程中.你最大的优势是什么. 
##                                   0.903 
## 
## Loadings:
##                                         Factor1 Factor2 Factor3 Factor4
## X1.您的性别是...                                        -0.202  -0.199 
## X2.您的年级是..                                                 -0.245 
## X3.你认为大学生有必要做兼职吗.                   0.130   0.305         
## X4.你是否做过兼职.                                       0.721         
## X5.你认为兼职会影响你的学业吗.           0.192          -0.160         
## X6.当兼职与上课冲突时.你会怎么做啊.      0.993                         
## X7.您的家长是否同意您做兼职..                    0.942   0.186  -0.163 
## X8.你会选择做哪类兼职工作.                                       0.599 
## X9.你认为兼职过程中.你最大的优势是什么.                                
##                                         Factor5
## X1.您的性别是...                               
## X2.您的年级是..                                
## X3.你认为大学生有必要做兼职吗.          -0.112 
## X4.你是否做过兼职.                             
## X5.你认为兼职会影响你的学业吗.                 
## X6.当兼职与上课冲突时.你会怎么做啊.            
## X7.您的家长是否同意您做兼职..            0.213 
## X8.你会选择做哪类兼职工作.                     
## X9.你认为兼职过程中.你最大的优势是什么.  0.291 
## 
##                Factor1 Factor2 Factor3 Factor4 Factor5
## SS loadings      1.040   0.938   0.722   0.500   0.171
## Proportion Var   0.116   0.104   0.080   0.056   0.019
## Cumulative Var   0.116   0.220   0.300   0.356   0.375
## 
## Test of the hypothesis that 5 factors are sufficient.
## The chi square statistic is 0.16 on 1 degree of freedom.
## The p-value is 0.686

从 结果 来看,5个主因子所解释的方差基本反映了10个指标的信息,第一个因子在 当兼职与上课冲突时.你会怎么做啊.的变量的载荷值较大,因子该因子反映的是兼职方面的能力,第二个因子在 .您的家长是否同意您做兼职变量的载荷较大。第三个因子在每个变量的载荷相似是一个综合因素,第四个因子在你会选择做哪类兼职工作问题上的载荷较大,而第5个因子在兼职过程中.你最大的优势是什么.上的载荷较大,因此,各个因子分分别可以代表这些的值的含义,从因子分析的结果来看,每个因子的意义比较明显。

plot(famod11)#绘制正交或斜交结果的图形,查看每个样本点再不同因子上的得分情况

fagram(famod11,simple=TRUE)  #5个因子与变量之间的关系

$scores  #因子得分
##            ML2          ML1         ML3          ML4           ML5
## 1   -3.0490655 -1.262501540 -0.58417383 -0.638971487 -0.1470792180
## 2   -1.1945134 -0.407219501  1.53050633 -0.775454239 -0.5478973054
## 3    0.7752151 -1.174287246 -0.56515289  0.194757467 -0.0233325030
## 4    0.7696996 -0.175321580 -0.53169295 -0.649030083  0.2651034446
## 5    0.7358433 -0.049096318 -0.47453116 -0.769184711 -0.4437886710
## 6   -1.2114897  0.596534006  1.45720731 -0.624448954  0.5418134207
## 7    0.6984950 -0.957581437 -0.42629731  0.678833324 -0.7255935212
## 8    0.7996831 -1.215915018 -0.56416408 -0.667881871 -0.4843577109
## 9   -1.3144948  0.879717981  1.69019496  0.203369517 -0.2747347224
## 10   0.7329114 -0.335048160  1.17288720 -0.677389500 -0.5378620998
## 11   0.6683811  0.038555664 -0.31728584  1.201085623  0.5316001573
## 12  -3.1913211  0.018441194 -0.16244176  0.921761649  0.3640902428
## 13   0.6574275  0.065027716 -0.14243201  0.892851266  0.0268117499
## 14   0.5969834  2.214819639 -0.01412711 -0.186295749  0.3216652007
## 15  -1.2562897  0.667520342  1.95971185 -0.654086524 -0.2226140727
## 16  -1.1982862 -0.046730940 -0.51404964 -0.539145389 -0.1974830556
## 17   0.7469984 -0.135627742 -0.41704475 -0.225732657  0.3002412238
## 18   0.6797017  0.071022464 -0.40447546  0.310941885 -0.2111951279
## 19   0.7212673 -1.101790984 -0.23206494  0.994154106 -0.0137572900
## 20   0.6324663  2.123915086 -0.14960047 -0.400833936  0.6631493809
## 21  -1.1150663 -1.309323254 -0.46811501 -0.365610298  0.1143476895
## 22  -1.1772456 -0.114464666 -0.50358996 -0.714677976 -0.0388520527
## 23  -1.1469654 -1.245203028 -0.31212551 -0.071517298 -0.0777115866
## 24   0.7135691 -0.055091067 -0.21248771 -0.187275330 -0.2057817932
## 25   0.7322209 -1.128263036 -0.40691877  1.302388464  0.4910311174
## 26  -1.2219955 -0.066394792 -0.21184330  0.213923089  0.1979202156
## 27   0.6498245  1.081642082 -0.13125944  0.138216600  0.3061473809
## 28   0.6400693  1.107300720 -0.16077305  0.353800730  0.3838137499
## 29   0.6699465  0.096681103 -0.43398907  0.526526015 -0.1335287589
## 30  -1.1997212 -0.060400043 -0.47388675 -0.367986292 -0.0400866623
## 31   0.7361399 -0.139241242 -0.25059557 -0.107172244  0.2668129506
=famod11$scores %*%)#每个样本的每个因子得分乘以因子方差权重
cbind(s,decre
##        [,1]                    [,2] 
##   [1,] "0.684292148532709"     "49" 
##   [2,] "0.682922604084486"     "145"
##   [3,] "0.637282813915165"     "83" 
##   [4,] "0.63264266719218"      "169"
##   [5,] "0.52614929396462"      "107"
##   [6,] "0.47469132249647"      "14" 
##   [7,] "0.44897869276371"      "20"

绘制正交或斜交结果的图形,查看每个变量在不同因子上的载荷情况 图 中 不同点代表不同的变量,横轴和纵轴代表不同的主因子,如果变量在纵轴对应的因子上具有较高的载荷,则分布在散点图的左上角,若变量在横轴因子上有较大的载荷,则分布在右下角。从 上 图,可以看到5个因子在9个变量上载荷比重的关系,因子和变量之间有联系说明因子在这些变量上有较大的载荷,连线的数字表示该因子在该变量上的载荷值。从因子得分上,我们可以看到每个接受调查的用户在5个因子上的得分情况,从而判断每个接受调查用户在不同的兼职指标上的能力强弱。同时我们可以通过每个因子的方差解释程度作为权重来计算每个用户的综合因子得分。

4个因子分析

## Standardized loadings (pattern matrix) based upon correlation matrix
##                                           ML2   ML1   ML3   ML4    h2
## X1.您的性别是...                         0.07  0.03 -0.20 -0.23 0.098
## X2.您的年级是..                          0.04  0.02  0.07 -0.28 0.087
## X3.你认为大学生有必要做兼职吗.           0.17  0.05  0.31  0.00 0.128
## X4.你是否做过兼职.                       0.11  0.14  0.67 -0.03 0.481
## X5.你认为兼职会影响你的学业吗.          -0.20  0.06 -0.17  0.07 0.079
## X6.当兼职与上课冲突时.你会怎么做啊.     -0.69  0.72  0.00  0.00 0.995
## X7.您的家长是否同意您做兼职..            0.69  0.72  0.00  0.00 0.995
## X8.你会选择做哪类兼职工作.              -0.20 -0.05  0.07  0.47 0.269
## X9.你认为兼职过程中.你最大的优势是什么.  0.08  0.07 -0.12  0.13 0.043
##                                            u2 com
## X1.您的性别是...                        0.902 2.2
## X2.您的年级是..                         0.913 1.2
## X3.你认为大学生有必要做兼职吗.          0.872 1.6
## X4.你是否做过兼职.                      0.519 1.1
## X5.你认为兼职会影响你的学业吗.          0.921 2.4
## X6.当兼职与上课冲突时.你会怎么做啊.     0.005 2.0
## X7.您的家长是否同意您做兼职..           0.005 2.0
## X8.你会选择做哪类兼职工作.              0.731 1.4
## X9.你认为兼职过程中.你最大的优势是什么. 0.957 3.2
## 
##                        ML2  ML1  ML3  ML4
## SS loadings           1.09 1.07 0.64 0.38
## Proportion Var        0.12 0.12 0.07 0.04
## Cumulative Var        0.12 0.24 0.31 0.35
## Proportion Explained  0.34 0.34 0.20 0.12
## Cumulative Proportion 0.34 0.68 0.88 1.00
## 
## Mean item complexity =  1.9
## Test of the hypothesis that 4 factors are sufficient.
## 
## The degrees of freedom for the null model are  36  and the objective function was  0.31 with Chi Square of  51.93
## The degrees of freedom for the model are 6  and the objective function was  0 
## 
## The root mean square of the residuals (RMSR) is  0.01 
## The df corrected root mean square of the residuals is  0.02 
## 
## The harmonic number of observations is  172 with the empirical chi square  0.98  with prob <  0.99 
## The total number of observations was  172  with MLE Chi Square =  0.58  with prob <  1 
## 
## Tucker Lewis Index of factoring reliability =  3.152
## RMSEA index =  0  and the 90 % confidence intervals are  NA NA
## BIC =  -30.3
## Fit based upon off diagonal values = 0.99
## Measures of factor score adequacy             
##                                                 ML2  ML1  ML3   ML4
## Correlation of scores with factors             1.00 1.00 0.72  0.57
## Multiple R square of scores with factors       0.99 1.00 0.52  0.32
## Minimum correlation of possible factor scores  0.99 0.99 0.04 -0.35

从结果来看,3个主因子所解释的方差占整个方差的80%左右,基本反映了11个指标的信息,第一个因子.当兼职与上课冲突时.你会怎么做啊和您的家长是否同意您做兼职.的变量的载荷值较大,因此该因子反映的是兼职和个人家庭学业方面关系的能力,第5个因子在性别和年级两个变量的载荷较大,反应的是调查者的节本情况。第3个因子在是否做过兼职的载荷较大,所以可以代表兼职经验的能力。因此,各个因子分分别可以代表这些的值的含义,从因子分析的结果来看,每个因子的经济意义比较明显。图中 不同点代表不同的变量,横轴和纵轴代表不同的主因子,如果变量在纵轴对应的因子上具有较高的载荷,则分布在散点图的左上角,若变量在横轴因子上有较大的载荷,则分布在右下角。从上图,可以看到4个因子在11个变量上载荷比重的关系,因子和变量之间有联系说明因子在这些变量上有较大的载荷,连线的数字表示该因子在该变量上的载荷值。


相关文章
|
2月前
|
数据采集 机器学习/深度学习 数据可视化
R语言从数据到决策:R语言在商业分析中的实践
【9月更文挑战第1天】R语言在商业分析中的应用广泛而深入,从数据收集、预处理、分析到预测模型构建和决策支持,R语言都提供了强大的工具和功能。通过学习和掌握R语言在商业分析中的实践应用,我们可以更好地利用数据驱动企业决策,提升企业的竞争力和盈利能力。未来,随着大数据和人工智能技术的不断发展,R语言在商业分析领域的应用将更加广泛和深入,为企业带来更多的机遇和挑战。
|
27天前
|
数据挖掘 C语言 C++
R语言是一种强大的统计分析工具,提供了丰富的函数和包用于时间序列分析。
【10月更文挑战第21天】时间序列分析是一种重要的数据分析方法,广泛应用于经济学、金融学、气象学、生态学等领域。R语言是一种强大的统计分析工具,提供了丰富的函数和包用于时间序列分析。本文将介绍使用R语言进行时间序列分析的基本概念、方法和实例,帮助读者掌握R语言在时间序列分析中的应用。
42 3
|
2月前
|
数据采集 数据可视化 数据挖掘
R语言在金融数据分析中的深度应用:探索数据背后的市场智慧
【9月更文挑战第1天】R语言在金融数据分析中展现出了强大的功能和广泛的应用前景。通过丰富的数据处理函数、强大的统计分析功能和优秀的可视化效果,R语言能够帮助金融机构深入挖掘数据价值,洞察市场动态。未来,随着金融数据的不断积累和技术的不断进步,R语言在金融数据分析中的应用将更加广泛和深入。
|
6月前
|
数据可视化 数据挖掘 API
【R语言实战】聚类分析及可视化
【R语言实战】聚类分析及可视化
|
6月前
|
机器学习/深度学习 数据可视化
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为2
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为
|
3月前
|
机器学习/深度学习 数据采集 数据可视化
R语言在数据科学中的应用实例:探索与预测分析
【8月更文挑战第31天】通过上述实例,我们展示了R语言在数据科学中的强大应用。从数据准备、探索、预处理到建模与预测,R语言提供了完整的解决方案和丰富的工具集。当然,数据科学远不止于此,随着技术的不断发展和业务需求的不断变化,我们需要不断学习和探索新的方法和工具,以更好地应对挑战,挖掘数据的潜在价值。 未来,随着大数据和人工智能技术的普及,R语言在数据科学领域的应用将更加广泛和深入。我们期待看到更多创新的应用实例,为各行各业的发展注入新的动力。
|
3月前
|
数据采集 存储 数据可视化
R语言时间序列分析:处理与建模时间序列数据的深度探索
【8月更文挑战第31天】R语言作为一款功能强大的数据分析工具,为处理时间序列数据提供了丰富的函数和包。从数据读取、预处理、建模到可视化,R语言都提供了灵活且强大的解决方案。然而,时间序列数据的处理和分析是一个复杂的过程,需要结合具体的应用场景和需求来选择合适的方法和模型。希望本文能为读者在R语言中进行时间序列分析提供一些有益的参考和启示。
|
3月前
|
资源调度 数据挖掘
R语言回归分析:线性回归模型的构建与评估
【8月更文挑战第31天】线性回归模型是统计分析中一种重要且实用的工具,能够帮助我们理解和预测自变量与因变量之间的线性关系。在R语言中,我们可以轻松地构建和评估线性回归模型,从而对数据背后的关系进行深入的探索和分析。
|
3月前
|
机器学习/深度学习 数据采集
R语言逻辑回归、GAM、LDA、KNN、PCA主成分分类分析预测房价及交叉验证
上述介绍仅为简要概述,每个模型在实施时都需要仔细调整与优化。为了实现高度精确的预测,模型选择与调参是至关重要的步骤,并且交叉验证是提升模型稳健性的有效途径。在真实世界的房价预测问题中,可能还需要结合地域经济、市场趋势等宏观因素进行综合分析。
71 3
|
6月前
|
数据采集 数据可视化
利用R语言进行因子分析实战(数据+代码+可视化+详细分析)
利用R语言进行因子分析实战(数据+代码+可视化+详细分析)