SPSS大学生网络购物行为研究:因子分析、主成分、聚类、交叉表和卡方检验

简介: SPSS大学生网络购物行为研究:因子分析、主成分、聚类、交叉表和卡方检验

随着互联网的普及和电子商务的快速发展,网络购物已成为大学生日常生活中不可或缺的一部分。大学生作为网络购物的主体力量,其消费观念、行为特征以及影响因素对于电子商务行业的发展具有重要的研究价值。因此,本文旨在通过问卷调查的方式,帮助客户对大学生网络购物行为进行深入调查与分析,以期为电子商务企业提供有针对性的市场策略建议点击文末“阅读原文”获取完整代码数据

相关视频

image.png

image.png

在本次调查中,我们精心设计了问卷,问卷内容涵盖了大学生网络购物的多个方面,包括购物频率、购物平台选择、购物动机、购物满意度等。问卷题型设置上,我们采用了单选题和多选题两种形式,以确保调查结果的全面性和准确性。每个问题在数据表格中占据一列,方便后续的数据整理与分析。

在数据分析方面,我们采用了多种方法。首先,通过样本描述统计,我们利用频率分布表对样本进行了详细的分析,包括总样本百分比、有效百分比以及累积百分比等,这些数据为我们提供了大学生网络购物行为的基本概况。同时,我们还利用专业统计分析软件对数据进行处理,通过直方图和饼图直观地展示了每个变量状态的值,使得分析结果更加直观易懂。

其次,我们运用了因素分析的方法,通过解释变量之间的相关性来揭示数据结构。因子分析作为一种有效的数据分析工具,能够将大量变量归结为几个维度,从而简化数据结构。在本研究中,我们利用因子分析对大学生网络购物行为的影响因素进行了探究,进一步揭示了大学生网络购物行为背后的深层次原因。

此外,我们还采用了聚类分析的方法,特别是k-means聚类算法。这种方法有助于我们将具有相似网络购物行为特征的大学生群体进行归类,从而更好地理解不同群体之间的差异和共性。

最后,为了探究不同生活方式对大学生网络购物行为的影响,我们结合了交叉表和卡方检验。通过卡方检验,我们在显著性水平上检验了原始假设的合理性。随后,利用交叉表展示了不同生活方式类型的学生在网络购物行为上的差异,为电子商务企业针对不同生活方式的大学生制定个性化市场策略提供了有力支持。

用描述性统计

被调查学生性别统计:男生67人,女生140人。男女比例接近于1:2 。

234d53adfc5789ea8ea9ee73c3793010.png



8fb0e37081d8ac779aa25be3ba4a365e.png

从性别比例的频数表格来看,女生有140个人,占比67.6%,男生为67个人占比32.4%。因此被调查者中女生居多,男生偏少。

然后我们查看所有年级的比例

3d560982db02a0faa7468941e57d5417.png


从饼图中我们可以看到,大四年级的学生占绝大多数,其次是大三学生。


a235e06df1689231c7de824beb90a62f.png

从频数的表格来看,可以发现大四学生为111个人占比53.6%大三学生有36个人占比17.4%,大二学生有37个人占比17.9%。

然后我们查看被调查者的月生活费情况。

6d37cae7d8324b4c9dc68f9777a3da1e.png

行业生活费中我们可以看到,大部分被调查者的月生活费在1000元到两千元之间,然后是两千元到三千元之间。

d2a5b8d0730f0582650eafb41f31d3c8.png

从表格来看,我们可以发现生活费在五千元以上的人有十五个人占比7.2%,月生活费在四千元到五千元,有七个人占比3.4%。生活费在两千元到三千元的人有55个占比26.6%。

然后我们查看被调查者每月的网购频率

3a019f6a32a03acc7ca0b17194aadd09.png

从图中我们可以看到网购频率在3到5次的人占绝大多数。

d234fa068378ac586ec7887a48edb43d.png

从表格来看,我们可以发现网购频率在八次以上有28个人,占比13.5%。网购频率在6到8次之间的人有42个,占比20.3%。网络频率在3到5次的人有88个占比42.5。


信度分析

可靠性是指如果测量重复多次,则刻度产生一致结果的程度。可靠性分析称为可靠性分析。可靠性分析是通过获得规模中系统变异的比例来确定的,这可以通过确定从不同的规模管理获得的分数之间的关联来进行。因此,如果可靠性分析中的关联度较高,则规模产生一致的结果,因此是可靠的。

404332756d21d9df233286be5e2b76ad.png

一般来说,我们认为信度系数在0.8左右,较好的可信程度。从结果中我们可以看到系数在0.8左右,说明该调查有一定的可信度。

效度分析

有效性是概念, 结论或测量是有根据的,与真实世界准确对应的程度。“有效”一词来自拉丁语有效性,意思强。测量工具的有效性(例如,在教育中的测试)被认为是工具衡量其所要衡量的程度; 在这种情况下,有效性等同于准确性。检验变量是否适合于因子分析的常用方法是巴特利特球形检验)和检验。

本文生活方式量表的因子分析前提条件检验情况如表

1468aff4ea16dff7351f213fb3fd86d7.png


表结果显示,球形度检验的近似卡方值为值为3259.28,小于说明原始矩阵不可能是单位阵,即原变量之间存在较高的相关性。度量值为,综合以上两点的验证结果得出本问卷的数据适合做因子分析。

因子分析

因子分析是通过解释变量之间的相关性来解释数据结构的方法。因子分析通过将大量变量缩小为较小的一组潜在变量或因子将数据归结为几个维度。它通常用于社会科学,市场研究和其他使用大数据集的行业。

因子分析是一种用于根据较少数量的潜在不可观察(潜在)“因素”对观察变量及其协方差结构进行建模的方法。这些因素通常被视为可能描述观察现象的广泛概念或观点。例如,获得一定社会水平的基本愿望可能解释了大部分的消费行为。这些不可观察的因素对社会科学家比观察到的定量测量更有趣。

为了使变量更好地适应因子分析的前提,我们需要根据调查结果净化初始变量。常用的测量是变量的通用性(公因子方差),即单项对整体方差的贡献。一般来说,需要初始变量来删除与变量不常用的变量,下一步是提取具有大于原始变量的变量共同性的因子。

12fff1a12d01711bdd6304bfd62d3b4b.png


797f719d78302f9e07bee750a90b349f.png


5fac1897d65f7688be7a0d6626aaef07.png


通过上述分析,使用主成分分析提取因子,最大旋转因子的方差为了得到上述因子负荷量表,根据提取标准,提取大于因子负荷的特征值绝对值大于该因子。这个比例从问题的问题中删除“您通常网购商品类型(服装服饰)的问题”保持负载值大于0.5问题。

因素的数量通常使用指数或特征值来确定。

提取正方形和负载列给出提取的因子方差贡献率 ,旋转后提取的共同因子的方差贡献因子由因子的数量给出特征值是一个二维空间图,可以更直观地显示每个因子的分布。

9a7289691e1dc62c342ae5b8b709ae50.png

e1e3d580c355af2d531c52667bc85160.png

从上面的图可以看出,在第6个因子曲线出现明显的顶点,在第6个因子之前的曲线非常陡峭,而在第七个因子之后的曲线趋于平缓。在特征根和方差贡献表中,第一个常用因子解释变量的总方差,第二个共同因素解释变量的总方差第三个常见因素解释变量的总方差,第四个共同因素解释变量总方差的第五个共同因素解释变量总方差的第六个方差公开因素解释变量的总方差,累积贡献率,6个因子可以是变量信息的良好代表。

主成分分析中,由该因素的最高负荷变量的数量减少以得到最终因素,如下表所示

d45d374d665c052d07f83c0c48e1f79b.png

c0ceaef3c8b423a69d0968f54ec7880e.png

从第一个因子的载荷中,我们可以发现在和最大的因素是因为”商品更新而进行网购”,”您选择网购的原因(时尚潮流) ,“您选择网购的原因(商品更新快) “ ,生活方式问题(追求时尚新颖的产品)”,是一种自发的、无意识的非计划性购物行为,而且具有一定的复杂性和情感因素,因此我们可以认为是冲动型购买。

聚类

k-means聚类是一种矢量量化的方法,最初来自于信号处理,在数据挖掘中受到聚类分析的欢迎。k-means聚类旨在将n个观测值分为k个群集,其中每个观测属于具有最近平均值的群集,用作群集的原型。

问题在计算上是困难的(NP-hard);然而,通常采用有效的启发式算法并快速收敛到局部最优。这些算法通常通过两种算法所采用的迭代精化方法类似于高斯分布混合的期望最大化算法。此外,他们都使用集群中心来建模数据;然而,k均值聚类倾向于找到可比较空间范围的集群,而期望最大化机制允许集群具有不同的形状。

该算法与k-最近邻分类器有一个松散的关系,这是一种流行的用于分类的机器学习技术,由于名称中的k,常常与k-means混淆。可以在通过k-means获得的聚类中心上应用1最近邻分类器将新数据分类到现有的聚类中。这被称为最近的质心分类器或Rocchio算法。

通过对 这六个因子进行动态的聚类分析。根据统计原则,运用最终选择了三个聚类中心,即将大学生的生活方式分为三类,其判别分析结果如表所示。

聚类后,我们可以得到每个聚类中的样本数,各分群所含样本数及样本比例如表所示:

60c4e0ff6ed3b86eff12f9191fd2b3b3.png

表中列出了六个要素得分中具体的三类组。表中数据的积极分数越高,指数的识别程度越高; 负值越小,指数的识别程度就越高。

a2b932227f9d986ccc8dce0bfd33fdfa.png 5fd2d8fbb0196a56a1a8ca2df6054e85.png


根据各分群生活方式因子的得分以及因子所包含的信息,对各分群进行描述与命名:

可以看到第一个类别中认同最大的是4号因子,用奖学金来购买,您通常网购商品类型(购票),您对网购担心的问题(个人隐私泄露),生活方式问题(愿意购买广告广泛宣传产品),通常网购商品类型(学习用品)。

卡方分析

卡方检验(也称为χ2检验)是任何统计假设检验,其中当零假设为真时,检验统计量的抽样分布为卡方分布。没有其他资格,“卡方检验”通常用作皮尔森卡方检验的简称。

卡方检验通常由平方误差或样本方差构成。遵循卡方分布的测试统计数据来自于独立正态分布数据的假设,这在许多情况下由于中心极限定理是有效的。可以使用卡方检验来尝试拒绝数据独立的零假设。

也被认为是一个卡方检验是一个这样一个渐近真实的测试,这意味着采样分布(如果零假设是真的)可以使样本大小变大,使其近似于所希望的卡方分布足够。卡方检验用于确定在一个或多个类别中预期频率和观察到的频率之间是否存在显着差异。

首先对性别与网购频率的维度做卡方检验,我们判断不同的性别的网购频率是否有差异。

21cd713f683617f84e3756f1ec3ba80a.png

从下面的表格中,我们可以看到一直小于0.05,拒绝零假设,表明不同性别的大学生在网购频率方面存在显著性差异。


393f64a889f08710abd1b03b0b9e049f.png

从上面的直方图中,我们也可以判断出不同的性别对应的网购频率,明显的差别。

然后我们判断不同的月生活费对应的网络频率的维度做卡方检验,看是否有显著差别?

27c682cdc1f9fe4ba2918055fc7583ec.png a1e1a15d076671d6471a452567c5a1e7.png


从上面的表格中,我们可以看到p小于0.05,因此认为不同的生活费对应的网购比例有显著的差别。

c86440c927520748d04a147cdc52c2fa.png

从上面的直方图来看,我们可以发现月生活费在1000到2000左右的网购次数最多最频繁。从网络购物频率的差异可以看到 ,可以认为不同的生活费对应的网购比例有显著的差别,不同性别的大学生在网购频率方面存在显著性差异。

相关文章
|
6天前
|
数据可视化 算法 安全
员工上网行为管理软件:S - PLUS 在网络统计分析中的应用
在数字化办公环境中,S-PLUS 员工上网行为管理软件通过精准的数据收集、深入的流量分析和直观的可视化呈现,有效帮助企业管理员工上网行为,保障网络安全和提高运营效率。
15 1
|
1月前
|
云安全 安全 网络安全
云计算与网络安全:探索云服务、网络安全和信息安全的交叉点
【10月更文挑战第5天】随着云计算技术的飞速发展,越来越多的企业和个人开始将数据和服务迁移到云端。然而,这种转变也带来了新的安全挑战。本文将深入探讨云计算环境下的网络安全问题,包括云服务的安全性、网络安全的重要性以及如何确保信息安全。我们将通过分析当前的威胁模型、安全策略和最佳实践,为读者提供一个全面的云计算安全框架。
|
18天前
|
存储 安全 网络安全
云计算与网络安全:探索云服务、网络安全和信息安全的交叉点
【10月更文挑战第24天】本文深入探讨了云计算与网络安全之间的复杂关系。随着云计算的普及,网络安全问题日益突出。本文将介绍云服务的基本概念,分析其在网络安全领域的重要性,并讨论如何通过技术和策略保护云计算环境的安全。最后,我们将提供一些代码示例,以帮助读者更好地理解如何实现云计算环境下的网络安全。
27 0
|
3月前
|
机器学习/深度学习 监控 算法
基于深度学习网络的人员行为视频检测系统matlab仿真,带GUI界面
本仿真展示了基于GoogLeNet的人员行为检测系统在Matlab 2022a上的实现效果,无水印。GoogLeNet采用创新的Inception模块,高效地提取视频中人员行为特征并进行分类。核心程序循环读取视频帧,每十帧执行一次分类,最终输出最频繁的行为类别如“乐队”、“乒乓球”等。此技术适用于智能监控等多个领域。
70 4
|
3月前
|
机器学习/深度学习 数据可视化 数据挖掘
【Macos系统】安装VOSviewer及使用VOSviewer教程!!以ESN网络的研究进行案例分析
本文介绍了如何在MacOS系统上安装VOSviewer软件,并以ESN(Echo State Network)网络的研究为例,通过VOSviewer对相关科学文献进行可视化分析,以深入了解ESN在学术研究中的应用和发展情况。
260 0
【Macos系统】安装VOSviewer及使用VOSviewer教程!!以ESN网络的研究进行案例分析
|
4月前
|
机器学习/深度学习 算法 数据挖掘
基于改进K-means的网络数据聚类算法matlab仿真
**摘要:** K-means聚类算法分析,利用MATLAB2022a进行实现。算法基于最小化误差平方和,优点在于简单快速,适合大数据集,但易受初始值影响。文中探讨了该依赖性并通过实验展示了随机初始值对结果的敏感性。针对传统算法的局限,提出改进版解决孤点影响和K值选择问题。代码中遍历不同K值,计算距离代价,寻找最优聚类数。最终应用改进后的K-means进行聚类分析。
|
4月前
|
存储 人工智能 安全
云计算与网络安全:探索云服务、网络安全和信息安全的交叉点
本文将深入探讨云计算与网络安全之间的紧密联系。我们将分析云服务如何改变传统的网络安全防护模式,以及这些变化如何影响信息安全的未来发展。文章将详细讨论云服务提供的安全优势,同时揭示其潜在的安全风险。我们还将探索网络安全在保护云基础设施中的关键作用,以及信息安全技术如何适应云计算环境的挑战。通过对比分析和案例研究,本文旨在为读者提供一个全面的视角,以理解云计算与网络安全之间复杂而微妙的关系。
64 1
|
4月前
|
JSON 数据挖掘 API
在会议系统工程中,Python可以用于多种任务,如网络请求(用于视频会议的连接和会议数据的传输)、数据分析(用于分析会议参与者的行为或会议效果)等。
在会议系统工程中,Python可以用于多种任务,如网络请求(用于视频会议的连接和会议数据的传输)、数据分析(用于分析会议参与者的行为或会议效果)等。
|
5月前
|
监控 网络协议 安全
Verilog代码在上网行为管理软件中的网络设备控制与协议分析
**Verilog摘要:** Verilog是硬件描述语言,用于数字电路设计和网络设备控制。它在上网行为管理软件中用于控制路由器、交换机等,例如通过简单模块控制端口状态。此外,Verilog还支持协议分析,如解析以太网帧提取MAC地址。监控数据可结合Verilog实现自动化提交,例如通过HTTP发送请求到服务器,实现实时监控和响应。这些示例展示了Verilog在网络安全和性能优化中的应用潜力。
122 1
|
6月前
|
域名解析 缓存 监控
【域名解析 DNS 专栏】DNS 查询日志分析:洞察网络行为与优化建议
【5月更文挑战第28天】DNS查询日志分析对于理解和优化网络行为至关重要。通过日志,可洞察用户访问偏好、流量分布,进而进行缓存优化、负载均衡和安全检测。简单Python代码示例展示了如何读取和分析日志。根据分析结果,可针对性设置优化策略,提升网络性能、稳定性和安全性。不断探索新的分析方法,充分挖掘DNS查询日志的价值,以驱动网络持续优化。
319 3