【SPSS】列联表分析详细操作教程(附案例实战)

简介: 【SPSS】列联表分析详细操作教程(附案例实战)

什么是列联表分析?


列联表分析也叫作交叉分组下的频数分析,用来分析变量间的相互影响和关系


列联表分析的基本任务


  • 编制交叉列联表
  • 在交叉列联表的基础上,对两变量间是否存在一定的相关性进行分析


列联表的卡方检验


1.提出原假设(H0)

列联表分析中卡方检验的原假设是:行变量与列变量独立


2.计算检验统计量

列联表分析中卡方检验的检验统计量是Pearson卡方统计量,其数学定义为:


其中,r为列联表的行数;c为列联表的列数;fij o为观测频数; fij e为期望频数,期望频数的计算方法是:


RT为指定单元格所在行的观测频数合计; CT为指定单元格所在列的观测频数合计; n为观测频数的总计;


例如:30岁以下且低血压组的期望频数为98x95/474=19.6, 其他单元格的期望频数相同的算法。 期望频数的分布反映的是行列变量独立下的分布。        


3.确定显著性水平和临界值


显著性水平α是指原假设为真却将其拒绝的风险,即弃真的概 率,通常设为0.05或0.01。在卡方检验中,由于卡方统计量服从 “(行数-1)x (列数-1)”个自由度的卡方分布,因此,在行列 数目和显著性水平α确定时,卡方临界值是唯一确定的。


4.得出结论和决策


根据统计量观测值和临界值比较的结果进行决策 :如果卡方统计量的观测值大于卡方临界值,则认为卡方值已经足够大,实际分布与期望分布之间的差距显著,可以拒绝原假 设,断定列联表的行列变量间不独立,存在相关关系


根据统计量观测值的概率P值和显著性水平α比较的结果进行决策:如果P值小于等于α,则拒绝原假设,断定列联表的行列变 量间不独立,存在相关关系


列联表卡方检验说明


  • 如果交叉列联表中有较多单元格(20%以上)中的期望频数小于5,则一般不宜使用卡方检验。此 时,可以采用似然比卡方检验等方法进行修正
  • 卡方值的大小也会受到样本量的影响,所以,也有必要对Pearson卡方值进行修正,以剔除样本量 的影响


列联表分析案例



【案例】 —— 影响高考志愿填报的因素与性别是否有关


①选择菜单【分析】----> 【描述统计】----> 【交叉表】


②在“交叉表”对话框中选择行变量、列变量


③再点击上图(交叉表对话框)中的【单元格(E)】按钮,指定列联表单元格中的输出内容


④点击交叉表对话框中的【统计(S)】按钮指定使用卡方检验来分析行变量和列变量间的关系


⑤分析结果


结论:由于卡方的概率P值小于α,因此应拒绝原假设,认为不同性别的学生填报高考志愿时考虑的因素是不一致的。


补充:


在卡方检验表中还出现了下面的两个卡方检验


  • 似然比卡方检验,用于对Pearson卡方检验进行修正
  • 线性关联卡方检验(Mantel-Haenszel),用于检验列联表中行列变量的线性相关性,原假 设是行列变量零相关,只适用于定序型变量,不能用于定类型变量
目录
相关文章
|
数据挖掘
【SPSS】回归分析详细操作教程(附案例实战)(下)
【SPSS】回归分析详细操作教程(附案例实战)
2899 0
|
机器学习/深度学习 算法 数据可视化
基于Google Earth Engine云平台构建的多源遥感数据森林地上生物量AGB估算模型含生物量模型应用APP
基于Google Earth Engine云平台构建的多源遥感数据森林地上生物量AGB估算模型含生物量模型应用APP
831 0
|
4月前
|
传感器 算法 安全
【代码开源】基于 STM32 的智能空气加湿器设计与实现
本项目通过STM32单片机构建了一款智能空气加湿器,实现了温湿度自动监测与调控、智能显示以及远程控制等功能。在硬件方面,系统整合了湿度传感器、温度传感器、超声波雾化模块以及OLED显示屏,实现了环境数据的实时采集和直观展示。在软件方面,基于STM32的控制程序通过PID调节算法对加湿器进行精确控制,同时支持定时和手动模式,提高了使用灵活性与舒适度。
【代码开源】基于 STM32 的智能空气加湿器设计与实现
|
8月前
|
Apache 开发工具 数据格式
OpenAI 重返开源!gpt-oss系列社区推理、微调实战教程到!
时隔N年,OpenAI开放模型权重啦!欢迎使用gpt-oss 系列,专为强大的推理、代理任务和多用途开发场景设计。
1897 0
|
自然语言处理 监控 安全
2025年阿里云短信验证码价格多少钱?计费模式与场景选型指南
随着企业数字化转型,短信验证码作为用户身份验证的重要工具,其成本与效率的平衡至关重要。阿里云短信服务以高可靠性、灵活计费和多场景适配著称。按量付费模式适合需求波动大的场景,而短信套餐包则为长期稳定需求提供了成本优势。针对不同业务场景,如高频验证、跨境业务及中小型企业轻量级需求,阿里云提供了定制化的选型策略。此外,通过阶梯定价、防盗刷监控等措施实现成本优化与风险规避,并不断进行技术升级以确保服务的安全性和稳定性。根据2025年最新数据,企业可根据自身需求选择最适合的阿里云短信验证码服务方案。
|
机器学习/深度学习 自然语言处理 PyTorch
Transformers入门指南:从零开始理解Transformer模型
【10月更文挑战第29天】作为一名机器学习爱好者,我深知在自然语言处理(NLP)领域,Transformer模型的重要性。自从2017年Google的研究团队提出Transformer以来,它迅速成为NLP领域的主流模型,广泛应用于机器翻译、文本生成、情感分析等多个任务。本文旨在为初学者提供一个全面的Transformers入门指南,介绍Transformer模型的基本概念、结构组成及其相对于传统RNN和CNN模型的优势。
13623 1
|
索引 Python
Python 中的负索引是什么?
【8月更文挑战第29天】
1095 1
|
数据可视化
RNAseq|构建预后模型后你还需要这些图,森林图,诺莫图,校准曲线,DCA决策曲线
RNAseq|构建预后模型后你还需要这些图,森林图,诺莫图,校准曲线,DCA决策曲线
761 0
|
机器学习/深度学习 人工智能 数据可视化
多模态数据的应用痛点
【2月更文挑战第22天】多模态数据的应用痛点
905 1
多模态数据的应用痛点