《SPSS 统计分析从入门到精通(第2版)》一6.3 二项式检验

简介:

本节书摘来自异步社区《SPSS 统计分析从入门到精通(第2版)》一书中的第6章,第6.3节,作者 杜强 , 贾丽艳 , 严先锋,更多章节内容可以访问云栖社区“异步社区”公众号查看

6.3 二项式检验

SPSS 统计分析从入门到精通(第2版)
在处理实际问题时,有些数据的取值只能划分为两类,比如医学中的生与死、患病的有与无。从这种二分类总体中抽取的样本,要么是对立分类中的这一类,要么是另一类,其频数分布服从二项分布。二项式检验(Binomial test),就是一种用来检验样本是否来自参数为(n,p)的二项分布总体的方法。

6.3.1 原理与方法

二项式检验通过对二值变量的单个取值做检验,能够判断总体中两个类别个体的比例是否分别为p和1−p。参数为(n,p)的二项分布满足:P(X = k) = C_k^n{p^k}{(1 - p)^{n - k}},其均值和标准差分别为np和image
。其中P(X=k)表示所占比例为p的类别出现k次的概率。

SPSS中二项式检验的统计量定义为image其中n1为第一个类别的样本个数。随着样本量n的增大,p1渐进趋于正态分布,故可用正态分布来检验统计量p1的显著性。

6.3.2 数据和问题描述

利用某企业生产某种产品的合格率数据,检验其合格产品数量是否服从参数为p的二项分布。所用数据来自随盘文件“Chapter 06产品合格率二项检验.sav”,数据格式如图6-8所示。


403fe8c0d2aa3bb8f0f70a769bc839555382f61f

本例检验的原假设为H0:合格产品比率等于0.8;备择假设为H1:合格产品比率不等于0.8。

6.3.3 二项式检验实例分析

依次单击菜单“分析→非参数检验→旧对话框→二项式…”,执行二项式检验过程,其主设置界面如图6-9所示。

1.参数设置
在左侧的变量列表单击选中“是否合格”变量,单击image25按钮,将其指定为检验变量;在“检验比例”后面的输入框键入0.80,作为检验概率值。


1324cb209324a1d2b29486d4c9046c7dd2f1bd53

boll 检验变量列表:需为数值型二分类变量;若同时选入了多个,将分别单独处理。

boll “定义二分法”栏:设置数据分为两个类别的方式,有两个选项:“从数据中获取”,表示从数据直接获取,为默认选项;“割点”,由用户指定一个临界值,检验变量的取值大于此临界值的观测归为一个类别,其他的归为另一个类别。

boll “检验比例”输入框:指定待检验的期望概率值,它对应数据中第一个类别的概率值。系统默认将第一个记录行的变量取值作为第一个类别,另一个值归为第二个类别。由于本例的数据编辑器窗口中第一个记录为“(代表合格),所以检验问题的零假设就是“合格率等于。

单击“选项”按钮,将弹出如图6-5所示的选项设置对话框;单击“精确”按钮,将弹出如图6-6所示的精确检验设置对话框。其设置选项的含义和设置方法同前。

2.结果分析
在图6-9中,单击“确定”按钮运行,SPSS查看器窗口的输出表格如图6-10所示。


af6d58cbabdbdac05eaec3aed5ed26794a3c3ab7

由于渐进显著性的取值0.474>0.10,故而不能否定零假设,即认为产品合格比率与0.8没有显著差异。

相关文章
|
机器学习/深度学习 资源调度 算法
【机器学习基础】对数几率回归(logistic回归)
【机器学习基础】对数几率回归(logistic回归)
1158 0
|
存储 人工智能 图形学
GLB/GLTF在线纹理编辑
GLB文件中的纹理数据采用了嵌入式存储的方式,具有较小的文件体积和高效的数据传输,能够提高3D模型的加载速度和渲染质量。
1017 1
关于 QGLWidget和QOpengGLWidget透明相关问题 的解决方法
关于 QGLWidget和QOpengGLWidget透明相关问题 的解决方法
关于 QGLWidget和QOpengGLWidget透明相关问题 的解决方法
|
算法 开发工具 git
时间紧任务急,如何在LeetCode刷题
很多公司都会面试算法题,然而很多小伙伴平时工作很忙,没有时间或没有养成刷题的习惯,面试准备周期时间也很紧张,没办法刷完LeetCode,往往慌慌张张刷了一些题,然而其实效果也不好。 当然这里还是建议大家平时多看看算法题,毕竟程序=数据结构+算法,对你以后的编程工作来说是大有好处的。
时间紧任务急,如何在LeetCode刷题
|
数据可视化 数据挖掘 Java
提升代码质量与效率的利器——SonarQube静态代码分析工具从数据到洞察:探索Python数据分析与科学计算库
在现代软件开发中,保证代码质量是至关重要的。本文将介绍SonarQube静态代码分析工具的概念及其实践应用。通过使用SonarQube,开发团队可以及时发现和修复代码中的问题,提高代码质量,从而加速开发过程并减少后期维护成本。 在当今信息爆炸的时代,数据分析和科学计算成为了决策和创新的核心。本文将介绍Python中强大的数据分析与科学计算库,包括NumPy、Pandas和Matplotlib,帮助读者快速掌握这些工具的基本用法和应用场景。无论是数据处理、可视化还是统计分析,Python提供了丰富的功能和灵活性,使得数据分析变得更加简便高效。
|
Linux 虚拟化
Vmware 傻瓜式安装(不可不知道的Linux基础知识和技术 01)
本文介绍了VMware虚拟机的下载与安装步骤。首先,通过提供的网盘链接下载VMware安装包。接着,详细描述了安装流程,包括接受协议、选择安装路径(建议避免系统C盘)、取消更新选项等。最后,输入许可证密钥完成安装,并展示了打开虚拟机后的主界面。整个过程简单易懂,适合新手操作。
|
消息中间件 供应链 架构师
微服务如何实现低耦合高内聚?架构师都在用的技巧!
本文介绍了微服务的拆分方法,重点讲解了“高内聚”和“低耦合”两个核心设计原则。高内聚强调每个微服务应专注于单一职责,减少代码修改范围,提高系统稳定性。低耦合则通过接口和消息队列实现服务间的解耦,确保各服务独立运作,提升系统的灵活性和可维护性。通过领域建模和事件通知机制,可以有效实现微服务的高效拆分和管理。
622 7
|
缓存 NoSQL 关系型数据库
(八)漫谈分布式之缓存篇:唠唠老生常谈的MySQL与Redis数据一致性问题!
本文来聊一个跟实际工作挂钩的老生常谈的问题:分布式系统中的缓存一致性。
879 11
|
存储 分布式计算 算法
探索Hadoop的三种运行模式:单机模式、伪分布式模式和完全分布式模式
在配置Hadoop集群之前,了解这三种模式的特点、适用场景和配置差异是非常重要的。这有助于用户根据个人需求和资源情况,选择最适合自己的Hadoop运行模式。在最初的学习和开发阶段,单机模式和伪分布式模式能为用户提供便利和成本效益。进而,当用户要处理大规模数据集时,完全分布式模式将是理想的选择。
1096 2
|
Java 关系型数据库 微服务
论后端未来发展及学习路线(详细讲解)
论后端未来发展及学习路线(详细讲解)