卡方检验 | 学习笔记

简介: 快速学习卡方检验

开发者学堂课程【人工智能必备基础:概率论与数理统计:卡方检验】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/545/detail/7450


卡方检验

一、卡方检验( Chi-square test )

用于检验两个(或多个)率或构成比之间差别是否有统计学意义,配对卡方检验检验配对计数资料的差异是否有统计学意义。

基本思想:

检验实际频数( A ) 和理论频数( T )的差别是否由抽样误差所引起的。也就是由样本率(或样本构成比)来推断总体率或构成比。

实例:

两种药物治疗胃溃疡有效率的比较

image.png

原假设是用了 A 药和 B 药的有效率是相同的,所以就都认为是 66.67%。A 药有效值理论是 85 乘以 66.67,B 药有效值理论是 48 乘以 66.67。
理论频数与实际频数的差别:

image.png

ARC 是位于 R 行 C 列交叉处的实际频数,TRC 是位于 R 行 C 列交叉处的理论频数。( ARC-TRC ) 反映实际频数与理论频数的差距,除以 TRC 为的是考虑相对差距。所以,x^2 值反映了实际频数与理论频数的吻合程度,x^2 值大,说明实际频数与理论频数的差距大。x^2 值的大小除了与实际频数和理论频数的差的大小有关外,还与它们的行、列数有关。即自由度的大小。

理论频数根据假设来计算的:

无效假设是 A 药组与 B 药组的总体相等,均等于合计的阳性率66 67% (110/165)。那么理论上,A 药组的 85 例中阳性人数应为85(110/165)=56.67. 阴性人数为 85(55/165)=28.33: 同理,B 药组的 80 例中阳性人数应为 80(110/165)=53.33, 阴性人数为: 80(55/165)=26.67.
一般的四格表:

image.png

基本公式:

image.png

image.png

若检验假设 H0: π1=π2 成立,四个格子的实际频数 A 与理论频数 T 相差不应该很大,即统计量 x2 不应该很大。如果 x2 值很大,即相对应的 P 值很小,若 P<=α,则反过来推断 A 与 T 相差太大,超出了抽样误差允许的范围,从而怀疑 H0 的正确性,继而拒绝 H0,接受其对立假设 H1,即 π1≠π2 。
实例:
某药晶检验所随机抽取 574 名成年人,研究抗生素的耐药性(资料如表8-11)。问两种人群的耐药率是否一致?

image.png

(1) 建立假设并确定检验水准

HO: 两种人群对该抗生素的耐药率相同,即 π1 = π2; (两总体率相等)

H1: 两种人群对该抗生素的耐药率不同,即 π1≠π2 ; ( 两总体不相等).

α=0.05

(2)计算检验统计量

image.png

(3)得出结果

在表确定 P 值,P>0.05, 得出结论。按 0.05 水准,不拒绝 H0, 可以认为两组人群对该抗生素的耐药率的差异无统计学意义。
卡方检验也可以放到特征选择中。

相关文章
|
12天前
|
SQL 数据可视化 数据挖掘
云上 · 百炼 MCP 数据分析与可视化 Demo 实战
一套跑在阿里云百炼上的“生成 SQL → 执行 → 分析 → 出图”闭环方案,端到端无本地依赖,可发布为组件/网页对外服务。
94 8
|
5月前
|
人工智能 小程序 NoSQL
【一步步开发AI运动小程序】二十一、如何将AI运动项目配置持久化到后端?
本文介绍基于云智「Ai运动识别引擎」的运动配置持久化方案,旨在优化小程序或Uni APP中AI运动识别能力。通过将运动检测参数(如`Key`、`Name`、`TickMode`、`rules`或`samples`)持久化到后端,可避免因频繁调整运动参数而重新发布应用,提升用户体验。持久化数据结构支持规则和姿态样本存储,适用于关系数据库、文件或文档数据库(如MongoDB)。此外,云智还提供运动自动适配工具及「AI乐运动」产品,助力快速实现AI体育、全民健身等场景。
|
SQL NoSQL 关系型数据库
现代数据库技术:从关系型到NoSQL的进化与应用
本文探讨了现代数据库技术的发展历程,从传统的关系型数据库到新兴的NoSQL数据库的演进过程。通过比较不同类型数据库的特点和应用场景,分析它们在各自领域中的优缺点及适用性,旨在帮助读者理解并选择合适的数据库技术来支持他们的应用需求。
|
10月前
|
人工智能 Cloud Native 架构师
CNCF 宣布 Dapr 毕业
Dapr 是一个可移植的分布式应用运行时,提供集成 API,帮助开发者构建可靠和安全的分布式应用,提升生产力 20-40%。Dapr 于 2019 年由微软发布,并于 2021 年 11 月正式加入 CNCF。截至 2024 年 11 月 13 日,Dapr 已正式从 CNCF 毕业。它支持多种云原生技术,广泛应用于 Grafana、FICO、HDFC 银行等企业。
242 2
|
存储 人机交互 语音技术
基于RT-Thread的智能家居助手
一、项目简介 智能家居助手主要基于RT-Thread开发的,该系统主要分为语音子系统,环境监测子系统,智能控制子系统,智能网关子系统,音乐播放器,云端以及应用软件七大部分。语音子系统可通过语音进行人机交互来控制家电设备。环境监测子系统为智能家居提供环境信息输入,实时监测室内的环境信息。智能控制子系统为智能家居提供控制接口,用户可根据实际需求来控制家电设备。 智能网关是整个系统的核心和枢纽,为整个智能家居提供网络,同时与云平台进行交互,不断更新室内信息,实时将数据上传至云端,用户就能在远程进行查室内的各种环境信息,实时掌握家中的最新动态。音乐播放器为用户提供音乐服务。云端部分为智能家居系统云
204 6
|
消息中间件 运维 Prometheus
小红书消息中间件的运维实践与治理之路
近年来,消息领域的全面云原生化逐渐走向深入,比如 RocketMQ 5.0 版本的存算分离设计和 raft 模式,再比如 Kafka3.0 引入了分层设计的方式(tiered storage)和 raft 模式,以及近年来新崛起的 Pulsar 也开始采用云原生架构,在未来都可以针对具体业务需求引入进行功能迭代,发挥组件的最大价值。
1146 96
小红书消息中间件的运维实践与治理之路
|
搜索推荐 算法 数据处理
智能推荐AIRec上线“流量调控”功能,助力电商平台甩货
智能推荐AIRec最新上线“流量调控”功能,支持人工干预推荐系统流量的分发,针对商品滞销、库存积压等业务问题,可通过流量调控解决甩货诉求,助力电商快速实现“库存清零”。
1454 0
智能推荐AIRec上线“流量调控”功能,助力电商平台甩货
|
JSON Kubernetes 监控
K8S之yaml 文件详解(pod、deployment、service)
K8S之yaml 文件详解(pod、deployment、service)
13058 3
K8S之yaml 文件详解(pod、deployment、service)
|
前端开发 程序员 开发者
免费下载!程序员入门系列教程之《零基础CSS入门教程》重磅推出
本书由阿里云开发者社区联合乘风者计划专家博主陈文阳共同推出。
24417 8
免费下载!程序员入门系列教程之《零基础CSS入门教程》重磅推出