由两类错误所带来思考

简介: 假设检验统计学有一个非常重要的内容,叫做假设检验,用于判断抽样的结果是否符合事实的本质。有两个组成部分,一个是空假设(null hypothesis, H0),一个是备择假设(alternative hypothesis,Ha).以法官判案为例,他的空假设就是被告(嫌疑人)无罪,随着原告(公诉人)不断给出证据,他开始否定空假设,接受备择假设,也就是认为被告有罪。

假设检验

统计学有一个非常重要的内容,叫做假设检验,用于判断抽样的结果是否符合事实的本质。有两个组成部分,一个是空假设(null hypothesis, H0),一个是备择假设(alternative hypothesis,Ha).

以法官判案为例,他的空假设就是被告(嫌疑人)无罪,随着原告(公诉人)不断给出证据,他开始否定空假设,接受备择假设,也就是认为被告有罪。

以医院医生看病为例,他的空假设就是认为每一个看病的人都是没有病的,然后通过望闻问切,各种设备的报告,选择是否认为你有病。

以PCR扩增目的片段为例,我们的空假设就是扩增的样本不存在目的片段,电泳之后发现有条带,我们就拒绝空假设,认为该样本有目标片段。

所以我们生活中处处都是假设检验,处处都是条件概率,我们都戴着一副有色眼睛看待世界,有着自己的先验概率,如果这个世界运行正常,我们就认为世界就是这个样子的。但是世界真的就是我们出生后的样子么?

两类错误

从理论上而言,表象对事实有两种表现形式:正确反映或错误反映;你面对表象也有两种判断,认可或不认可表象所传递的本质。正如康德所说,我们所看到的只不过是物自我在现实世界的投影。
在统计学上可以用下图进行表示上面说的情况:


img_e58de797d35c0ba86d32f709157e66a6.png
统计学上的两类错误

我们每当作出一个判断的时候都希望自己的判断是正确的,比如说我们都希望法官能够把犯人绳之于法,让好人不被冤枉,遗憾的是一直有冤假错案的产生。所以说我们每当作出一个判断的时候都可能会犯错,这种错误可以分为两类:

  • I型错误:实际上为H0,你拒绝,接受Ha。也就是看病的人没病,你认为他有病。
  • II型错误:实际上为Ha,你拒绝,接受H0。也就是看病的人有病,你说他没病。

尽管我们都希望自己能够得到正确的结论,但是实际上这两个错误是此消彼长的关系。也就是降低I型错误的发生,会导致II型错误的增加。降低II型错误的发生,会导致I型错误的发生。

法官不希望自己误判一个好人,所以他需要原告提出很强的证据,但是因此会放过坏人。
由于某些疾病早期迹象很不明显,一旦到了后期,就难以治疗,所以医生希望能够及时发现,但是这样子,他就会很容易拒绝Ho,认为病人有病,所以病人需要多次复诊。

其实我们也可以同时降低这两类错误发生,刑侦的技术不断升级,医院的仪器不断改进,让表象非常的显著。在统计推断的时候,增加样本数目,有更好的实验设计。

由此的一些思考

我们生长的环境,成长的经历会让自己不可避免的带上偏见,或者叫先验概率。所以每当做出一个选择都不可避免都会犯错,所谓的成长就是不断犯错,修正自己先验概率,而认知升级就是抛弃固有的模型,使用更好的模型。

进一步的思考

今天看公众号,采铜说他有三个看重的品质:

  • 对察觉自己无知的欣喜
  • 善于在信念与怀疑之间的区域停留
  • 放弃的才华

我们已知的圈越大,未知的圈也就越大。发现自己的未知应该是一件非常愉悦的事,只有这样才能不断的进步,不让自己的偏见影响自己的成长。

目录
相关文章
|
算法
建立统计过程中排除异常干扰机制
建立统计过程中排除异常干扰机制
122 0
建立统计过程中排除异常干扰机制
|
人工智能 BI 开发者
假设检验中的两类错误 | 学习笔记
快速学习假设检验中的两类错误
227 0
假设检验中的两类错误 | 学习笔记
|
关系型数据库 MySQL 数据库
数据库技术知识点(一)IDEFO需求建模方法、解释实体、实体型、实体集的区别、完全函数依赖、部分函数依赖、传递函数、平凡函数依赖、非平凡函数依赖举例、超码、主码、候选码的概念与区分
数据库技术知识点(一)IDEFO需求建模方法、解释实体、实体型、实体集的区别、完全函数依赖、部分函数依赖、传递函数、平凡函数依赖、非平凡函数依赖举例、超码、主码、候选码的概念与区分
数据库技术知识点(一)IDEFO需求建模方法、解释实体、实体型、实体集的区别、完全函数依赖、部分函数依赖、传递函数、平凡函数依赖、非平凡函数依赖举例、超码、主码、候选码的概念与区分
GoogleGuava - 第 1 章 基本工具——Throwables:简化异常和错误的传播与检查
GoogleGuava - 第 1 章 基本工具——Throwables:简化异常和错误的传播与检查
133 0
GoogleGuava - 第 1 章 基本工具——Throwables:简化异常和错误的传播与检查
|
存储
【嵌入式开发】ARM 异常向量表 ( 异常概念 | 异常处理流程 | 异常向量 | 汇编代码 )(一)
【嵌入式开发】ARM 异常向量表 ( 异常概念 | 异常处理流程 | 异常向量 | 汇编代码 )(一)
516 0
【嵌入式开发】ARM 异常向量表 ( 异常概念 | 异常处理流程 | 异常向量 | 汇编代码 )(一)
|
Java
【嵌入式开发】ARM 异常向量表 ( 异常概念 | 异常处理流程 | 异常向量 | 汇编代码 )(二)
【嵌入式开发】ARM 异常向量表 ( 异常概念 | 异常处理流程 | 异常向量 | 汇编代码 )(二)
175 0
【嵌入式开发】ARM 异常向量表 ( 异常概念 | 异常处理流程 | 异常向量 | 汇编代码 )(二)
|
测试技术
测试应该如何处理跟开发之间的“敏感”关系?
测试从业者,打交道最多的就是开发,而测试和开发之间的关系在行业内被称为‘天敌’。最近部门内有些产品线成员和开发同事在协作之间也是双方抱怨不断,为此形成此文,算是给大家一些思路参考。 **作为测试工程师,你知道要怎么更好地来处理跟开发之间的关系么?其实对于存在这种所谓的‘敌对’关系,并不难理解。
1312 0
|
数据可视化 数据挖掘
差异分析③
统计差异基因数目 tfit
1085 0
|
数据挖掘 Serverless
差异分析②
样品的无监督聚类 检查基因表达分析最重要的探索性策略之一是多维定标(MDS)图或类似的图。该图以无监督的方式显示了样本之间的相似性和不相似性,以便人们可以了解在进行正式测试之前可以检测差异表达的程度。
1119 0
差异分析①
加载数据 setwd("D:\\diff") # Reading in count data files
1410 0