程序员必知:关于信度分析的多种方法

简介: 程序员必知:关于信度分析的多种方法

一、利用SPSSAU做信度分析

1.信度分析位置

以SPSSAU为例,信度分析的位置在【问卷研究】→【信度】

图 1:信度分析位置

2.数据格式

信度一般针对量表题进行分析,数据格式常见是一个量表题为一列,举例如下:

图 2:信度分析数据格式

二、信度类型

上述内容已经了解到‘利用SPSSAU做信度分析’,那么信度有几种类型呢?是如何划分的?一般信度分析可以分为两个类型一个是内部一致性信度,另一个为外部一致性信度,内部一致性信度包括:克伦巴赫系数、折半信度系数、theta信度系数、McDonald omega信度系数。外部一致性信度包括复本信度和重测法检验信度。接下来进行说明。

1.部一致性信度

图 3:内部一致性信度

1.克伦巴赫信度系数

克伦巴赫信度系数计算公式:

公式说明:

N:测量个数(即放入SPSSAU的分析项个数)

Si2 表示第i项的数据变异。

ΣSi2表示各项数据变异求和。

S2表示数据求和后的总变异。

说明:

从公式可以看出,测量项个数会对克伦巴赫信度系数产生影响关系,分析项个数越多时,Cron克伦巴赫信度系数可能会越高。测量项个数最少为2个,此时信度系数相对可能会最低。

2.折半信度系数

折半系数涉及到Spearman-Brown系数和Guttman Split-Half系数。其中Spearman-Brown系数又分为等长和不等长两种计算。分别说明如下:

Spearman-Brown等长:

其中R代表拆分成两部分数据(先将数据拆分成两部分,然后分别求和,分别得到两列数据)的相关系数值。

Spearman-Brown不等长:

上公式中R为两部分数据的相关系数,k1和k2分别代表两部分数据分别的分析项个数,k=k1+k2。

Guttman Split-Half:

与此同时,SPSSAU还有提供Guttman Split-Half 系数,其也可用于测量信度。计算公式如下:上式中,Sp 表示整体求和部分的方差;Sp12 和Sp22 分别代表第1部分,第2部分方差。

3.theta信度系数

上式中N为分析项个数,λ为最大特征根值。从上式可以看到,当分析项个数越多时,theta信度系数很可能会越大,而且最大特征根越大,theta信度系数值也会越大。

4.McDonald omega信度系数

McDonald's ω=(∑ loading )2(∑ loading )2+∑ uniqueness

上式中loading为载荷系数值,uniqueness为1-loading^2。从上式可知,loading值整体绝对值越大时,McDonald's ω信度系数值也会越高。

2.外部一致性信度

(1)复本信度

复本信度是指设计两份或多份功能一致内容不同的问卷,对同一批样本进行测试,并两次结果的相关性。复本信度多用于教育学测验效果的信度考察,在一般量表中很少使用。

操作方法:分别计算两个复本各个维度(或整体)得分,使用pearson相关分析,考察两个量表的相关性。

判断标准:相关系数越大,代表相关性越高,信度越高。

(2)重测法检验信度

重测信度是指在不同时间,对同一批样本进行两次相同内容的问卷测量,并两次结果的相关性。

操作方法:和复本信度方法一致。分别计算两个复本各个维度(或整体)得分,使用pearson相关分析,考察两个量表的相关性。

三、克伦巴赫信度分析指标

针对信度的两种类型,我们已经了解,在分析中内部一致性信度的克伦巴赫系数比较常用,所以我们以克伦巴赫信度进行分析相关指标。

背景:当前有一份数据,共涉及A1~A4,B1~B4,C1~C3,D1~D3共14个量表题,此14个题目共分为4个维度,分别称作A,B,C和D维度。现希望对此份数据信度度情况进行分析,以验证数据质量可靠。由于是分4个维度所以需要分析4次。先对A维度涉及A1~A4,进行分析,结果如下:

如果CITC值低于0.3,可考虑将该项进行删除;如果“项已删除的α系数”值明显高于α系数,此时可考虑对将该项进行删除后重新分析。针对CITC值和项已删除的α系数一般用于预测试中。接着分析α系数,如果此值高于0.8,则说明信度高;如果此值介于0.7~0.8之间,则说明信度较好;如果此值介于0.6~0.7,则说明信度可接受;如果此值小于0.6,说明信度不佳;从上表可以看出α系数为0.859大于0.8,所以信度高,

补充说明:

标准化Cronbach α系数值和Cronbach α系数值的功能一样,判断标准也完全一样,一般使用很少,直接使用Cronbach α系数值进行分析信度即可。

其它三个维度也是这样分析,最后汇总分析结果如下:

从上表可以看出,A,B,C,D四个维度的α系数值均高于0.7,最小是D维度的信度系数为0.770,所以说明本次数据的信度质量水平较好,研究数据真实可靠。

四、疑难解惑

针对其它信度分析方法大家可以利用SPSSAU进行尝试,因为克伦巴赫系数比较常用,一般以为只有这种信度分析方法,实际上还有很多测量信度的方法,只是这种方法最方便,可操作性强。最后对信度分析存在的难点进行说明,其中包括‘非量表数据怎么进行数据分析’以及‘信度不达标的解决方案’。

1.非量表数据怎么进行数据分析

量表是指类似于“非常不满意,不满意,非常满意”这样的题项,第1个选项用1分表示,第2个选项用2分表示,依次下去,分值越大代表越满意,或者越不满意。只有量表题才能进行信度分析(以及效度分析)。

信度分析是研究数据质量是否可靠的一种研究方法,如果是非量表题,则没有办法使用研究方法进行分析,只能使用文字形式进行描述,以证明数据质量可信可靠,建议按以下几点分别说明。

第一:用文字描述数据收集的过程,比如纸质收集,网络收集等;

第二:用文字描述样本有效性,比如收集样本是否满足研究需要,收集的样本人群为有效样本群体等,比如研究大学生网购行为,收集样本人群一定需要为大学生等;

第三:用文字描述数据中无效样本的处理过程,比如使用SPSSAU的无效样本功能,将选择同一个答案超过70%的样本设置为无效样本等;

第四:其它可用于论证数据质量有保障的说明等。

2.信度不达标的解决方案

(1)检查数据是否为量表数据

如果做信度分析,那么首先需要满足其前提条件。一般是量表数据才能做信度分析,如果不是量表题,那么正常情况下都不会达标的,而且最关键的是非量表数据不能进行信度分析。

(2)检查样本量

有时样本量也有着至关重要的地位,比如从Cronbach信度分析的公式上可知,信度分析指标Cronbach值与样本量有着密切的关系。同时其还与分析项的个数有着密切的关系。

一般情况下,样本量希望是量表题的5倍,严格最好是10倍以上。比如有20个量表题,那么至少需要100个样本以上。否则很难得到较好的信度结果。

如果是样本量不足,除了加大样本量收集,或者减少分析项。但实际研究中通常量表是固定的,因此加大样本量是首要之选。但是并不是题越多越好,题越多时样本量要求也会越高,做到适合最重要。

(3)检查是否存在无效样本

很多时候我们都容易忽略掉无效样本这一处理过程,每次收集的数据都很难满足样本真实认真的回答,因此无效样本处理是重要的一个步骤,把无效样本处理掉后,通常会让信度指标提升。

(4)是否存在反向题

如果出现信度不达标,尤其是当信度系数值小于0时,很可能是由于反向题导致。此时只需要使用SPSSAU数据处理→数据编码功能反向处理即可。

(5)删除不合理项

在进行Cronbach信度分析时,有时候SPSSAU智能分析会提示建议删除某分析项。有可能某个分析项对信度是负作用,那么可考虑将该指标移除出去,相当于直接删除掉某个分析项。这也是常用的信度处理方式。

(6)提前预测试

其实当信度出现问题时,首先需//代码效果参考:http://www.zidongmutanji.com/zsjx/471791.html

要找到原因,比如非量表题不能做信度而应该用文字描述说明,比如针对反向题需要提前处理,也或者数据质量差一般需要提前做无效样本处理。真正可使用的其它技巧性解决办法只包括以更高的指标为单位进行,删除不合理项等几种。

如果还是不达标,那么说明数据确实不可靠。这种情况是比较糟糕的,因为数据收集回来不可靠意味着完全没用。因此提前做好预防是一种更科学的做法,提前收集小量数据,比如50个数据做下预测试,提前发现问题然后进行处理,这样才能保证正式数据不会出现任何问题。

除此之外,还有一些需要注意的点,比如样本量需要是量表题的5倍以上,同时分析信度时的分析项个数最好在4~7个等。

相关文章
|
并行计算 Windows
Windows系统查看CUDA版本号
2018年9月25日笔记 1.打开控制面板 在按住Win键的情况下,按P键,呼唤出搜索框。 在搜索框中输入control panel,如下图所示: image.png 2.进入NVIDIA控制面板 在上图的搜索框中,已经显示出NVIDIA控制面板,如果读者有显示,则可以忽略第一步,直接点击进入NVIDIA控制面板。
10883 0
|
9月前
|
存储 传感器 人工智能
《软硬协同优化,解锁鸿蒙系统AI应用性能新高度》
在数字化时代,鸿蒙系统与AI的融合备受关注。鸿蒙凭借微内核架构和分布式特性,支持语音助手、图像识别等AI应用,提升用户体验。为应对复杂AI需求,软硬件协同优化成为关键:软件方面通过算法、资源管理和框架优化挖掘潜力;硬件方面则通过芯片适配、传感器和存储优化提供动力。两者协同实现资源共享、任务调度和数据处理的突破,大幅提升性能,推动智能化体验迈向新高度。
354 9
|
8月前
|
机器学习/深度学习 人工智能 搜索推荐
BioEmu:微软黑科技炸场!生成式AI重构蛋白质模拟:千倍效率碾压传统计算,新药研发周期砍半
BioEmu 是微软推出的生成式深度学习系统,可在单个 GPU 上每小时生成数千种蛋白质结构样本,支持模拟动态变化、预测热力学性质,并显著降低计算成本。
379 2
BioEmu:微软黑科技炸场!生成式AI重构蛋白质模拟:千倍效率碾压传统计算,新药研发周期砍半
|
8月前
|
人工智能 Linux API
零门槛本地部署!手把手教你用Ollama+Chatbox玩转DeepSeek大模型
本教程介绍如何在个人电脑上免费部署DeepSeek模型,无需高端显卡。通过Ollama和Chatbox两款轻量工具,用户可以在普通CPU上流畅运行大型语言模型。Ollama支持跨平台操作,提供一键式安装和模型管理;Chatbox则是多平台AI客户端,支持多种主流模型。教程涵盖Ollama和Chatbox的安装、DeepSeek模型的下载与配置,帮助你在本地轻松搭建智能助手,适用于学术研究、代码编写和日常问答等场景。
3175 19
零门槛本地部署!手把手教你用Ollama+Chatbox玩转DeepSeek大模型
|
8月前
|
人工智能 程序员 测试技术
亲测可用,IDEA 中使用满血版 DeepSeek R1!支持深度思考!免费!免配置!
之前介绍过在IDEA中使用DeepSeek的方案,但是很多人表示还是用的不够爽,比如用CodeChat的方案,只支持V3版本,不支持带推理的R1。想要配置R1的话有特别的麻烦。那么,今天,给大家带来一个亲测有效,可使用DeepSeek R1,同时支持问答+AI程序员,无需配置,快速使用的方案。那就是借助阿里的通义灵码,通义灵码最近刚刚做了重大更新,新上线了模型选择功能。在支持Qwen的模型之外,还同时支持了DeepSeek-V3 和 DeepSeek-R1 ,而且是满血版671B模型。
|
缓存 前端开发 JavaScript
JavaScript进阶 - Web Workers与Service Worker
【7月更文挑战第10天】在Web开发中,Web Workers和Service Worker提升性能。Workers运行后台任务,防止界面冻结。Web Workers处理计算密集型任务,Service Worker则缓存资源实现离线支持。常见问题包括通信故障、资源限制、注册错误及缓存更新。通过示例代码展示了两者用法,并强调生命周期管理和错误处理的重要性。善用这些技术,可构建高性能的Web应用。
313 0
|
11月前
|
缓存 负载均衡 网络协议
|
网络安全 开发工具 数据安全/隐私保护
Git远程仓库Gitee的使用详解
Git远程仓库Gitee的使用详解
Git远程仓库Gitee的使用详解
|
关系型数据库 MySQL 数据库
Mysql—8.0.21下载安装配置教程
该教程介绍了MySQL的下载与安装步骤。建议从官网下载MySQL 8.0及以上版本,也可通过提供的百度网盘链接获取。解压后,在指定目录创建my.ini配置文件,并替换basedir和datadir为自己实际的安装路径。接着,将MySQL安装目录的bin文件夹添加到系统环境变量Path中。以管理员模式运行CMD,进入bin目录,使用`mysqld --initialize --console`初始化数据库,记下生成的临时密码。最后,用`net start mysql`启动服务,`mysql -u root -p`登录并使用ALTER指令修改初始密码。
999 1
|
网络协议 算法 网络性能优化
【流媒体】推流与拉流简介
【流媒体】推流与拉流简介
1351 0