R语言IRT理论:扩展Rasch模型等级量表模型lltm、 rsm 和 pcm模型分析心理和教育测验数据可视化

简介: R语言IRT理论:扩展Rasch模型等级量表模型lltm、 rsm 和 pcm模型分析心理和教育测验数据可视化

原文链接:http://tecdat.cn/?p=26096 

摘要

我们首先介绍扩展 Rasch 模型的方法论,然后是一般程序描述和应用主题,包括简单的 Rasch 模型、评级量表模型、部分信用模型及其线性扩展。这种线性结构的结合允许对协变量的影响进行建模,并能够分析重复的分类测量。

简介

Rost (1999) 在他的文章中声称,“尽管 Rasch 模型已经存在了这么长时间,但目前 95% 的心理学测试仍然是使用经典测试理论的方法构建的”。基本上,他引用了很少使用 Rasch 模型 (rm) 的以下原因:原始形式的 Rasch 模型 (Rasch 1960) 仅限于二分项,对于实际测试目的而言,可以说限制性太强。因此,研究人员应该关注扩展的 Rasch 模型。

除了基本的 rm,可以计算的模型有:线性逻辑检验模型 (Scheiblechner 1972)、评级量表模型 (Andrich 1978)、线性评级量表模型 (Fischer and Parzer 1991)、部分信用模型(Masters 1982)和线性部分信用模型(Glas 和 Verhelst 1989;Fischer 和 Ponocny 1994)。

扩展 Rasch 模型

一般表达

Andersen (1995) 推导出以下表示,这些表示基于 Rasch 对多组数据的一般表达式。数据矩阵表示为 X,行中的人 v 和列中的项目 i。总共有 v = 1, ..., n 个人和 i = 1, ..., k 项。数据矩阵 X 中的单个元素表示为 xvi。此外,每个项目 i 都有一定数量的响应类别,用 h = 0, ..., mi 表示。对项目 i 的响应 h 的相应概率可以根据以下两个表达式导出(Andersen 1995):

image.png (1)

或者

image.png (2)

这里,φh 是项目参数的评分函数,θv 是一维人参数,βi 是项目参数。在等式 1 中,ωh 对应于类别参数,而在等式 2 中,βih 是项目类别参数。

扩展 Rasch 模型的表示

对于二分项的普通 Rasch 模型,等式 1 简化为

image.png (3)

主要假设,也适用于本文提出的概括,是:潜在特征的单维性、原始分数的充分性、局部独立性和平行项目特征曲线 (iccs)。相应的解释可以在 Fischer (1974) 中找到,在 Fischer (1995a) 中可以找到数学推导和证明。

对于二分项,Scheiblechner (1972) 提出了(更受限制的)线性逻辑检验模型 (lltm),后来由 Fischer (1973) 形式化,通过将项目参数拆分为线性组合

image.png (4)

请注意,项目 i 和操作 j 的权重 wij 必须先验地固定。关于认知操作的进一步阐述可以在 Fischer (1974, p. 361ff.) 中找到。因此,从这个角度来看,lltm 比 Rasch 模型更简洁。

不过,还有另一种看待 lltm 的方法:基本 Rasch 模型在重复测量和组对比方面的概括。需要注意的是,两种类型的重新参数化也适用于线性评级量表模型(lrsm)和线性部分信用模型(lpcm),相对于下面介绍的基本评级量表模型(rsm)和部分信用模型(pcm) . 关于 lltm,Fischer (1974) 已经介绍了将其用作 Rasch 模型的推广以进行重复测量的可能性。在随后的几年中,这一建议得到了进一步的阐述。

在这一点上,我们将专注于 Rasch 模型的简单多分类推广,即 rsm (Andrich 1978),其中每个项目 Ii 必须具有相同数量的类别。对于等式 1,可以将 φh 设置为 h,其中 h = 0, ..., m。由于在 rsm 中项目类别的数量是恒定的,因此使用 m 而不是 mi。因此,由此得出

31a935f4348364029ee3cd04904efa62_640_wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1.png (5)

具有 k 个项目参数 β1, ..., βk 和 m + 1 个类别参数 ω0, ..., ωm。此参数化导致对单个项目的响应类别 Ch 进行评分。项目参数可以像方程 4 中那样以线性组合进行拆分。

最后,介绍了 Masters (1982) 开发的 pcm 及其线性扩展 lpcm (Fischer and Ponocny 1994)。pcm 为 h = 0, ..., mi 的每个 Ii ×Ch 组合分配一个参数 βih。因此,恒定评分属性不能保留项目,此外,项目可以具有不同数量的响应类别,由 mi 表示。因此,pcm 可以被视为 rsm 的推广,并且人 v 对类别 h(项目 i)的响应的概率定义为

dab8e4afbcc28a975e6bf36ee1232db7_640_wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1.png (6)

很明显,(6) 是 (2) 在 φh = h 方面的简化。至于lltm和lrsm,lpcm是通过重新参数化基本模型的item参数来定义的,即

image.png (7)

应用示例

在以下小节中,提供了与不同模型和设计矩阵场景相关的各种示例。由于可理解性问题,数据集保持相当小。

示例 1:Rasch 模型

我们从一个基于 100×30 数据矩阵的简单 Rasch 模型开始示例部分。首先,我们估计项目参数,然后估计人员参数。

然后我们使用 Andersen 的 LR 检验与平均分割标准进行拟合优度:

> lrre

4cd482195a32e3a56f92d34c0f0ce507_640_wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1.png

我们看到模型拟合,并且该结果的图形表示(仅项目子集)在图  中通过带有置信椭圆的拟合优度图给出。

d7d2624af6178baf19e8555b91265b42_640_wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1.png

> plotGOF(lrres.rasch, beta.subset = c(14, 5, 18, 7, 1), tlab = "item",
+ conf = list(ia = FALSE, col = "blue", lty = "dotted"))


示例 2:lltm 作为受限 Rasch 模型

对项目参数进行线性扩展的模型也可以看作是其底层基本模型的特例。事实上,下面提出的 lltm 并遵循 Scheiblechner (1972) 的原始想法,是一个受限的 rm,即与 Rasch 模型相比,估计参数的数量更小。数据矩阵 X 由 n = 15 个人和 k = 5 个项目组成。此外,我们指定具有特定权重元素 wij 的设计矩阵 W。

> retm <- LLTM(lt2, W)
> summary(resm)

2818fbcadb2492cdee135d0d34df3391_640_wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1.png

summary方法为基本参数和结果项目参数提供点估计和标准误差。请注意,项目参数始终根据等式 1 和 2 而不是 3 估计为容易度参数。

示例 3:rsm 和 pcm

同样,我们现在提供一个人工数据集,其中 n = 300 人,k = 4 个项目;他们每个人都有 m + 1 = 3 个类别。我们从 rsm 的估计开始,随后,我们计算相应的类别交叉参数。

> thresholds(resm)

250c405eef45443126fa6bcb4d691977_640_wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1.png

位置参数基本上是项目难度,阈值是图 4 中给出的 icc 图中类别曲线相交的点:

> plotICC(res.rsm, mplot = TRUE, legpos = FALSE, ask = FALSE)

eb16dbc36dbf3eb09deb29969061415d_640_wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1.png

rsm 将所有项目的阈值距离限制为相同。使用 pcm 可以放宽这个强假设。结果以人员-项目图表示(参见图 5)。

> res.pcm <- PCM(pcmdat2)
> plotPImap(res.pcm, sorted = TRUE)

在估计人员参数后,我们可以检查项目拟合统计信息。

ed0162423060ac88c0793c4d987ecb6e_640_wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1.png

itemfit(pcm)

61c2803b8eb317773e6d6b144b64fe42_640_wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1.png

比较 rsm 和 pcm 的似然比检验表明 pcm 提供了更好的拟合。

> pvalue <- 1 - pchisq(lr, df)

13d4e34d09aed472a8d8334ae1c0fddb_640_wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1.png

用于在不同组中重复测量的 lpcm

最复杂的示例是指具有两个测量点的 lpcm。此外,对于治疗是否有效的假设也很有趣。相应的对比是下面 W 中的最后一列。首先,指定数据矩阵 X。我们假设一个由 k = 3 个项目组成的人工测试,该测试向受试者展示了两次。X 中的前 3 列对应于第一个测试场合,而后 3 列对应于第二个场合。通常,前 k 列对应于第一个测试场合,接下来的 k 列对应于第二个测试场合,依此类推。总共有 n = 20 个科目。其中,前10人属于第一组(如对照组),后10人属于第二组(如实验组)。这由组向量指定:

> grouplpcm <- rep(1:2, each = 10)

同样,W 是自动生成的。通常,对于此类设计,W 的生成首先包括项目对比,然后是时间对比,最后是除第一个测量点之外的组主效应(由于可识别性问题,如前所述)。

> rm <- LPCM
> model.matrix

2d08bec1ea0f46d8192f7e6164556ffd_640_wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1.png

参数估计如下:

> coef

3315e31fde7197c3b68323a552d95742_640_wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1.png

检验 η 参数是否等于 0 与那些涉及项目的参数(在本例中为 η1,...,η8)几乎无关。但是对于其余的对比,H0 : η9 = 0(意味着没有一般时间效应)不能被拒绝(p = .44),而假设 H0 : η10 = 0 在应用 z 时必须被拒绝(p = .004) -检验。这表明在测量点上存在显着的实验效果。如果用户想要执行额外的检验,例如两个 η 参数的等价性的 Wald 检验,可以应用 vcov 方法来获得方差-协方差矩阵。

讨论与展望

cml 估计方法与 em 算法相结合,也可用于估计混合 Rasch 模型 (MIRA)。这种模型背后的基本思想是扩展的 Rasch 模型适用于个体的亚群,但每个亚群具有不同的参数值。

在 Rasch 模型中,项目辨别参数 αi 始终固定为 1,因此它不会出现在基本方程中。然而,Verhelst 和 Glas (1995) 制定了单参数逻辑模型 (oplm),其中 αi 不会因项目而异,但不等于 1。估计 oplm 的基本策略是一个三步法:首先,计算 Rasch 模型的项目参数。然后,在一定的限制条件下计算判别参数。最后,使用这些判别权重,oplm 的项目参数是使用 cml 估计的。这是 Rasch 模型在不同斜率方面更灵活的版本。

对不同数量的项目类别的概括、允许引入项目协变量和/或趋势的线性扩展以及可选的组对比是在测试中检查项目行为和个人表现时的重要问题。这提高了 irt 模型在各种应用领域的可行性。

相关文章
|
2月前
|
数据采集 机器学习/深度学习 数据可视化
R语言从数据到决策:R语言在商业分析中的实践
【9月更文挑战第1天】R语言在商业分析中的应用广泛而深入,从数据收集、预处理、分析到预测模型构建和决策支持,R语言都提供了强大的工具和功能。通过学习和掌握R语言在商业分析中的实践应用,我们可以更好地利用数据驱动企业决策,提升企业的竞争力和盈利能力。未来,随着大数据和人工智能技术的不断发展,R语言在商业分析领域的应用将更加广泛和深入,为企业带来更多的机遇和挑战。
|
29天前
|
数据挖掘 C语言 C++
R语言是一种强大的统计分析工具,提供了丰富的函数和包用于时间序列分析。
【10月更文挑战第21天】时间序列分析是一种重要的数据分析方法,广泛应用于经济学、金融学、气象学、生态学等领域。R语言是一种强大的统计分析工具,提供了丰富的函数和包用于时间序列分析。本文将介绍使用R语言进行时间序列分析的基本概念、方法和实例,帮助读者掌握R语言在时间序列分析中的应用。
44 3
|
29天前
|
机器学习/深度学习 数据采集 人工智能
R语言是一种强大的编程语言,广泛应用于统计分析、数据可视化、机器学习等领域
R语言是一种广泛应用于统计分析、数据可视化及机器学习的强大编程语言。本文为初学者提供了一份使用R语言进行机器学习的入门指南,涵盖R语言简介、安装配置、基本操作、常用机器学习库介绍及实例演示,帮助读者快速掌握R语言在机器学习领域的应用。
55 3
|
2月前
|
数据采集 数据可视化 数据挖掘
R语言在金融数据分析中的深度应用:探索数据背后的市场智慧
【9月更文挑战第1天】R语言在金融数据分析中展现出了强大的功能和广泛的应用前景。通过丰富的数据处理函数、强大的统计分析功能和优秀的可视化效果,R语言能够帮助金融机构深入挖掘数据价值,洞察市场动态。未来,随着金融数据的不断积累和技术的不断进步,R语言在金融数据分析中的应用将更加广泛和深入。
|
2月前
|
机器学习/深度学习 算法 前端开发
R语言基础机器学习模型:深入探索决策树与随机森林
【9月更文挑战第2天】决策树和随机森林作为R语言中基础且强大的机器学习模型,各有其独特的优势和适用范围。了解并熟练掌握这两种模型,对于数据科学家和机器学习爱好者来说,无疑是一个重要的里程碑。希望本文能够帮助您更好地理解这两种模型,并在实际项目中灵活应用。
|
3月前
|
机器学习/深度学习 数据采集 数据可视化
R语言在数据科学中的应用实例:探索与预测分析
【8月更文挑战第31天】通过上述实例,我们展示了R语言在数据科学中的强大应用。从数据准备、探索、预处理到建模与预测,R语言提供了完整的解决方案和丰富的工具集。当然,数据科学远不止于此,随着技术的不断发展和业务需求的不断变化,我们需要不断学习和探索新的方法和工具,以更好地应对挑战,挖掘数据的潜在价值。 未来,随着大数据和人工智能技术的普及,R语言在数据科学领域的应用将更加广泛和深入。我们期待看到更多创新的应用实例,为各行各业的发展注入新的动力。
|
6月前
|
数据可视化 数据挖掘 API
【R语言实战】聚类分析及可视化
【R语言实战】聚类分析及可视化
|
6月前
|
机器学习/深度学习 数据可视化
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为2
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为
|
3月前
|
数据采集 存储 数据可视化
R语言时间序列分析:处理与建模时间序列数据的深度探索
【8月更文挑战第31天】R语言作为一款功能强大的数据分析工具,为处理时间序列数据提供了丰富的函数和包。从数据读取、预处理、建模到可视化,R语言都提供了灵活且强大的解决方案。然而,时间序列数据的处理和分析是一个复杂的过程,需要结合具体的应用场景和需求来选择合适的方法和模型。希望本文能为读者在R语言中进行时间序列分析提供一些有益的参考和启示。
|
3月前
|
资源调度 数据挖掘
R语言回归分析:线性回归模型的构建与评估
【8月更文挑战第31天】线性回归模型是统计分析中一种重要且实用的工具,能够帮助我们理解和预测自变量与因变量之间的线性关系。在R语言中,我们可以轻松地构建和评估线性回归模型,从而对数据背后的关系进行深入的探索和分析。
下一篇
无影云桌面