估计获胜概率:模拟分析学生多项选择考试通过概率可视化

简介: 估计获胜概率:模拟分析学生多项选择考试通过概率可视化

“获胜概率”的实时计算(或估计)很困难。我们经常在足球比赛中,在选举中看到这种情况。

考虑经典的多项选择考试。在每个问题之后,想象您尝试计算学生通过考试的概率。在这里考虑我们有 50 个问题的情况。学生在答对 25 个以上时通过。为了模拟,我假设学生在每个问题上只掷硬币,我有 n 个学生,50 个问题

M=matrix

令 Xi,j 表示学生 i在问题 j 的分数。让 Si,j 表示累积分数,即 . 在第 j 步,我可以使用 T^i,j =50×Si,j /j 对最终得分进行某种预测。这是代码

S=apply
B
我们可以绘制它
plot(B)
abline
for(i in 2:n) lines
lines

但这 只是 对每一步的最终分数的预测。这不是通过概率的计算!

如果在 j 个问题之后,学生有 25 个正确的答案,那么概率应该是 1——即如果 Si,j ≥25。另一个简单的例子是:如果在j题之后,他直到最后都答对了,他能得到的分数不够,他就会失败。这意味着如果 Si,j +(50−i+1)<25,概率应该是 0。否则,要计算成功的概率,就很简单了。它是当成功的概率实际上是 Si,j /j 时,在 50-j 个问题中获得至少 25-Si,j 正确答案的概率。我们认识到二项式分布的生存概率。然后代码很简单

for(i in 1:50){
  for(j in 1:n){
    if() P\[i,j\]=1
    if()   P\[i,j\]=0
    if()B\[i,j\]=1-pbinom

所以如果我们绘制它,我们得到

plot(P
abline
for(i in 2:n) lines
lines

这比我们之前获得的曲线更不稳定!所以,计算“获胜概率”是一项复杂的工作!

当然,如果我的学生不抛硬币,情况就略有不同......这是我们得到的结果,如果一半的学生是好的(有2/3的概率答对问题),一半是不好的(1/3的概率)。

如果我们看通过的概率,我们通常不必等到最后(50道题)就知道谁通过了,谁没通过

相关文章
|
6月前
R语言ECM误差修正模型、均衡修正模型、受限VECM、协整检验、单位根检验即期利率市场数据
R语言ECM误差修正模型、均衡修正模型、受限VECM、协整检验、单位根检验即期利率市场数据
|
6月前
【数理统计实验(一)】统计量近似分布的随机模拟
【数理统计实验(一)】统计量近似分布的随机模拟
|
4月前
|
资源调度 数据可视化 算法
贝叶斯统计是一种基于贝叶斯定理的统计学方法,它不同于传统的频率派统计(或称为经典统计)。
贝叶斯统计是一种基于贝叶斯定理的统计学方法,它不同于传统的频率派统计(或称为经典统计)。
技术心得记录:概率统计13——二项分布与多项分布
技术心得记录:概率统计13——二项分布与多项分布
典型偏差和非典型偏差练习
典型偏差和非典型偏差练习
90 5
|
6月前
|
数据可视化 前端开发 索引
结构方程模型SEM、路径分析房价和犯罪率数据、预测智力影响因素可视化2案例(上)
结构方程模型SEM、路径分析房价和犯罪率数据、预测智力影响因素可视化2案例
|
6月前
|
数据可视化 算法 数据挖掘
结构方程模型SEM、路径分析房价和犯罪率数据、预测智力影响因素可视化2案例(下)
结构方程模型SEM、路径分析房价和犯罪率数据、预测智力影响因素可视化2案例
|
6月前
R语言用GAM广义相加模型研究公交专用道对行程时间变异度数据的影响
R语言用GAM广义相加模型研究公交专用道对行程时间变异度数据的影响
|
6月前
|
数据可视化
R语言两层2^k析因试验设计(因子设计)分析工厂产量数据和Lenth方法检验显著性可视化|数据分享(一)
R语言两层2^k析因试验设计(因子设计)分析工厂产量数据和Lenth方法检验显著性可视化|数据分享(一)
|
6月前
|
移动开发 数据可视化
R语言两层2^k析因试验设计(因子设计)分析工厂产量数据和Lenth方法检验显著性可视化|数据分享(二)
R语言两层2^k析因试验设计(因子设计)分析工厂产量数据和Lenth方法检验显著性可视化|数据分享(二)