【数理统计实验(三)】假设检验的R实现(二)+https://developer.aliyun.com/article/1506473
2.13 题目十三:两样本比率检验
某大学随机调查120名男同学,发现有50人非常喜欢看武侠小说,而随机查的85名女同学中有23人喜欢,用大样本检验方法在α=0.05下确认:男女同学在喜爱武侠小说方面有无显著差异?并给出检验的p值。
运行程序:
n <-c (50,23) #样本中喜欢看武侠小说的人数 m <-c (120,85) #两样本的样本容量 prop.test(n,m) #选取大样本检验
运行结果:
通过大样本检验的运行结果可以看出X统计量为4.015,p值=0.0451<0.05,故拒绝原假设,即认为男女同学在喜爱武侠小说方面有显著差异。
2.14 题目十四:大样本检验
若在猜硬币正反面游戏中,某人在100次试猜中共猜中60次,你认为他是否有诀窍?(取α=0.05)。
运行程序:
binom.test(60,100,p=0.5,alternative="greater") #使用binom.test()进行大样本检测
运行结果:
通过大样本检验的运行结果可以看出p值=0.0284<0.05,故拒绝原假设,即认为他有诀窍。
2.15 题目十五:单样本比率检验
若在猜硬币正反面游戏中,某人在100次试猜中共猜中60次,你认为他是否有诀窍?(取α=0.05)。
运行程序:
prop.test(60,100,correct=TRUE)
运行结果:
接受原假设,有诀窍。
2.16 题目十六:卡方检验
检查了一本书的100页,记录各页中的印刷错误的个数,其结果如下:
问能否认为一页的印刷错误个数服从泊松分布?(取α=0.05)。
运行程序:
z<-(35+40+19+3+2+1)/100 chisq.fit<-function(x,y,r){ options(digits=4) #结果显示至小数点后4位 result<-list() #构造一个空的list,用于存放输出结果 n<-sum(y) prob<-dpois(x,z,log=FALSE) #z为极大似然估计值 y<-c(y,0) m<-length(y) #m的长度为y prob<-c(prob,1-sum(prob)) result$chisq<-sum((y-n*prob)^2/(n*prob)) result$p.value<-pchisq(result$chisq,m-r-1,lower.tail=FALSE) result } x<-c(0,1,2,3,4,5) y<-c(35,40,19,3,2,1) chisq.fit(x,y,1)
运行结果:
通过运行结果,可以看出p值=0.5849>0.05,故接受原假设,即认为一页的印刷错误个数服从泊松分布。
2.17 题目十七:似然检验
某种配偶的后代按体格的属性分为三类,各类的数目分别是10,53,46.按照某种遗传模型其频率之比应为p²:2p(1-p):(1-p)²,问数据与模型是否相符(α=0.05)?
运行程序:
N<-c(10,53,46) n<-N[1]+N[2]+N[3] f<-function(p){ #定义函数f用以表示似然函数 p^(2*N[1]+N[2])*(1-p)^(N[2]+2*N[3]) } mle<-optimize(f,c(0,1),maximum = TRUE) #求极大似然估计 a<-mle$maximum #所求极大似然估计 b<-c(a^2,2*a*(1-a),(1-a)^2) #b分别表示p1,p2,p3的值 c<-(N[1]-n*b[1])^2/(n*b[1])+(N[2]-n*b[2])^2/(n*b[2])+(N[3]-n*b[3])^2/(n*b[3]) p<-1-pchisq(c,1) a b c p
运行结果:
通过运行结果,可以看出p值=0.3392>0.05,故接受原假设,即认为数据与模型相符合。
2.18 题目十八:Fisher精确检验
一项是否应提高小学生的计算机课程的比例的调查结果如下:
问年龄因素是否影响了对问题的回答(α=0.05)?
运行程序:
a<-matrix(c(32,44,47,28,21,12,14,17,13), nr=3, #分类组数为3 dimnames=list(c("55+","36~55","15~35"), c("agree","disagree","don't know"))) fisher.test(a) #Fisher精确检验
运行结果:
通过运行结果,可以看出p值=0.05≤0.05,故拒绝原假设,即认为年龄因素影响了对问题的回答。