R语言Fisher检验探究地区间公寓价格的关系

简介: R语言Fisher检验探究地区间公寓价格的关系

本文使用波兰公寓价格数据说明Fisher检验。



with(data = apart , boxplot(price ~ dis ))

我们在这里对公寓进行分组(这也可以通过简单的回归,这里5个解释变量并不重要)。我们可以重新排列



A = A[order(A$x),]

我们以这里最便宜的地区为参考,




Coefficients:Estimate Std. Error t value Pr(>|t|)(Intercept) 2968.36 58.02 51.160 <2e-16 ***districtBielany 17.38 84.16 0.207 0.836districtPraga 26.45 85.12 0.311 0.756districtUrsynow 42.01 82.65 0.508 0.611districtBemowo 80.10 83.71 0.957 0.339districtUrsus 102.01 82.25 1.240 0.215districtZoliborz 829.59 83.94 9.884 <2e-16 ***districtMokotow 887.10 81.86 10.837 <2e-16 ***districtOchota 987.93 84.16 11.738 <2e-16 ***districtSrodmiescie 2214.39 83.28 26.591 <2e-16 ***---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 597.4 on 990 degrees of freedomMultiple R-squared: 0.5698,  Adjusted R-squared: 0.5659F-statistic: 145.7 on 9 and 990 DF, p-value: < 2.2e-16

我们可以检验前5个地区价格,这是一个多重检验,我们将使用Fisher检验:



linHypo(reg, c("districtBielany = 0""districtPraga = 0""districtUrsynow = 0""districtBemowo = 0""districtUrsus = 0")Linear hypothesis test
Model 1: restricted modelModel 2: m2.price ~ district
Res.Df RSS Df Sum of Sq F Pr(>F)1 995 3540517152 990 353269202 5 782513 0.4386 0.8217

Fisher的统计数据很低,  p值为82%。



Linear hypothesis test
Model 1: restricted modelModel 2: m2.price ~ district
Res.Df RSS Df Sum of Sq F Pr(>F)1 996 4054554092 990 353269202 6 52186207 24.374 < 2.2e-16 ***---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

我们将对前6种地区进行重组(并称A为地区重组)。如果我们看平均价格,按地区,我们得到




with(data = apar , boxplot( price ~ distr ))

 

我们再次开始,以最便宜的地区作为参考,我们想检验线性回归中接下来的两个地区的系数是否为零。






Linear hypothesis test
Model 1: restricted modelModel 2: m2.price ~ district
Res.Df RSS Df Sum of Sq F Pr(<F)1 997 3552925242 995 354051715 2 1240809 1.7435 0.1754

P为0.17,我们可以接受原假设。然后,我们有三组地区,名称分别为A,B和C。我们获得以下框线图




with(data = apart , boxplot( price ~ dist ))

 

因此,最终我们可以分类成三个不同的地区,如果目标是预测价格,则无需使用10类分类,而3类分类就足够了!


最受欢迎的见解

相关文章
|
6天前
R语言ECM误差修正模型、均衡修正模型、受限VECM、协整检验、单位根检验即期利率市场数据
R语言ECM误差修正模型、均衡修正模型、受限VECM、协整检验、单位根检验即期利率市场数据
15 0
|
3天前
|
机器学习/深度学习 图计算
R语言广义线性模型(GLM)、全子集回归模型选择、检验分析全国风向气候数据(2)
R语言广义线性模型(GLM)、全子集回归模型选择、检验分析全国风向气候数据(2)
10 0
|
2天前
|
数据可视化 Python
R语言分析糖尿病数据:多元线性模型、MANOVA、决策树、典型判别分析、HE图、Box's M检验可视化
R语言分析糖尿病数据:多元线性模型、MANOVA、决策树、典型判别分析、HE图、Box's M检验可视化
|
2天前
|
前端开发 数据可视化 数据挖掘
R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享(下)
R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享
12 0
|
2天前
|
数据可视化 前端开发 数据挖掘
R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享(上)
R语言对综合社会调查GSS数据进行自举法bootstrap统计推断、假设检验、探索性数据分析可视化|数据分享
|
2天前
|
数据可视化 数据建模
R语言广义加性混合模型(GAMM)分析长沙气象因子、空气污染、PM2.5浓度、显著性检验、逐日变化可视化(下)
R语言广义加性混合模型(GAMM)分析长沙气象因子、空气污染、PM2.5浓度、显著性检验、逐日变化可视化
|
2天前
|
机器学习/深度学习 数据可视化
R语言广义加性混合模型(GAMM)分析长沙气象因子、空气污染、PM2.5浓度、显著性检验、逐日变化可视化(上)
R语言广义加性混合模型(GAMM)分析长沙气象因子、空气污染、PM2.5浓度、显著性检验、逐日变化可视化
10 0
|
2天前
|
资源调度 数据可视化 数据处理
R语言改进的DCC-MGARCH:动态条件相关系数模型、BP检验分析股市数据
R语言改进的DCC-MGARCH:动态条件相关系数模型、BP检验分析股市数据
|
3天前
|
数据采集 机器学习/深度学习 算法
R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验
R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验
13 2
|
3天前
|
数据采集 人工智能 算法
R语言ARMA-GARCH模型金融产品价格实证分析黄金价格时间序列
R语言ARMA-GARCH模型金融产品价格实证分析黄金价格时间序列
10 1

热门文章

最新文章