数据分享|R语言武汉流动人口趋势预测:灰色模型GM(1,1)、ARIMA时间序列、logistic逻辑回归模型

简介: 数据分享|R语言武汉流动人口趋势预测:灰色模型GM(1,1)、ARIMA时间序列、logistic逻辑回归模型

全文链接:http://tecdat.cn/?p=32496

人口流动与迁移,作为人类产生以来就存在的一种社会现象,伴随着人类文明的不断进步从未间断点击文末“阅读原文”获取完整代码数据


人力资源是社会文明进步、人民富裕幸福、国家繁荣昌盛的核心推动力量。当前,我国经济正处于从以政府主导的投资驱动型的经济“旧常态”向以市场需求为主导的经济“新常态”转型过渡期。

本文帮助客户综合运用R语言灰色预测模型和logistic逻辑回归模型,以及综合运用ARIMA模型和logistic模型,得到武汉市外省流入人口规模查看文末了解数据免费获取方式的预测。


文献回顾


国内关于流动人口的定量预测模型有很多,如马尔萨斯模型[1]、马尔可夫链模型[2]、指数平滑预测模型[3]、宋健模型、BP神经网络模型、单变量的双曲模型[4]、系统动力学模型、Leslie人口预测模型[5]、年龄移算法[6-8]以及CPPS 软件预测等。然而,在经济学和管理学范畴内﹐最为主要的有三种,分别是:

第一,灰色预测模型。1982年,我国学者邓聚龙教授创立了灰色系统理论﹐灰色系统理论的研究对象是“部分信息已知,部分信息未知”的“小样本”、“贫信息”不确定性系统。GM(1,1)模型是最常用的一种灰色模型,由一个只含单变量的一阶微分方程构成的模型。国内不少学者运用灰色预测模型对我国总人口规模的发展趋势进行预测[9-11]。还有一部分学者从区域发展的角度出发,构建了一系列城市人口或区域流动人口的灰色预测模型[12一14]。为了减少预测的误差,学者们进一步修正了GM(1,1)灰色预测模型,构建了“等维灰数递补动态预测”模型对人口进行定量预测[15] 。

第二,Logistic曲线模型。Logistic曲线呈S形,称为生长曲线。Logistic方程最早由比利时数学家P. F. Verhult于1838年提出。但长期埋没﹐直到20世纪20年代被生物学家与人口统计学家R.Pearl和L.J. Reed重新发现。经不断完善和发展,现广泛用于人口和商业分析中。我国学者多运用Logistic模型预测我国某地区的人口数量、流动人口规模等[16—20]

第三,时间序列模型。时间序列分析方法是伯克斯和詹金斯(Box-Jenkins)1976年提出的。


数据来源与处理


将武汉市外省流入人口的时间序列记为{Yt}。

武汉市外来流入人口数据表

点击标题查阅往期内容


R语言用logistic逻辑回归和AFRIMA、ARIMA时间序列模型预测世界人口


01

02

03

04


ARIMA模型


为降低原始数据随机波动的影响,先要对原始数据进行平滑处理,本文采用常用的三点移动平均法。计算公式如下:

首端点数据进行移动平均时,Yt-1取Yt,末端点数据进行移动平均时,Yt+1取Yt。

另外,由于取对数,不会改变数据的性质和关系,且得到的数据易消除异方差。

acf(dy)

然后用自相关图检查序列的平稳性,最后发现一阶差分后的序列是平稳的。

下面对平稳性序列 建立 模型 ,偏相关系数在滞后1期后很快地趋向于0,所以取p=1 ,自相关系数图形具有拖尾性,所以初步判断为ar(1)模型。


参数估计


arima(dy,order=c(p,0,q) )
which.min(aiclist$AIC)

尝试不同的p和q的值,得出最优AIC的模型。

从AIC的结果来看,arima(2,1,1)模型拥有最小的AIC值,因此为最优模型,因此将arima(2,1,1)模型作为最优模型。

对残差序列进行白噪声检验,通常考虑残差序列的随机性,即用伯克斯.皮尔斯 提出的I统计量进行检验,用修正的I统计量:

Box.test(model$residuals,type="Ljung")

在这里X-squared的值就是0.21927,概率值为0.6396,说明拒绝原假设。

犯第一类错误的概率为0.6396,这说明残差序列相互独立即为白噪声序列的概率很大,故不能拒绝残差序列是一个白噪声序列,检验通过。


单位根平稳性检验 检验


建立arima模型进行比较


ARIMA模型预测


pred=predict(model, 15)$pred


绘制预测序列时间图


plot( pred,type="b" ,main="ARIMA模型预测")

而arima模型预测的数据开始波动较大,到后面有逐渐平稳的趋势。


建立灰色模型GM(1,1)对应的函数


GM11<-function(x0,t,x){     #x0为输入训练数据序列列,t为预测个数,x为原始数据(训练数据+测试集)  
  x1<-cumsum(x0) #一次累加生成序列1-AG0序列  
  b<-numeric(length(x0)-1)  
  n<-length(x0)-1  
  for(i in 1:n){ #生成x1的紧邻均值生成序列  
    b[i]<--(x1[i]+x1[i+1])/2  
    b} #得序列b,即为x1的紧邻均值生成序列  
  D<-numeric(length(x0)-1)  
  D[]<-1  
  B<-cbind(b,D)  
  BT<-t(B)#做逆矩阵


计算相对误差


e2<-numeric(length(x0))  
  for(s in 1:length(x0)){  
    e2[s]<-(abs(e[s])/x0[s]) #得相对误差  
  }  
  cat("相对残差:",'\n',e2,'\n','\n')  
  cat("残差平方和=",sum(e^2),'\n')  
  cat("平均相对误差=",sum(e2)/(length(e2)-1)*100,"%",'\n')  
  cat("相对精度=",(1-(sum(e2)/(length(e2)-1)))*100,"%",'\n','\n')


后验差比值检验


avge<-mean(abs(e));esum<-sum((abs(e)-avge)^2);evar=esum/(length(e)-1);se=sqrt(evar)  #计算残差的方差


画出输入序列x0的预测序列及x0的比较图像



plot(xy,col='blue',type='b',pch=16,xlab='时间序列',ylab='值')  
  points(x,col='red',type='b',pch=4)


拟合模型


GM11(train,length(mynx),mynx)

预测15年的人口数


GM11(train,length(myn

logistic逻辑回归模型


glm(as.numeric(yy[1:lengt

预测


predict(model,newd

参考文献


[1]林泽楷,许梦瑶,陈以丙.人口预测模型的优化[J].科技致 富向导,2011(8):89-89.

[2]昝欣,宗鹏,吴祈宗.马尔可夫链在高校教师人才流动预测 中的应用[J].科技进步与对策,2007,24(1):185-187.

[3]涂雄苓,徐海云.ARlMA与指数平滑法在我国人口预测中的 比较研究[J].统计与决策,2009(16):21-23.

[4]杨辉.上海市流动人口发展趋势与预测[J].人口学刊,1995 (2):31-34.

[5]冯守平.中国人口发展预测模型的构建与应用[J].统计与 决策,2010(15):24-27.

[6]胡启迪,杨庆中,桂世勋,等.上海市区人口迁移预测模型的 研究[J].人口与经济,1986(1):17-22.

[7]周德禄.经济技术开发区人口变动预测实证研究———以青 岛经济技术开发区为例[J].东岳论丛,2006,27(5):60-63.

[8]路锦非,王桂新.我国未来城镇人口规模及人口结构变动预 测[J].西北人口,2010(4):1-6.

[9]郝永红,王学萌.灰色动态模型及其在人口预测中的应用 [J].数学的实践与认识,2002,32(5):813-820.

[10]周诗国.我国人口的灰色预测模型研究及其应用[J].数理 医药学杂志,2005,18(4):307-309.

[11]陈作清,李远平,吴霞,等.基于灰色预测的我国人口预测 模型分析[J].中南民族大学学报:自然科学版,2008,27 (1):111-114.

[12]周瑞平.GM(1,1)模型灰色预测法预测城市人口规模[J]. 内蒙古师范大学学报:自然科学版,2005,34(1):81-83.

[13]郑元世,张启敏.银川市人口的灰色预测[J].辽宁工学院 学报,2008,27(5):346-350.

[14]李群,董守义,孙立成,等.我国高层次人才发展预测与对 策[J].系统工程理论与实践,2008,28(2):125-130.

[15]李晓梅.城市流动人口预测模型探讨[J].南京人口管理干 部学院学报,2006,22(4):26-29.

[16]亓昕.北京未来流动人口预测方法探讨及发展趋势[J].人 口与经济,1999(3):52-56.

[17]武萍,陶静.沈阳市流动人口预测与分析[J].锦州师范学 院学报:自然科学版,2001,22(3):69-71.

[18]李振福.长春市城市人口的Logistic模型预测[J].吉林师 范大学学报:自然科学版,2003(1):16-19.

相关文章
|
2月前
|
数据采集 机器学习/深度学习 数据可视化
R语言从数据到决策:R语言在商业分析中的实践
【9月更文挑战第1天】R语言在商业分析中的应用广泛而深入,从数据收集、预处理、分析到预测模型构建和决策支持,R语言都提供了强大的工具和功能。通过学习和掌握R语言在商业分析中的实践应用,我们可以更好地利用数据驱动企业决策,提升企业的竞争力和盈利能力。未来,随着大数据和人工智能技术的不断发展,R语言在商业分析领域的应用将更加广泛和深入,为企业带来更多的机遇和挑战。
|
2月前
R语言基于表格文件的数据绘制具有多个系列的柱状图与直方图
【9月更文挑战第9天】在R语言中,利用`ggplot2`包可绘制多系列柱状图与直方图。首先读取数据文件`data.csv`,加载`ggplot2`包后,使用`ggplot`函数指定轴与填充颜色,并通过`geom_bar`或`geom_histogram`绘图。参数如`stat`, `position`, `alpha`等可根据需要调整,实现不同系列的图表展示。
|
25天前
|
数据挖掘 C语言 C++
R语言是一种强大的统计分析工具,提供了丰富的函数和包用于时间序列分析。
【10月更文挑战第21天】时间序列分析是一种重要的数据分析方法,广泛应用于经济学、金融学、气象学、生态学等领域。R语言是一种强大的统计分析工具,提供了丰富的函数和包用于时间序列分析。本文将介绍使用R语言进行时间序列分析的基本概念、方法和实例,帮助读者掌握R语言在时间序列分析中的应用。
41 3
|
6月前
|
数据可视化 数据挖掘 API
【R语言实战】聚类分析及可视化
【R语言实战】聚类分析及可视化
|
6月前
|
机器学习/深度学习 数据可视化
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为2
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为
|
2月前
|
数据采集 数据可视化 数据挖掘
R语言在金融数据分析中的深度应用:探索数据背后的市场智慧
【9月更文挑战第1天】R语言在金融数据分析中展现出了强大的功能和广泛的应用前景。通过丰富的数据处理函数、强大的统计分析功能和优秀的可视化效果,R语言能够帮助金融机构深入挖掘数据价值,洞察市场动态。未来,随着金融数据的不断积累和技术的不断进步,R语言在金融数据分析中的应用将更加广泛和深入。
|
3月前
|
机器学习/深度学习 数据采集 数据可视化
R语言在数据科学中的应用实例:探索与预测分析
【8月更文挑战第31天】通过上述实例,我们展示了R语言在数据科学中的强大应用。从数据准备、探索、预处理到建模与预测,R语言提供了完整的解决方案和丰富的工具集。当然,数据科学远不止于此,随着技术的不断发展和业务需求的不断变化,我们需要不断学习和探索新的方法和工具,以更好地应对挑战,挖掘数据的潜在价值。 未来,随着大数据和人工智能技术的普及,R语言在数据科学领域的应用将更加广泛和深入。我们期待看到更多创新的应用实例,为各行各业的发展注入新的动力。
|
3月前
|
数据采集 存储 数据可视化
R语言时间序列分析:处理与建模时间序列数据的深度探索
【8月更文挑战第31天】R语言作为一款功能强大的数据分析工具,为处理时间序列数据提供了丰富的函数和包。从数据读取、预处理、建模到可视化,R语言都提供了灵活且强大的解决方案。然而,时间序列数据的处理和分析是一个复杂的过程,需要结合具体的应用场景和需求来选择合适的方法和模型。希望本文能为读者在R语言中进行时间序列分析提供一些有益的参考和启示。
|
3月前
|
资源调度 数据挖掘
R语言回归分析:线性回归模型的构建与评估
【8月更文挑战第31天】线性回归模型是统计分析中一种重要且实用的工具,能够帮助我们理解和预测自变量与因变量之间的线性关系。在R语言中,我们可以轻松地构建和评估线性回归模型,从而对数据背后的关系进行深入的探索和分析。
|
3月前
|
机器学习/深度学习 数据采集
R语言逻辑回归、GAM、LDA、KNN、PCA主成分分类分析预测房价及交叉验证
上述介绍仅为简要概述,每个模型在实施时都需要仔细调整与优化。为了实现高度精确的预测,模型选择与调参是至关重要的步骤,并且交叉验证是提升模型稳健性的有效途径。在真实世界的房价预测问题中,可能还需要结合地域经济、市场趋势等宏观因素进行综合分析。
69 3

热门文章

最新文章