R语言分位数回归、GAM样条曲线、指数平滑和SARIMA对电力负荷时间序列预测

简介: R语言分位数回归、GAM样条曲线、指数平滑和SARIMA对电力负荷时间序列预测

电力负荷预测是电网规划的基础,其水平的高低将直接影响电网规划质量的优劣。为了准确预测电力负荷,有必要进行建模。本文在R语言中使用分位数回归、GAM样条曲线、指数平滑和SARIMA模型对电力负荷时间序列预测并比较。

用电量

本文使用的数据是1996年至2010年之间的每周用电量数据,序列

load ("Load.RData")
plot (ts( data = Load , start= 1996 , frequency = 52) )

用电量变量及其影响因素:

•星期几(离散)

•时间小时(离散或非参数)

•年(连续)

交互影响:

•日期和时间

•年份和时间

活动

•公共假期

温度对模型的影响:高温、低温和极冷温度

 

模型:

分段线性函数,

GAM模型中的样条曲线

 

数据探索

时间对电力负荷的影响


> plot ( NumWeek , Load )

温度对电力负荷的影响,(Tt,Yt)

> plot ( Temp , Load )

负荷序列(Yt)的自相关的影响,



> acf (Load )

 

OLS与 中位数回归

 

中位数回归通过单调变换是稳定的。




lm(y˜x, data =df)
lm(y˜x, data =df , tau =.5)

现在,中位数回归将始终有两个观察结果。






which ( predict ( fit ))
21 46

 

分位数回归和指数平滑

简单的指数平滑:

经典地,我们寻找使预测误差最小的α,即

 

X=as. numeric ( Nile )
SimpleSmooth = function (a){
for (t in 2:T{L[t=a*X[t+(1 -a)*L[t -1
}lines ( SimpleSmooth (.2) ,col =" red ")




V= function (a){


for (t in 2:T){
L[t]=a*X[t]+(1 -a)*L[t -1]
erreur [t]=X[t]-L[t -1] }
return ( sum ( erreur ˆ2) )


optim (.5 ,V)$ par
[1] 0.2464844
hw= HoltWinters (X, beta =FALSE
hw$ alpha
[1] 0.2465579

我们可以考虑分位数误差


HWtau = function ( tau ){
loss = function (e) e*(tau -(e< ;=0) *1)
V= function (a){




for (t in 2:T){
L[t]=a*X[t+(1 -a)*L[t -1
erreur [t=X[t-L[t -1
return ( sum ( loss ( erreur


optim (.5 ,V)$ par


plot (X, type ="b",cex =.6


lines ( SimpleSmooth ( HWtau (.8,col=" blue ",
lwd =2)

 

双指数平滑

我们考虑分位数误差

其中

hw= HoltWinters (X, gamma =FALSE ,l. start =X[1])
hw$ alpha
alpha
0.4223241
hw$ beta
beta
0.05233389


DouSmo = function (a,b){


for (t in 2:T){
L[t]=a*X[t+(1 -a*(L[t -1]+ B[t -1]
B[t]=b*(L[t]-L[t -1]) +(1 -b*B[t -1]
return (L+B)

预测

数理统计建立在对概率模型参数的估计和假设检验的基础上。

统计中的预测:当模型拟合观测值时,它会提供良好的预测。

相反,我们使用没有出现过的场景,它使我们能够评估未来的主要趋势,而不是预测极端事件的能力。

 

预测变量的构造



plot (ts( data = Load $Load , start =
1996 , frequency = 52) ,col =" white "

回归



plot (ts( data = Temp , start =
1996 , frequency = 52) ,
lines (ts( data = train $Temp , start =
1996 , frequency = 52) )
lines (ts( data = test $Temp , start =
1996+620 /52, frequency = 52)

 

SARIMA模型

s = 52




ARIMA = arima (z, order =c(1 ,0 ,0 ,seasonal =list ( order =c(0 ,1 ,0 ,period =52
plot ( forecast (ARIMA ,h =112 )

相关文章
|
12月前
|
数据挖掘 C语言 C++
R语言是一种强大的统计分析工具,提供了丰富的函数和包用于时间序列分析。
【10月更文挑战第21天】时间序列分析是一种重要的数据分析方法,广泛应用于经济学、金融学、气象学、生态学等领域。R语言是一种强大的统计分析工具,提供了丰富的函数和包用于时间序列分析。本文将介绍使用R语言进行时间序列分析的基本概念、方法和实例,帮助读者掌握R语言在时间序列分析中的应用。
244 3
|
数据采集 存储 数据可视化
R语言时间序列分析:处理与建模时间序列数据的深度探索
【8月更文挑战第31天】R语言作为一款功能强大的数据分析工具,为处理时间序列数据提供了丰富的函数和包。从数据读取、预处理、建模到可视化,R语言都提供了灵活且强大的解决方案。然而,时间序列数据的处理和分析是一个复杂的过程,需要结合具体的应用场景和需求来选择合适的方法和模型。希望本文能为读者在R语言中进行时间序列分析提供一些有益的参考和启示。
|
机器学习/深度学习 数据挖掘 计算机视觉
R语言中的神经网络预测时间序列:多层感知器(MLP)和极限学习机(ELM)数据分析报告
R语言中的神经网络预测时间序列:多层感知器(MLP)和极限学习机(ELM)数据分析报告
|
数据采集 数据挖掘 测试技术
python、R语言ARIMA-GARCH分析南方恒生中国企业ETF基金净值时间序列分析
python、R语言ARIMA-GARCH分析南方恒生中国企业ETF基金净值时间序列分析
|
机器学习/深度学习 数据可视化 数据挖掘
R语言神经网络模型金融应用预测上证指数时间序列可视化
R语言神经网络模型金融应用预测上证指数时间序列可视化
|
数据采集 机器学习/深度学习 数据可视化
R语言从数据到决策:R语言在商业分析中的实践
【9月更文挑战第1天】R语言在商业分析中的应用广泛而深入,从数据收集、预处理、分析到预测模型构建和决策支持,R语言都提供了强大的工具和功能。通过学习和掌握R语言在商业分析中的实践应用,我们可以更好地利用数据驱动企业决策,提升企业的竞争力和盈利能力。未来,随着大数据和人工智能技术的不断发展,R语言在商业分析领域的应用将更加广泛和深入,为企业带来更多的机遇和挑战。
|
7月前
|
数据采集 机器学习/深度学习 数据可视化
探索大数据分析的无限可能:R语言的应用与实践
探索大数据分析的无限可能:R语言的应用与实践
258 9
|
数据可视化 数据挖掘 API
【R语言实战】聚类分析及可视化
【R语言实战】聚类分析及可视化
|
机器学习/深度学习 数据可视化
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为2
R语言逻辑回归logistic模型ROC曲线可视化分析2例:麻醉剂用量影响、汽车购买行为
|
数据采集 数据可视化 数据挖掘
R语言在金融数据分析中的深度应用:探索数据背后的市场智慧
【9月更文挑战第1天】R语言在金融数据分析中展现出了强大的功能和广泛的应用前景。通过丰富的数据处理函数、强大的统计分析功能和优秀的可视化效果,R语言能够帮助金融机构深入挖掘数据价值,洞察市场动态。未来,随着金融数据的不断积累和技术的不断进步,R语言在金融数据分析中的应用将更加广泛和深入。