1 概述
负荷预测对于发电和配电公司而言非常重要,可以提前做出有价值的决策,最终实现业务利润最大化。它还通过提供具有所需电压水平的不间断流量 [4] 来帮助当地配电公司提高为客户提供的服务质量。根据预测时间范围,负荷预测分为三类。一小时到一周的预测范围被认为是短期负荷预测,而一周到一年的预测持续时间和一年以上的预测分别被称为中期和长期负荷预测[4]。如果预测持续时间少于一小时,则称为超短期负荷预测 [5]。不同种类的历史数据有助于不同类别的预测。对于短期负荷预测,天气条件(温度、风速、云量、降水)和日历(星期几、周末、工作日)被认为是最有用的因素。电力负荷的预测结果很大程度上取决于条件和天气是否是一个非线性混沌系统。因此,长期准确预测天气非常困难,这意味着基于长期天气预报数据的中长期负荷预测比短期负荷预测更容易受到攻击。对于中长期负荷预测,需求和气候的历史数据(湿度、温度、湿度温度指数)、经济报告(国家的经济活动、影响能源需求的经济变量)、用户数量、他们的购买能力和他们的生活方式[5]。许多技术已用于负荷预测。线性回归模型 [6, 7] 和人工神经网络 [8, 9] 是最流行的技术。支持向量机 [4, 10]、灰色预测模型 [10]、模糊推理模型 [12]、决策树 [11]、ANFIS [4](人工神经网络和模糊逻辑的混合)等其他技术也用于负荷预测。线性回归是获得合理预测精度的最简单方法。如前所述,天气数据是非线性的,因此基于非线性数据的线性回归预测模型在测试数据集上的准确性低于其他人工神经网络。但在实践中我们可以观察到,人工神经网络无法很好地预测天气急剧变化的情况。因此,线性回归仍然是最流行的负荷预测方法。回归树更适用于非线性数据。回归树算法(5)R[3]的改进版本在回归树的叶子节点上使用线性回归,而不是使用简单平均,这比非线性数据集上的线性回归模型给出更好的结果。 Wang et al 1997 发现 R5 难以实施。因此,他们提出了一种稍微不同的技术 (5')R,它易于实现并且比 5R 性能更好。 5'R 算法的实现在名为 R5P 的机器学习工具箱 WEKA [13] 中可用。
2 数学模型
在构建模型树 (R5P) 的第一阶段,使用具有不同拆分标准的决策树算法。不是选择最大化信息增益的属性,而是选择最小化子集内变化的属性来构建 R5P 树。用于查找拆分属性的公式称为标准差缩减 (SDR)。
其中 T 是在特定节点中到达的所有示例的集合,并且 Ti , i = 1,2, ... 是从该节点的拆分生成的子示例的集合。当计算的 SDR 值非常微不足道或只剩下几个实例时,拆分停止。该算法也适用于缺失值。考虑到缺失值,上述求 SDR 的公式修改为:
详细数学模型见第3部分。