前言
机器学习很多时候在工业场景下也会有非常好的应用。本次实验,我们就会以一个综合循环发电厂的发电数据来展示机器学习是如何应用到工业生产的实际场景中的。
本实验数据采集自 UCI 机器学习数据集中的 混合发电厂数据。对于发电厂来说,风力发电的输出电力很大情况下决定了单位发电机能够生产的电能。因此,通过收集系统各个相关指标来预测最终的输出电力对于发电厂来说是非常有帮助的。有效的预测发电机的输出电力可以更好的评估安排电力生产计划,避免资源的浪费。
载入数据并进行数据探索
载入好数据集之后,里面是一个综合循环发电场的数据,一共有9568个样本数据。每个数据有5列,分别为:AT(温度), V(压力), AP(湿度), RH(压强), PE(输出电力)。下面是数据预览的截图:
然后为了找出对 PE 输出电力影响最大的因素,我们可以从左侧 组件-统计分析 拖入相关系数矩阵这个组件,来观察各个特征对于输出电力。
右键单击完成的组件,选择查看分析报告,就可以得到我们的相关性分析了。从这张相关性图中,我们不难看到和 输出电力最相关的因素就是 温度,其次是 压力,然后是湿度,再然后是压强。
对数据进行建模
观察完数据相关性之后,我们可以通过 组件-数据预处理 中的拆分组件 对数据做一次拆分,将数据分为训练集和测试集。然后再使用 组件-机器学习-回归 中的线性回归 来对我们的数据进行回归建模。这里我们需要选择我们的特征列(X)和我们的标签列(Y)
对回归模型进行预测和评估
建模完毕之后,我们可以通过 组件-机器学习 中的预测来预测该模型在测试数据集上的效果。只需要进行如下的配置即可 特征列我们选择 at,v,ap,rh 原样输出列我们全选即可。
我们在这一步完成之后可以右键模型,点击查看模型 即可看到不同的特征对于我们的结果量的权重
最后,再从左侧的 组件-机器学习-评估 中选择回归模型评估即可获得我们的模型效果。右键 回归模型评估-查看分析报告 即可发现我们的 RMSE 到达了 4.57。下面是整个实验完成后的截图
这样我们就通过线性回归模型建立了一个混合发电厂的发电电力预测模型。通过模型部署之后,我们就可以实时的为发电厂提供发电电力的预估,以便更好的安排电力的生产计划,避免资源浪费。