数据智能助力光伏产业优化升级-阿里云开发者社区

开发者社区> 大数据> 正文

数据智能助力光伏产业优化升级

简介: 在12月7日召开的云栖大会苏州峰会上,袋鼠云大数据架构师申杭带来了“数据智能助力光伏产业优化升级”的主题分享。介绍了在大数据下光伏发电的意义,实现过程中遇到的困难与改进的措施,和取得的成果。

摘要:在12月7日召开的云栖大会苏州峰会上,袋鼠云大数据架构师申杭带来了“数据智能助力光伏产业优化升级”的主题分享。介绍了在大数据下光伏发电的意义,实现过程中遇到的困难与改进的措施,和所取得的成果。

 以下为精彩视频内容整理:


项目背景与意义

e5c1e7d0615929cee9e8261a86b439006a20e890

电力与人的生活是息息相关的,光伏发电的原理是利用太阳能电池吸收太阳光,把太阳光转化成电能的过程。但转化成的是直流电,在太阳能电板的后面加入一个逆变器,逆变器是把光能转化成直流电后再转化成交流电。

从电力的类型来看可以分为两类,第一类是集中式电站,它需要一大块地方,购买很多电力的设备安装完后,通过集中采集光的光源,再转化成电能供应给企业、家庭去使用。第二类是分布式发电,每家自己去购买一些小型的装置,通过装置把光能转化成电能。

集中式发电占主流,但它在启动建设的过程中会涉及一些问题,如地点的审批、大量的资金去进行采购安装、整个项目的投入时间和和精力都会比较长。而分布式发电站的成本比较低,实施简单。

bc4be2ef5d65241bba6ead5082e0bc19d4568717

光伏发电这一项目的研究也具有重要的意义,从下面几点进行阐述:

在稳定性上,每个家庭可以自己发电,我们通过这个项目可以预测发电量的多少,可以把未来剩余的电量输出给国家电网,国家电网可以做一个整体的电的调度。家庭用不完的电通过售卖出去之后,就不会被浪费,都会发挥出很大的应用价值。

在增效方面,在电力供应紧缺的时候,如果能把光伏发电作为电力的另外一种补充,能尽量减少由电力短缺造成的对企业的电力供应的问题,企业的效益就会得到提升减少损失。另外在国家电网或者售电公司的基础之上,对电力做到合理的调度,提升了管理效率。

在节能方面,光伏发电可以和智能家居做一些结合,比如在电量供应比较足的时候,可以控制智能家居的冰箱能耗往上提一点,电量短缺的时候降一点,保持整体上的平衡。


项目过程

450d19d7fd99cd403e25077cd772df87c62e7a93

整个项目的实现过程可以分成三大块,首先是数据源,做光伏发电比较大的影响因素是天气、和设备功率的情况。我们取了逆变器的数据、气象环境的数据,把这些数据源集中到一个平台上,需要一个数据集成的工具把它们整合到大的数据平台上,再在大的数据平台上使用机器学习的算法去做一些模型的训练预测。我们用到机器学习的平台或者算法,只需要把对应的输入数据给它,拿到对应的输出,输入数据有一定的格式要求,所以输入数据需要一个转换的过程,这一转换是使用阿里云的大数据平台,把它做各种数据的预处理,预处理完后再提供给PAI机器学习平台去调用,调用后得到一个结果,把数据输出到一个数据库中。利用这个数据最后就可以做一些电力的调度、预测、故障的检测,以上是整个项目的一个流程。


对准确率的分析

我们也对模型的预测准确率做了一个分析,当RMC<2.5认为是合格的,所以最终按数据分布来看绝大部分预测值都是合格的,最终算出的准确率是82.3%,这个数据已经超出国家标准也超越客户的预期。


项目难点及改进措施

93f8e1e77ccc59b975b0ee28ff363eae4a9696c4

当然在这个项目中我们也遇到了一些困难,我们也想未来怎么去做一些改进。对于数据量少带来维数不够健全,就会导致某一方面因素会对结果影响比较大,使结果预测不准确。所以未来我们也想怎么去优化这件事情,比如说逆变器的电压电流功率数据,我们可以把一些别的因素也加进去。另外从天气上可以加入太阳光的强度等因素,维度多了之后可能每个因素对最终的结果影响就会较小一点,这时通过综合因素,预测的效果可能会更好一些。我们也希望通过改进后准确率提升到90%以上。


项目中部分组件介绍

c263dc96312b049d568369304432509a8e213dc3

整个项目是用阿里云数加平台来完成的,共用了阿里云的四个组件,对每个组件的功能进行了下面的介绍。

MaxCompute:这是一个大数据离线计算的平台,用于做数据的处理。

Data IDE:实际是一个开发套件,通过外部的方式进行各种各样的操作

PAI:是机器学习的一个算法平台,它是完全基于可视化的。

Quick BI:是发表工具,可以把结果可视化的显现出来。

在项目开始前,我们也对两款大数据平台数加和hadoop进行了对比,其结果如下:

数加:直接使用SQL进行开发,使用门槛低;一站式开放平台,系统稳定性高;支持界面化操作拖拽既可;支持数据管理和运维管理,维护成本低;应用开发周期段。

Hadoop:需要写java代码进行开发,门槛高;需要使用多个组件,系统稳定性低;不支持界面化操作;不支持数据管理和运维管理,维护成本高;应用开发周期长。


项目成果

整个项目取得了如下成果,在电力调度上,对于分布式家庭电站,国家提倡“自给自用,余电上网”,电量预测功能可以方便国家调度电力资源;在故障排查这方面,如果发电功率的预测值比真实发电功率值相差较大,也就是监测出异常波动,这时就需要提前进行故障的排查;可以提供增值服务,分布式电站的核心是要得到用户的认可,发电功率预测可以作为一种增值服务去吸引客户资源;具有行业复制性,在电力市场化的大背景下由于发电计划的放开,以对发电量进行宏观把控的功率预测形式是大势所趋,并且具有极强的行业复制性。


本文由云栖社区志愿者小组smile小太阳整理,毛鹤审校。编辑:郭雪梅。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
大数据
使用钉钉扫一扫加入圈子
+ 订阅

大数据计算实践乐园,近距离学习前沿技术

其他文章