更多云场景实践研究案例,点击这里:
【云场景实践研究合集】联合不是简单的加法,而是无限的生态,谁会是下一个独角兽
电力与人的生活是息息相关的。电力的类型可以分为两类,第一类是集中式电站,第二类是分布式发电。集中式发电占主流,但在启动建设的过程中会涉及一些问题。而分布式发电站的成本比较低,实施简单。本文介绍了在大数据下光伏发电的意义,实现过程中遇到的困难,在阿里云的帮助下改进的措施,和取得的成果。
电力与人的生活是息息相关的。电力的类型可以分为两类,第一类是集中式电站,第二类是分布式发电。集中式发电占主流,但在启动建设的过程中会涉及一些问题。而分布式发电站的成本比较低,实施简单。本文介绍了在大数据下光伏发电的意义,实现过程中遇到的困难,在阿里云的帮助下改进的措施,和取得的成果。
采用的阿里云产品
阿里云数加平台:MaxCompute,Data IDE,PAI,Quick BI
为什么使用阿里云
在阿里云大数据平台的帮助下,可以直接使用SQL进行开发,使用门槛低;一站式开放平台,系统稳定性高;支持界面化操作拖拽既可;支持数据管理和运维管理,维护成本低;应用开发周期段。
项目流程
整个”大数据下光伏发电”这个项目的实现过程可以分成三大块,首先是数据源,做光伏发电比较大的影响因素是天气、和设备功率的情况。袋鼠云取了逆变器的数据、气象环境的数据,把这些数据源集中到一个平台上,需要一个数据集成的工具把它们整合到大的数据平台上,再在大的数据平台上使用机器学习的算法去做一些模型的训练预测。我们用到机器学习的平台或者算法,只需要把对应的输入数据给它,拿到对应的输出,输入数据有一定的格式要求,所以输入数据需要一个转换的过程,这一转换是使用阿里云的大数据平台,把它做各种数据的预处理,预处理完后再提供给PAI机器学习平台去调用,调用后得到一个结果,把数据输出到一个数据库中。利用这个数据最后就可以做一些电力的调度、预测、故障的检测。
为什么选择阿里云
整个项目是用阿里云数加平台来完成的,共用了阿里云的四个组件。
MaxCompute:这是一个大数据离线计算的平台,用于做数据的处理。
Data IDE:实际是一个开发套件,通过外部的方式进行各种各样的操作
PAI:是机器学习的一个算法平台,它是完全基于可视化的。
Quick BI:是发表工具,可以把结果可视化的显现出来。
在项目开始前,袋鼠云对两款大数据平台数加和hadoop进行了对比,其结果如下:
数加:直接使用SQL进行开发,使用门槛低;一站式开放平台,系统稳定性高;支持界面化操作拖拽既可;支持数据管理和运维管理,维护成本低;应用开发周期段。
Hadoop:需要写java代码进行开发,门槛高;需要使用多个组件,系统稳定性低;不支持界面化操作;不支持数据管理和运维管理,维护成本高;应用开发周期长。
利用阿里云服务获得的成效
在阿里云的帮助下,整个项目取得了一些成果。
在电力调度上,对于分布式家庭电站,国家提倡“自给自用,余电上网”,电量预测功能可以方便国家调度电力资源;
在故障排查这方面,如果发电功率的预测值比真实发电功率值相差较大,也就是监测出异常波动,这时就需要提前进行故障的排查;
可以提供增值服务,分布式电站的核心是要得到用户的认可,发电功率预测可以作为一种增值服务去吸引客户资源;
具有行业复制性,在电力市场化的大背景下由于发电计划的放开,以对发电量进行宏观把控的功率预测形式是大势所趋,并且具有极强的行业复制性。
关于袋鼠云的更多实践详情:
数据智能助力光伏产业优化升级
原文发布日期:2017-12-15
云栖社区场景研究小组成员:董黎明,仲浩。