数据智能助力光伏产业优化升级

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 在12月7日召开的云栖大会苏州峰会上,袋鼠云大数据架构师申杭带来了“数据智能助力光伏产业优化升级”的主题分享。介绍了在大数据下光伏发电的意义,实现过程中遇到的困难与改进的措施,和取得的成果。

摘要:在12月7日召开的云栖大会苏州峰会上,袋鼠云大数据架构师申杭带来了“数据智能助力光伏产业优化升级”的主题分享。介绍了在大数据下光伏发电的意义,实现过程中遇到的困难与改进的措施,和所取得的成果。

 以下为精彩视频内容整理:


项目背景与意义

e5c1e7d0615929cee9e8261a86b439006a20e890

电力与人的生活是息息相关的,光伏发电的原理是利用太阳能电池吸收太阳光,把太阳光转化成电能的过程。但转化成的是直流电,在太阳能电板的后面加入一个逆变器,逆变器是把光能转化成直流电后再转化成交流电。

从电力的类型来看可以分为两类,第一类是集中式电站,它需要一大块地方,购买很多电力的设备安装完后,通过集中采集光的光源,再转化成电能供应给企业、家庭去使用。第二类是分布式发电,每家自己去购买一些小型的装置,通过装置把光能转化成电能。

集中式发电占主流,但它在启动建设的过程中会涉及一些问题,如地点的审批、大量的资金去进行采购安装、整个项目的投入时间和和精力都会比较长。而分布式发电站的成本比较低,实施简单。

bc4be2ef5d65241bba6ead5082e0bc19d4568717

光伏发电这一项目的研究也具有重要的意义,从下面几点进行阐述:

在稳定性上,每个家庭可以自己发电,我们通过这个项目可以预测发电量的多少,可以把未来剩余的电量输出给国家电网,国家电网可以做一个整体的电的调度。家庭用不完的电通过售卖出去之后,就不会被浪费,都会发挥出很大的应用价值。

在增效方面,在电力供应紧缺的时候,如果能把光伏发电作为电力的另外一种补充,能尽量减少由电力短缺造成的对企业的电力供应的问题,企业的效益就会得到提升减少损失。另外在国家电网或者售电公司的基础之上,对电力做到合理的调度,提升了管理效率。

在节能方面,光伏发电可以和智能家居做一些结合,比如在电量供应比较足的时候,可以控制智能家居的冰箱能耗往上提一点,电量短缺的时候降一点,保持整体上的平衡。


项目过程

450d19d7fd99cd403e25077cd772df87c62e7a93

整个项目的实现过程可以分成三大块,首先是数据源,做光伏发电比较大的影响因素是天气、和设备功率的情况。我们取了逆变器的数据、气象环境的数据,把这些数据源集中到一个平台上,需要一个数据集成的工具把它们整合到大的数据平台上,再在大的数据平台上使用机器学习的算法去做一些模型的训练预测。我们用到机器学习的平台或者算法,只需要把对应的输入数据给它,拿到对应的输出,输入数据有一定的格式要求,所以输入数据需要一个转换的过程,这一转换是使用阿里云的大数据平台,把它做各种数据的预处理,预处理完后再提供给PAI机器学习平台去调用,调用后得到一个结果,把数据输出到一个数据库中。利用这个数据最后就可以做一些电力的调度、预测、故障的检测,以上是整个项目的一个流程。


对准确率的分析

我们也对模型的预测准确率做了一个分析,当RMC<2.5认为是合格的,所以最终按数据分布来看绝大部分预测值都是合格的,最终算出的准确率是82.3%,这个数据已经超出国家标准也超越客户的预期。


项目难点及改进措施

93f8e1e77ccc59b975b0ee28ff363eae4a9696c4

当然在这个项目中我们也遇到了一些困难,我们也想未来怎么去做一些改进。对于数据量少带来维数不够健全,就会导致某一方面因素会对结果影响比较大,使结果预测不准确。所以未来我们也想怎么去优化这件事情,比如说逆变器的电压电流功率数据,我们可以把一些别的因素也加进去。另外从天气上可以加入太阳光的强度等因素,维度多了之后可能每个因素对最终的结果影响就会较小一点,这时通过综合因素,预测的效果可能会更好一些。我们也希望通过改进后准确率提升到90%以上。


项目中部分组件介绍

c263dc96312b049d568369304432509a8e213dc3

整个项目是用阿里云数加平台来完成的,共用了阿里云的四个组件,对每个组件的功能进行了下面的介绍。

MaxCompute:这是一个大数据离线计算的平台,用于做数据的处理。

Data IDE:实际是一个开发套件,通过外部的方式进行各种各样的操作

PAI:是机器学习的一个算法平台,它是完全基于可视化的。

Quick BI:是发表工具,可以把结果可视化的显现出来。

在项目开始前,我们也对两款大数据平台数加和hadoop进行了对比,其结果如下:

数加:直接使用SQL进行开发,使用门槛低;一站式开放平台,系统稳定性高;支持界面化操作拖拽既可;支持数据管理和运维管理,维护成本低;应用开发周期段。

Hadoop:需要写java代码进行开发,门槛高;需要使用多个组件,系统稳定性低;不支持界面化操作;不支持数据管理和运维管理,维护成本高;应用开发周期长。


项目成果

整个项目取得了如下成果,在电力调度上,对于分布式家庭电站,国家提倡“自给自用,余电上网”,电量预测功能可以方便国家调度电力资源;在故障排查这方面,如果发电功率的预测值比真实发电功率值相差较大,也就是监测出异常波动,这时就需要提前进行故障的排查;可以提供增值服务,分布式电站的核心是要得到用户的认可,发电功率预测可以作为一种增值服务去吸引客户资源;具有行业复制性,在电力市场化的大背景下由于发电计划的放开,以对发电量进行宏观把控的功率预测形式是大势所趋,并且具有极强的行业复制性。


本文由云栖社区志愿者小组smile小太阳整理,毛鹤审校。编辑:郭雪梅。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps&nbsp;
相关文章
|
6月前
|
人工智能 供应链 大数据
工业智能规模化趋势
工业智能规模化趋势
|
6月前
|
供应链 新制造
工业智能规模化趋势,对制造业有什么影响
工业智能规模化趋势,对制造业有什么影响
|
6月前
|
机器学习/深度学习 人工智能 算法
【AI赋能】——我国战略新兴业务快速发展 —产业结构调整持续优化
【AI赋能】——我国战略新兴业务快速发展 —产业结构调整持续优化
171 2
|
人工智能 监控 安全
智慧园区方案:AI 与视频融合技术如何助力园区监管智能化升级
随着科技的不断发展,人工智能(AI)技术正在各个领域迅速应用和推广。其中,智慧园区是一个重要的应用场景,它通过 AI 技术的支持,实现了园区的智能化管理和高效运营。
454 0
|
监控 新制造 计算机视觉
AIGC在智能制造中的应用:推动智能化生产的转型升级
AIGC在智能制造中的应用:推动智能化生产的转型升级
1580 0
|
新零售 人工智能 供应链
数智洞察 | 数字新基建推动消费升级和产业升级
中国在2019年成为了全球最大的单一市场,今天消费市场的形态已经不同从前,对于民众更高水平的消费需求,产业如何回应,消费互联网和工业互联网如何互动?本文将深入浅出解析数字新基建如何推动消费和产业升级。
数智洞察 | 数字新基建推动消费升级和产业升级
用创新能力搭建稳定同位素全平台,从基础助力医药、农业、环境等产业发展
目前,南京昊绿已经在氘代化合物研究上有了多项创新成果。
611 0
|
人工智能 安全 算法
新基建周期中,要让交通数字化成为长期发展引擎
在不久之前发布的政府工作报告中,明确了将重点支持“两新一重”建设的方针,并且对“两新一重”体系的价值给出了“既促消费惠民生又调结构增后劲”的评价。