云场景实践研究第75期:袋鼠云

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 电力与人的生活是息息相关的。电力的类型可以分为两类,第一类是集中式电站,第二类是分布式发电。集中式发电占主流,但在启动建设的过程中会涉及一些问题。而分布式发电站的成本比较低,实施简单。本文介绍了在大数据下光伏发电的意义,实现过程中遇到的困难,在阿里云的帮助下改进的措施,和取得的成果。
更多云场景实践研究案例,点击这里: 【云场景实践研究合集】联合不是简单的加法,而是无限的生态,谁会是下一个独角兽
电力与人的生活是息息相关的。电力的类型可以分为两类,第一类是集中式电站,第二类是分布式发电。集中式发电占主流,但在启动建设的过程中会涉及一些问题。而分布式发电站的成本比较低,实施简单。本文介绍了在大数据下光伏发电的意义,实现过程中遇到的困难,在阿里云的帮助下改进的措施,和取得的成果。
77b471804d0e1074f4010df2a8d3bb352f28ae9f

采用的阿里云产品
阿里云数加平台:MaxCompute,Data IDE,PAI,Quick BI

为什么使用阿里云
在阿里云大数据平台的帮助下,可以直接使用SQL进行开发,使用门槛低;一站式开放平台,系统稳定性高;支持界面化操作拖拽既可;支持数据管理和运维管理,维护成本低;应用开发周期段。

项目流程
整个”大数据下光伏发电”这个项目的实现过程可以分成三大块,首先是数据源,做光伏发电比较大的影响因素是天气、和设备功率的情况。袋鼠云取了逆变器的数据、气象环境的数据,把这些数据源集中到一个平台上,需要一个数据集成的工具把它们整合到大的数据平台上,再在大的数据平台上使用机器学习的算法去做一些模型的训练预测。我们用到机器学习的平台或者算法,只需要把对应的输入数据给它,拿到对应的输出,输入数据有一定的格式要求,所以输入数据需要一个转换的过程,这一转换是使用阿里云的大数据平台,把它做各种数据的预处理,预处理完后再提供给PAI机器学习平台去调用,调用后得到一个结果,把数据输出到一个数据库中。利用这个数据最后就可以做一些电力的调度、预测、故障的检测。

为什么选择阿里云
整个项目是用阿里云数加平台来完成的,共用了阿里云的四个组件。
MaxCompute:这是一个大数据离线计算的平台,用于做数据的处理。
Data IDE:实际是一个开发套件,通过外部的方式进行各种各样的操作
PAI:是机器学习的一个算法平台,它是完全基于可视化的。
Quick BI:是发表工具,可以把结果可视化的显现出来。
ce2326798ee5d278cf38039fb3b4b444bac8a350
在项目开始前,袋鼠云对两款大数据平台数加和hadoop进行了对比,其结果如下:
数加:直接使用SQL进行开发,使用门槛低;一站式开放平台,系统稳定性高;支持界面化操作拖拽既可;支持数据管理和运维管理,维护成本低;应用开发周期段。
Hadoop:需要写java代码进行开发,门槛高;需要使用多个组件,系统稳定性低;不支持界面化操作;不支持数据管理和运维管理,维护成本高;应用开发周期长。

利用阿里云服务获得的成效
在阿里云的帮助下,整个项目取得了一些成果。
在电力调度上,对于分布式家庭电站,国家提倡“自给自用,余电上网”,电量预测功能可以方便国家调度电力资源;
在故障排查这方面,如果发电功率的预测值比真实发电功率值相差较大,也就是监测出异常波动,这时就需要提前进行故障的排查;
可以提供增值服务,分布式电站的核心是要得到用户的认可,发电功率预测可以作为一种增值服务去吸引客户资源;
具有行业复制性,在电力市场化的大背景下由于发电计划的放开,以对发电量进行宏观把控的功率预测形式是大势所趋,并且具有极强的行业复制性。

关于袋鼠云的更多实践详情: 数据智能助力光伏产业优化升级
原文发布日期:2017-12-15
云栖社区场景研究小组成员:董黎明,仲浩。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
运维 Cloud Native Devops
免费下载|《2021云上架构与运维峰会演讲合集》助力企业快速高效“用好云管好云”!
如今,人们讨论的已经不仅是上云,而是如何用好云。云计算所拥有的“软件定义一切”的特性,推动了敏捷弹性、DevOps、智能运维和基础设施即代码(Infrastructure as Code,简称 IaC)等自动化运维趋势。
71453 1
免费下载|《2021云上架构与运维峰会演讲合集》助力企业快速高效“用好云管好云”!
|
运维 Kubernetes 安全
云栖大会来啦!我们一起谈谈企业如何上好云、用好云、管好云
作为全球顶尖的科技盛会,历年云栖大会的议程安排都是精彩纷呈,今年当然不会例外。2020云栖大会首次在线举办,以“3+300”的内容场次设置,为全球科技人带来 3 场主论坛和展厅、100 场分论坛和专场、100 个城市站点线上线下联动和 100 大新品发布的云上盛宴。
云栖大会来啦!我们一起谈谈企业如何上好云、用好云、管好云
|
人工智能 物联网 大数据
云场景实践研究第89期:中信集团
中信云平台从立项到上线仅用了1个月,用户数从0发展到13万仅用了5个月。快,是中信2016年的工作总结重要的一项。如今,中信集团正在通过云计算、大数据、人工智能等技术实现互联互通的数字化建设,并通过数字化实现业务转型,找到新价值定位,形成新商业模式。
3132 0
|
安全 大数据 关系型数据库
云场景实践研究第27期:袋鼠云
随着网站论坛粉丝数高涨,袋鼠云协助用户进行架构改造,实现了应用平滑上云,彻底改变原有平台的性能瓶颈和安全隐患,满足高量级用户同时访问,同时解决了国内外部分地区粉丝访问受限的问题,极大提高了用户体验。
2097 0
|
运维 分布式数据库 Hbase
云场景实践研究第82期:亿方云科技
2017云栖大会HBase专场,亿方云科技CTO 王成军带来HBase在亿方云客户端同步系统中的应用实践的演讲。本文分析亿方云科技在HBase方面的实践,并对亿方云HBase演进和应用作了分享。
1990 0
|
分布式计算 大数据 关系型数据库
云场景实践研究第83期:众安保险
当传统保险公司还在将“开门红”作为重中之重提前几个月做准备的时候,互联网保险公司关注的则是“双十一”和“双十二”。2017年双十一当日,刚刚在香港上市的众安保险的保单量突破3亿,比2014年增长超过200%。阿里云所输出的服务,则在帮助基础设施建设发挥“乘数效应”。
1906 0
|
监控 BI 分布式数据库
云场景实践研究第81期:大搜车
2017云栖大会HBase专场,大搜车高级数据架构师申玉宝带来阿里云云数据库HBase在大搜车金融业务中的应用实践。本文主要从数据大屏开始谈起,进而分享了GPS风控实践,包括架构、聚集分析等,最后还分享了流式数据统计,包括数据流、数据合流和服务监控等。
2027 0
|
监控 数据可视化 大数据
云场景实践研究第86期:美甲帮
借助阿里云的力量,美甲帮实现了针对百万用户的精细运营,并且在业务上更敏捷、更智能、更具洞察力,还能够快速响应新业务的数据及分析需求。
2083 0
|
存储 分布式计算 安全
云场景实践研究第84期:东润环能
让东润环能选择阿里云的原因,除了阿里云强大的云平台能力之外,还有阿里云数加MaxCompute的全方位服务能力及其稳定安全的表现。最重要的是采用阿里云数加,东润环能可以将所有精力都放在业务上,节省了自建机房在学习成本、开发成本、管理成本、投入机房资源和运维成本的总成本,将更多的精力和成本投入到业务方面。
2331 0
|
数据采集 分布式计算 算法
云场景实践研究第57期:明源云
本文中,明源云分享了整个的地产行业在阿里云大数据平台上的探索应用实践。自定义构建设计企业内部数据管理平台DMP平台,并通过应用场景诠释了大数据在地产行业的作用。
2146 0