海量电力设备监测数据的存储和特征分析

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 海量电力设备监测数据的存储和特征分析

一、电力设备在线监测的目的及意义


1、项目背景


电力设备在线检测是指在不停电的情况下,对电力设备状况进行连续或周期自动检测监视。运用传感器技术、广域通信技术、信息处理技术

实时感知-->监视预警-->分析诊断-->评估预测

电力设备在线检测是实现电力设备运行检修管理、提升生产运行管理精益化的重要手段,对提升电网智能化水平,实现电力设备状态运行管理具有积极而深远的意义。

例如:海量数据处理平台

变压器油色谱监测,容性设备在线检测,数字化变电站,山火监测,雷电定位系统,覆冰预警系统,SCADA系统。


2.数据特点:


规模巨大:TB->PB 【一个省级电网公司,150+变电站,150TB、day】

数据处理速度:性能瓶颈,实时监控画面刷新周期小于5s

数据类型多样:结构化,半结构化,非结构化

价值密度低:在正常数据占据大多数,希望发现隐匿在里面的价值数据。


3.国家电网公司数据存储和系统架构【现状】


  • 过于依赖集中式SAN存储
  • 基于SOA的数据集成
  • 主要采用“企业级关系型数据库”
  • 只存储二次加工的“熟数据”
  • 速度慢,静态,关联性强
  • OLTP没有用武之处
  • 容量,性能,可靠性,扩展性
  • 一次性设备绝缘放电电流波形信号


4.先进的技术解决


阿里云、亚马逊、ODPS、HADOOP,SPARK,HBASE,STORM,ZOOKEEPER


5.选择计算场景


流式计算:消息触发,单挑处理,实时计算

在线计算:用户触发,频繁交互,快速响应

离线计算:定时安生,批量处理,实时性差


二、监测数据分析方法介绍


1、局部放电相位分析


局部放电相位分析(phase resolved partial discharge, PRP D) 将多个工频周期内监测所得的局部放电参数(放电次数N、视在放电量Q或放电幅值,及放电所在相位p)折算到一个工频周期内,计算其统计规律性,获取放电谱图,统计放电特征,用于模式识别。


参数提取-->放电谱构造-->统计特征计算-->放电类别识别

2.基本参数n-q-p的获取


以变压器局部放电监测数据为例,使用经典的局部放电相位分析法,计算局部放电波形相位信息n-q-p参数,并在此基础上计算放电谱图。

对于局部放电脉冲,具有以下三个基本参数:

①放电量q;:第i次放电的视在放电量;

②放电相位p;:第i次放电脉冲存在的工频电压相位;

③放电重复率n:单位时间内的放电次数。

由于这三个参数具有很强的统计分散性,需要对若干个工频周期(50个)内的基本参数进行统计处理,以突出基本参数的变化规律,有利于反映局部放电特性,这就需要计算放电谱图。


三、MaxCompute介绍


大数据计算服务(MaxCompute,原名ODPS)是一种快速、完全托管的EB级数据仓库解决方案。

随着数据收集手段不断丰富,行业数据大量积累,数据规模已增长到了传统软件行业无法承载的海量数据(百TB、PB、EB)级别。MaxCompute致力于批量结构化数据的存储和计算,提供海量数据仓库的解决方案及分析建模服务。

由于单台服务器的处理能力有限,海量数据的分析需要分布式的计算模型。分布式的计算模型对数据分析人员要求较高且不易维护。数据分析人员不仅需要了解业务需求,同时还需要熟悉底层分布式计算模型。MaxCompute为您提供完善的数据导入方案以及多种经典的分布式计算模型,您可以不必关心分布式计算和维护细节,便可轻松完成大数据分析。

目前,MaxCompute服务已覆盖全球16个国家和地区,客户遍及金融、互联网、生物医疗、能源、交通、传媒等行业,为全球用户提供海量数据存储和计算服务。MaxCompute的多个客户案例荣获“2017大数据优秀产品和应用解决方案案例”奖。此外,MaxCompute、DataWorks以及AnalyticDB代表阿里云入选了Forrester Wave™ Q4 2018云数据仓库报告。


四、电力设备监测数据的MaxCompute表存储


1、MaxCompute字段限制


  • 列数量小于1024个
  • 支持数据类型不能存储多个【成千上万】采样点的值


2、DDL建表


  // 建表
create table if not exists ODPS_PD(Time string, Phase bigint, Value bigint) partitioned by(DeviceID string,  Date string);
  // 查询
List tables;
// 添加分区
alter table ODPS_PD add if not exists partition (DeviceID= '001', Date = '20200501'); 
// 导入数据
tunnel upload d:\.....csv ODPS_PD/DeviceID= '001', Date = '20200501';
// 读取数据
read ODPS_PD;


3、并行特征计算,Eclipse和IDEA的MaxCompute插件,即可创建ODPS项目。


Eclipse Step 01官网导航中找到并下载ODP S for eclipse插件

Step 02将插件解压并复制到问eclipse安装目录下的plug-in子目录下

Step 03启动eclipse

Step 04检查Wizard选项里面是否有ODP S的目录

IDEA 搜索插件 MaxCompute Studio安装即可。 使用MaxCompute实现监测数据统计特征分析的完整过程,最终让学员可以自己胜任在阿里云上的数据分析任务。实验中用到的数据是变压器局部放电的谱图数据,使用的数据分析工具是MaxCompute提供的MapReduce编程模型,要求使用Java语言编写程序,实现数据分析任务。


4、资源上传程序jar包


// 上传 add jar d:/NQF.jar; // 查询资源 ls resources; // 执行,依赖主类的名称FSDriver,还需要依赖本地的JAR来解析 jar -resources NQF.jar -classpath D:\NQF.jar FSDriver 输入表 输出表;


5、放电类型识别


  • 阿里云MaxCompute【模式识别算法】【Graph模式识别算法】
  • 阿里云机器学习平台 PAI
  • Apache Mahout
  • Spark的MLlib
  • 谷歌的TensorFlow
相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
8月前
|
数据采集 监控 数据挖掘
如何更有价值采集电商数据,高效分析数据?
大数据,就是在一定时间范围内用常规工具软件对历史数据捕捉、处理,加以分析,进而改善决策和管理。在大数据时代,企业必须用大数据分析方法来做电商。
|
数据采集 分布式计算 DataWorks
数据分析之「数据探查」—帮您快速掌握数据情报
为了帮助用户一眼看穿当前数据的质量、结构、分布、统计信息,Dataworks数据分析系统提供了数据探查这个情报管家。它支持探查概览、支持探查详情、支持数据筛选、支持数据刷新、支持数据分布直方图动态装箱和多级下钻!我们会在电子表格顶部以图形和富文本的形式,智能展示每列数据类型和值分布的概览情况;同时,也支持切换到详细模式,查看更多更全面的数据信息。
2552 0
|
8月前
|
编解码 大数据 定位技术
遥感数据、气象数据、土地土壤数据、农业数据、行政区数据...GIS数据获取网站整理
遥感数据、气象数据、土地土壤数据、农业数据、行政区数据...GIS数据获取网站整理
562 2
|
SQL 分布式计算 调度
开源大数据分析实验(1)——简单用户画像分析之采集数据
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
|
存储 消息中间件 传感器
SPL 实现电力高频时序数据实时存储统计
SPL 实现电力高频时序数据实时存储统计
SPL 实现电力高频时序数据实时存储统计
|
NoSQL 关系型数据库 MySQL
车联网场景下海量车辆状态数据存储实践
随着通信技术、计算机技术的不断发展,移动通信正在从人与人(H2H)向人与物(H2M)以及物与物(M2M)的方向发展,“万物互联”的概念正在逐步覆盖到各行各业中,例如智能家居、智能农业、智能交通、智能物流等领域。目前,车联网技术已经先行一步,在行车安全、交通管理、生活服务等方面得到充分应用。 车联网技术包括了车辆终端、云端、无线通信等方面。车辆终端实时产生大量车辆状态数
2074 0
车联网场景下海量车辆状态数据存储实践
|
安全
Worldometer网站实时统计新冠数据
Worldometer网站实时统计新冠数据
456 0
Worldometer网站实时统计新冠数据
|
存储 SQL 人工智能
基于海量日志和时序数据的质量建设最佳实践
在云原生和DevOps研发模式的挑战下,一个系统从开发、测试、到上线的整个过程中,会产生大量的日志、指标、事件以及告警等数据,这也给企业质量平台建设带来了很大的挑战。本议题主要通过可观测性的角度来讨论基于海量日志和时序数据的质量建设最佳实践。
基于海量日志和时序数据的质量建设最佳实践
|
监控 数据格式 JSON
日志服务数据加工培训直播资料汇总: 扫平日志分析路上障碍, 实时海量日志加工实践
日志服务数据加工系列培训资料汇总: 扫平日志分析路上障碍, 实时海量日志加工实践
1671 0

热门文章

最新文章