电潜泵的预测性维护——检测电潜泵的故障

简介: 电潜泵的预测性维护——检测电潜泵的故障

电潜泵(ESP)目前被广泛应用于生产高产量、高含水率的非线性流动油井,以提高产量。在油气行业中,轴断裂是常见的问题,会导致生产中断,造成重大经济损失。本文的目标是评估主成分分析(PCA)作为一种无监督机器学习技术,用于检测ESP轴断裂的原因。该方法已成功应用于中国渤海油田蓬莱区块,实时检测ESP轴断裂。通过绘制第一和第二主成分的二维图,可以识别稳定区域、不稳定区域和故障区域中的不同聚类。通过这种方式,当聚类开始偏离稳定区域时,可以发现潜在的ESP轴断裂。此外,建立了一个PCA诊断模型,用于预测ESP轴断裂发生的时间,并确定最主要的决策变量与事件的关系。本文证明了PCA方法在监测ESP系统和准确预测ESP轴即将断裂方面表现良好。

简介

电潜泵目前被广泛应用于非线性流动油井、高产量、高含水率以及海上油井,其结构简单且效率高(Ratcliff、Gomez、Cetkovic和Madogwe,2013)。在所有的油田人工举升系统中,ESP被认为是首选,因为它能够在更高的温度和更深的井深下产生更大的体积。然而,通常观察到ESP系统会出现故障中断的情况。泵轴的断裂对于运营公司来说是一个严重的问题,因为这会导致数亿桶石油的损失。如果泵轴断裂,电动机电流会突然下降,生产将中断。泵轴断裂的原因可能是泵组装不良或泵老化。

传感器和数据采集系统的发展使得ESP系统能够连续记录进口压力、进口温度、泵扬程、出口压力、出口温度、电动机温度、电动机电流、泄漏电流、振动等数据。这些数据将按照规定的时间间隔记录,并传输至地面远程终端单元(RTUs)。对于那些存在泵轴断裂的井,可以利用统计或机器学习算法进行故障分析和健康监测。

本文旨在评估主成分分析(PCA)作为一种监测工具,用于预测ESP轴的断裂。

ESP数据分析

多年来,电潜泵(ESP)操作系统得到了发展,并被视为在井筒条件下提取原油的有效手段。由于电潜泵传感器在石油行业中的快速发展,ESP系统引起了越来越多的关注。ESP传感器收集了大量的数据,包括动态数据、静态数据和历史数据,如图所示。在过去的几年中,使用ESP技术的井场需要通过实地访问来跟踪,这需要大量的人力资源对井口操作系统进行必要的调整。石油和天然气行业已经开始应用数据分析来提高生产效率提出了电流表图表作为监测ESP性能的主要诊断方法。

此外,监控与数据采集系统(SCADA)的出现为现场人员监控和控制ESP井的行为提供了便利。SCADA系统能够实现对ESP生产数据的实时连续记录。

近年来,ESP传感器采集的“大数据”成为评估ESP操作系统中提取最关键信息的重点。结合机器学习的数据驱动模型已被用于判断和优化井的生产。Bravo、Rodriguez、Saputelli和Rivas Echevarria(2014)将数据分析描述为收集和分析大数据的一个重要过程。

泵轴断裂是ESP操作系统中常见的故障。基于ESP地面和井下传感器获取的操作数据,数据驱动模型分析将在监测泵轴断裂方面发挥重要作用。需要从监督方法向基于数据驱动模型的故障诊断和预测性维护方法演变。主成分分析(PCA)被广泛认为是一种用于降维、特征值提取和数据可视化的预处理方法。PCA可以作为一种无监督机器学习技术,分析泵轴断裂的原因。

主成分分析

Jackson(2005)将PCA定义为一种无监督的降维方法,通过线性转换数据并创建一组称为“主成分”的新参数。我们所知道的是,ESP数据通常高度相关;例如,井口压力的增加会导致进出口压力的增加,最终导致电机温度的升高。PCA利用原始数据的相互关系构建PCA模型,通过利用线性组合并创建一个新的主成分空间(PCs)来降低生产参数的维度。这些主成分可以通过几个主成分来评估ESP系统,从而简化了过程。

对于那些存在泵轴断裂的井,可以建立一个PCA模型来分析泵断裂之前几个月的生产数据。一旦建立了稳健的PCA模型,就可以监测和诊断泵轴断裂的原因。基本的PCA模型可以表示如下:

其中,X是输入矩阵(n*p),表示原始参数;P是加载矩阵(p*k),表示原始参数的贡献;T是得分矩阵(n*k),表示原始参数之间的关系;E是残差矩阵(n*p),表示未捕获的方差;n是时间步数(Gupta、Saputelli和Nikolaou,2016);p是原始参数的数量;k是主成分的数量。

第一个主成分包含最大方差,意味着第一个主成分包含了最多的信息。第二个主成分将捕获下一个最大的方差,已经去除了第一个主成分的信息。通过这种方式,可以构建第三个、第四个...第k个主成分来评估原始系统。下图总结了上述内容。

通常情况下,PCA模型会找到k个主成分来构建PCs,这保留了属于初始系统的大部分信息。以PC1为例,第k个主成分表示如下:

在处理二维数据时,Ionita和Schiopu(2010)使用下图描述了这种情况。PCA用于发现高维数据中的模式,并转换稳定区域的数据,通常被描述为紧密聚集或云状数据集。通过建立一个与正常生产数据集相对应的PCA模型,可以检测ESP操作系统中的异常情况。前两个主成分具有最大的方差,仅通过前两个主成分就可以可视化原始参数中的大部分信息。

PCA诊断模型

PCA诊断模型被应用于识别泵轴断裂的原因和时间。Hotelling T平方统计量(T^2)和平方预测误差(SPE)用于数值化地展示标量统计量(Yue和Qin,2001)。T^2 是一种在多元假设检验中起重要作用的单变量统计量,SPE经常用于多元统计过程控制。T^2 和SPE被应用于分析决策变量是否满足稳定运行的要求。通过这种方法,可以确定每个决策变量对故障的贡献。故障问题最终将通过对每个决策变量贡献的排名来进行诊断。潜在的异常与相关决策变量的较高或最高排名有关。

如下描述了T^2和SPE的时间步骤:

其中x(t)是输入矩阵的第t个时间步骤; A^-1是协方差矩阵的逆矩阵(Westerhuis、Gurden和Smilde,2000);P是协方差矩阵的特征向量; Pe是残差加载矩阵;I是单位矩阵;

其中表示T^2和SPE的置信限。T^2遵循F分布,F分布是用于研究总体方差的右偏分布。其中代表可能分布的累积分布函数为0.99的边界。一旦超过控制限,T^2被视为潜在异常值。根据Jackson和Mudholkar(1979)的研究,SPE符合高斯分布,高斯分布关于均值对称,表明接近均值的数据比远离均值的数据更频繁地出现。其中C表示边界,等于0.99。当SPE超过控制限时被认为是异常值。Cho、Lee、Choi、Lee和Lee(2005)根据T^2和SPE提出了以下方程,定义了每个决策变量P的贡献。

其中代表矩阵I的第i列。每个决策变量的贡献越大,潜在异常的可能性就越大。

案例研究:ESP断轴诊断

1. ESP 断轴变量的选择

这十口发生泵轴断裂的ESP井的生产数据由ESP井下和地面传感器以20分钟的频率进行记录。这些ESP井下和地面传感器开始收集生产数据自十口ESP井投入生产时开始,直到这些井的泵轴断裂发生为止。这些泵轴断裂的ESP井包括中国渤海油田蓬莱区块的E52ST1、C06ST1、B50ST2、E20ST2、A11ST1、B03ST1、B48ST1、E21ST1、E47ST1和E42ST1。收集了两种不同类型的数据集,包括:

• 包含套管节流阀、套管线压力、套管压力、套管气体流量、ESP进口压力、ESP出口压力、管线压力、管线温度、进口温度、电机电流、电机泄漏电流、电机功率、电机温度、电机转矩电流、电机振动、电机电压、油管节流阀和变频器频率等输入变量参数的数据记录。

• 包含每口井泵轴断裂发生时间的数据记录。

2. 主成分分数

基于获取的输入变量,构建了一个PCA模型。根据捕获的方差递减的顺序,对不同的主成分进行了排名。以E52ST1井为例,观察到八个主成分捕获了原始输入参数99%以上的方差,如图所示。

第一和第二主成分具有最高的方差,并在原始数据中捕获了大约70%的方差。使用主成分1和主成分2的得分的二维图,观察稳定期、不稳定期和故障期间的不同聚类情况。在稳定期间,ESP正常运行,所有的输入变量参数都在正常工作范围内。当进入不稳定期,一些输入变量参数明显异常,但ESP仍在运行。此外,泵轴断裂和ESP故障发生在故障期间。

下图展示了E52ST1井泵轴断裂的历史数据的主成分1和主成分2的得分图。在这个时间段内,随着时间步长的增加,结果清楚地显示了稳定区域、不稳定区域和故障区域三个不同的聚类。在开始时,ESP投入生产。观察到正常运行的输入变量参数形成了一个稳定区域的聚类。经过长时间工作后,一些输入变量参数开始偏离正常工作范围,但ESP仍在运行。当出现这种异常行为时,一个偏离稳定区域的不稳定区域将形成。ESP继续工作一段时间的不稳定时间。最后,泵轴断裂,ESP故障。从下图中可以观察到,黑色的故障区域远离稳定区域。主成分1和主成分2的这个二维得分图对实时监测ESP性能具有重要意义,可以与先前的正常工作区域进行对比,提前警告现场工程师可能的故障,如果聚类开始偏离稳定区域。

3. 泵断轴识别

从稳定区域获取的生产数据经过归一化处理,并作为输入矩阵(Xtraining)用于构建鲁棒PCA模型。此外,选择与不稳定或故障区域时间段相对应的历史数据作为测试数据集(Xtesting),输入到PCA模型中。这个过程可以针对导致故障的历史泵轴断裂事件重复进行。此外,建立PCA诊断模型来预测泵轴断裂发生的时间,并确定对泵轴断裂最负责任的决策变量。

根据公式,可以通过PCA诊断模型计算每个决策变量的贡献度。贡献度较高或最高的决策变量与泵轴断裂更相关。决策变量根据其贡献度进行排以E52ST1井为例,如下图所示,电机转矩电流对故障区域的贡献度最高。因此,如果聚类开始偏离稳定区域,这种贡献度图可以用于诊断在实时监测平台上对泵轴断裂最负责任的决策变量。

构建鲁棒PCA模型后,可以预测泵轴断裂发生的时间。使用图像(image)和SPE方程来确定泵轴断裂前潜在异常的时间。Dunia和Joe Qin(1998)在PCA诊断模型下提出了四种可能的检测结果,具体如下:

(1)图像指标和SPE指标均超过控制限;

(2)图像指标和SPE指标均未超过控制限;

3)图像指标超过控制限,但SPE指标未超过;

(4)SPE指标超过控制限,但图像指标未超过。

通常情况下,检测结果(1)和(4)通常被视为泵轴断裂的潜在情况。本文包含了每口井ESP轴断裂发生的时间数据。通过PCA诊断模型预测的ESP轴断裂时间与实际的ESP轴断裂时间进行了详细比较。

以E52ST1、CO6ST1和B50ST1井为例,计算了图像指标和SPE指标来预测ESP生产异常,如下图所示。当ESP轴断裂时,使用图像和SPE来确定断裂时间,采用检测结果(1)和(4)。

下表显示了PCA诊断模型对泵轴断裂时间的预测与实际ESP轴断裂时间的比较。通过对下表的分析可以发现,PCA诊断模型对泵轴断裂时间的预测略早于实际的泵轴断裂时间。因此,PCA诊断模型在预测ESP断轴井的断裂时间和实时学习技术方面具有出色的准确性。此外,PCA技术可以作为开发更好的工具来预测ESP故障的基础。

ESP 轴断裂的 PCA 诊断模型预测时间与实际断裂时间的比较。

威尔斯没有。 PCA模型预测 实际破损时间
E52ST1 2019-5-26 13:40 2019-5-26 16:00
CO6ST1 2019-5-27 22:20 2019-5-28 6:40
B48ST1 2015-10-7 21:40 2015-10-8 16:20
E20ST2 2019-9-12 10:20 2019-9-12 12:40
B50ST2 2019-6-15 8:00 2019-6-16 15:40
A11ST1 2015-5-10 4:40 2015-5-10 10:00
B03ST1 2015-8-30 15:40 2015-8-31 1:00
E21ST1 2015-8-26 10:00 2015-8-26 23:40
E47ST1 2018-1-14 8:40 2018-1-15 9:20
E42ST1 2018-4-24 22:40 2018-4-25 2:00

结论

本论文提出了一个基于大数据分析的模型,用于预测ESP操作系统中即将发生的泵轴断裂。这个大数据模型依赖于ESP井下和地面传感器收集的实时数据。可以得出结论,PCA有潜力作为一种识别技术,用于预测动态变化,并因此识别即将发生的ESP泵轴断裂。本研究的主要结论可以总结如下:

  1. 利用主成分1和主成分2的得分的二维图可以用于识别稳定区域、不稳定区域和故障区域的不同聚类。通过这个二维图,如果聚类与稳定区域相距较远,现场工程师将会被提醒可能发生ESP泵轴断裂的风险。
  2. 一旦建立了稳健的PCA诊断模型,确定导致ESP泵轴断裂的决策变量对于解释聚类与稳定区域的偏离非常重要。
  3. 通过应用图像和SPE方程,PCA诊断模型在预测ESP泵轴断裂时间方面具有出色的准确性。
  4. PCA可以作为重要的预处理方法和无监督机器学习技术,用于预测ESP故障的发展。


相关文章
|
8月前
|
存储 数据采集 数据挖掘
质量追溯系统方案
质量追溯系统方案
116 1
|
2天前
|
算法
【核心复现】同时考虑考虑孤岛与重构的配电网故障恢复运行策略
【核心复现】同时考虑考虑孤岛与重构的配电网故障恢复运行策略
主动配电网故障恢复与孤岛划分模型-多时段
主动配电网故障恢复与孤岛划分模型-多时段
|
10月前
|
算法
主动配电网故障恢复的重构与孤岛划分统一模型研究【升级版本】(Matlab代码实现)
主动配电网故障恢复的重构与孤岛划分统一模型研究【升级版本】(Matlab代码实现)
|
10月前
|
传感器 机器学习/深度学习 存储
预测性维护—— 一个没有意外停机的世界
预测性维护—— 一个没有意外停机的世界
225 0
|
缓存 JSON 运维
如何避免大规模线上故障
如何避免大规模线上故障
118 0
|
运维 监控 网络协议
如何监控IT正常运行时间,网络正常运行对企业业务至关重要
随着企业的扩展,其IT网络规模也将不断增长。当将大量属于不同类别,由不同供应商制造的设备添加到您的IT基础结构中时,正常运行时间的管理复杂性就急剧上升
111 0
如何监控IT正常运行时间,网络正常运行对企业业务至关重要
|
数据采集 数据可视化 安全
预防山体滑坡安全监测系统
滑坡泥石流是地质灾害中的重要组成部分,我国地质和地理环境复杂,气候条件时空差异大,地质灾害种类动、分布广、危害大,是世界上地质灾害最严重的国家之一。河北稳控科技充分利用在滑坡监测方面的技术积累,建立了一套科学完善的滑坡监测预警平台,实现了滑坡防治管理的科学化、信息化、标准化和可视化。为防灾减灾决策提供科学依据。
预防山体滑坡安全监测系统
|
运维 监控 前端开发
开发人员该如何应对线上故障
开发人员该如何应对线上故障
384 0
开发人员该如何应对线上故障
|
运维 数据库
故障定位方法-磁盘故障定位手段
常见的磁盘故障是磁盘空间不足、磁盘出现坏块、磁盘未挂载等。 磁盘故障有的会导致文件系统损坏,比如磁盘未挂载,集群管理自动定期做磁盘检测时会识别故障并将实例停止,查看集群状态时对应实例状态异常;有的不会导致文件系统损坏,比如磁盘空间不足,集群管理无法检测到,服务进程访问到故障磁盘会异常退出,比如:数据库无法启动、checksum校验不对、页面读写失败、页面校验错误等。 对于会导致文件系统损坏的故障,查看集群状态会显示对应实例状态持续为Unknown,定位方法如下: 查看cm_agent日志,日志保存在mpp/omm/cm/cm_agent,日志中会有类似“data path disc wri
340 0