本节书摘来异步社区《驾驭大数据》一书中的第3章,第3.7节,作者: 【美】Bill Franks 译者: 黄海 , 车皓阳 , 王悦 , 等 责编: 杨海玲,更多章节内容可以访问云栖社区“异步社区”公众号查看。
3.7 工业发动机和设备:传感器数据的价值
驾驭大数据
世界各地安装了许多复杂的机器和发动机,例如,飞机、火车、军车、建筑设备、钻孔设备等。因为造价昂贵,保持这些设备的稳定运转是非常重要的。近些年来,从飞机发动机到坦克等各种机器上也开始使用嵌入式传感器,目标是以秒或毫秒为单位来监控设备的状态。
监测工作可以做得相当细,特别是在测试和开发过程中。例如,当新的发动机开发出来,就得依靠获取到的足够多的细节信息,来检查发动机是否可以按照预期设定的方式工作。一旦新发动机进入市场,再想更换有缺陷的部件的花费会相当高,因此我们需要事先详细地进行性能分析。监测是一项不断持续的活动。也许我们并不需要持续收集每一毫秒的细节信息,但如果能够收集到大量的细节信息,我们就可以评估该设备的生命周期,识别出重复出现的问题。
例如,发动机传感器可以收集到从温度到每分钟转数、燃料摄入率再到油压级别等信息,而数据可以根据预先设定的频率获取。当读数频率、读取指标数量和监控项目数量增加时,数据量会迅速增加。为什么我们要关心这一点?下面我们来看一些例子。
使用传感器数据
发动机的结构很复杂,有很多移动部件,必须在高温下运转,会经历各种各样的运转状况。因为它们的成本太高,所以期望寿命越长越好。因此,稳定的、可预测的性能就变得异常重要,因为机器的寿命依赖于此。例如,对故障飞机进行保养维修会花掉航空公司或者空军部队一笔不小的钱,但这种事情我们还必须做,因为我们要识别出飞机是否存在安全隐患。因此,飞机或者飞机发动机以及其他设备的停机时间一定要降到最低,航空公司或者空军部队对此都有非常迫切的需求。
停机时间最小化策略包括准备备件或后备发动机快速割接时需要维修的设备、从诊断结果中快速识别需要更换的部件、针对问题部件投资开发更可靠的新版本。要想有效实施这3种策略,必须得有数据。我们要用数据生成诊断算法,或者用数据作为输入来诊断某个特定的问题。工程部门可以使用传感器数据准确地定位问题的原因,设计新的措施支持更长、更可靠的操作。不管发动机是飞机的,还是船只的,或者是陆地设备的,这些考虑因素都适用。
通过提取和分析详细的发动机运转数据,我们可以精确地定位那些会导致立即失效的某些模式。然后我们就能识别出会降低发动机寿命的时间分段模式以及更加频繁的维修。多个变量的排列组合数目,特别是一段时间内的排列组合数目,使得这类数据分析活动变成了一项挑战。这个过程不仅会涉及到大数据,就连随之开发出来的分析也会变得异常复杂和困难。以下是我们可以研究的一些问题。
- 压力骤然下降是否表示一定就会出问题?
- 温度在几小时内持续下降是否意味着还有其他问题?
- 振动水平异常是否意味着有问题?
- 发动机启动时的飞速转动是否让某些部件的性能严重受损,而且还会增加维修的次数?
- 几个月内油压一直比较低,是否会使发动机的某些部件受损?
结构化数据内缺少结构性
传感器数据给我们带来了一个非常艰巨的挑战。虽然我们收集到的数据是结构化的,独立的数据元素也很好理解,但元素之间的时间关系和模式却根本无法理解。延时和无法测量的外部因素增加了问题的复杂性。如果要考虑所有的信息,识别各种数据长期的作用效果,这个过程会异常复杂。拥有结构化数据并不一定能够保证分析方法就是高度结构化和标准化的。
在出现严重问题的时候,先回头去检查当时发生了什么,一直检查到问题自己露出马脚,这种做法会非常奏效。传感器的作用类似于依靠飞机黑匣子的帮助诊断失事原因。发动机传感器数据可以用于诊断活动和研究行为。从概念上讲,相对于先前我们讲到的汽车保险案例中的信息服务设备,我们这里讨论的传感器是一种更复杂的形式。传感器不断感知周围环境并获得数据信息,这是大数据世界中反复讨论的一个主题。虽然我们这里讨论的是发动机,但传感器还有数不清的各类用途,这里讨论的原则也同样适用。
如果大量传感器都长时间重复着传感器数据收集流程,那会产生大量丰富的分析数据。只要好好地分析这些数据,就能发现设备的缺陷,就有机会主动修复这些问题。我们还可以把设备中的弱点先行识别出来。随后,我们可以制定好流程,缓解这些发现带来的问题。这些措施带来的收益不止是安全级别的提升,还会让我们的成本下降。使用传感器数据,发动机和设备都会更加安全,能够提供服务的时间就会比较长,这样运营会比较平稳,成本也会比较低。这是一种通赢的做法。