《驾驭大数据》一3.7 工业发动机和设备:传感器数据的价值

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

本节书摘来异步社区《驾驭大数据》一书中的第3章,第3.7节,作者: 【美】Bill Franks 译者: 黄海 , 车皓阳 , 王悦 , 等 责编: 杨海玲,更多章节内容可以访问云栖社区“异步社区”公众号查看。

3.7 工业发动机和设备:传感器数据的价值

驾驭大数据
世界各地安装了许多复杂的机器和发动机,例如,飞机、火车、军车、建筑设备、钻孔设备等。因为造价昂贵,保持这些设备的稳定运转是非常重要的。近些年来,从飞机发动机到坦克等各种机器上也开始使用嵌入式传感器,目标是以秒或毫秒为单位来监控设备的状态。

监测工作可以做得相当细,特别是在测试和开发过程中。例如,当新的发动机开发出来,就得依靠获取到的足够多的细节信息,来检查发动机是否可以按照预期设定的方式工作。一旦新发动机进入市场,再想更换有缺陷的部件的花费会相当高,因此我们需要事先详细地进行性能分析。监测是一项不断持续的活动。也许我们并不需要持续收集每一毫秒的细节信息,但如果能够收集到大量的细节信息,我们就可以评估该设备的生命周期,识别出重复出现的问题。

例如,发动机传感器可以收集到从温度到每分钟转数、燃料摄入率再到油压级别等信息,而数据可以根据预先设定的频率获取。当读数频率、读取指标数量和监控项目数量增加时,数据量会迅速增加。为什么我们要关心这一点?下面我们来看一些例子。

使用传感器数据
发动机的结构很复杂,有很多移动部件,必须在高温下运转,会经历各种各样的运转状况。因为它们的成本太高,所以期望寿命越长越好。因此,稳定的、可预测的性能就变得异常重要,因为机器的寿命依赖于此。例如,对故障飞机进行保养维修会花掉航空公司或者空军部队一笔不小的钱,但这种事情我们还必须做,因为我们要识别出飞机是否存在安全隐患。因此,飞机或者飞机发动机以及其他设备的停机时间一定要降到最低,航空公司或者空军部队对此都有非常迫切的需求。

停机时间最小化策略包括准备备件或后备发动机快速割接时需要维修的设备、从诊断结果中快速识别需要更换的部件、针对问题部件投资开发更可靠的新版本。要想有效实施这3种策略,必须得有数据。我们要用数据生成诊断算法,或者用数据作为输入来诊断某个特定的问题。工程部门可以使用传感器数据准确地定位问题的原因,设计新的措施支持更长、更可靠的操作。不管发动机是飞机的,还是船只的,或者是陆地设备的,这些考虑因素都适用。

通过提取和分析详细的发动机运转数据,我们可以精确地定位那些会导致立即失效的某些模式。然后我们就能识别出会降低发动机寿命的时间分段模式以及更加频繁的维修。多个变量的排列组合数目,特别是一段时间内的排列组合数目,使得这类数据分析活动变成了一项挑战。这个过程不仅会涉及到大数据,就连随之开发出来的分析也会变得异常复杂和困难。以下是我们可以研究的一些问题。

  • 压力骤然下降是否表示一定就会出问题?
  • 温度在几小时内持续下降是否意味着还有其他问题?
  • 振动水平异常是否意味着有问题?
  • 发动机启动时的飞速转动是否让某些部件的性能严重受损,而且还会增加维修的次数?
  • 几个月内油压一直比较低,是否会使发动机的某些部件受损?

结构化数据内缺少结构性

传感器数据给我们带来了一个非常艰巨的挑战。虽然我们收集到的数据是结构化的,独立的数据元素也很好理解,但元素之间的时间关系和模式却根本无法理解。延时和无法测量的外部因素增加了问题的复杂性。如果要考虑所有的信息,识别各种数据长期的作用效果,这个过程会异常复杂。拥有结构化数据并不一定能够保证分析方法就是高度结构化和标准化的。

在出现严重问题的时候,先回头去检查当时发生了什么,一直检查到问题自己露出马脚,这种做法会非常奏效。传感器的作用类似于依靠飞机黑匣子的帮助诊断失事原因。发动机传感器数据可以用于诊断活动和研究行为。从概念上讲,相对于先前我们讲到的汽车保险案例中的信息服务设备,我们这里讨论的传感器是一种更复杂的形式。传感器不断感知周围环境并获得数据信息,这是大数据世界中反复讨论的一个主题。虽然我们这里讨论的是发动机,但传感器还有数不清的各类用途,这里讨论的原则也同样适用。

如果大量传感器都长时间重复着传感器数据收集流程,那会产生大量丰富的分析数据。只要好好地分析这些数据,就能发现设备的缺陷,就有机会主动修复这些问题。我们还可以把设备中的弱点先行识别出来。随后,我们可以制定好流程,缓解这些发现带来的问题。这些措施带来的收益不止是安全级别的提升,还会让我们的成本下降。使用传感器数据,发动机和设备都会更加安全,能够提供服务的时间就会比较长,这样运营会比较平稳,成本也会比较低。这是一种通赢的做法。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
8天前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
67 7
|
8天前
|
存储 分布式计算 大数据
大数据 优化数据读取
【11月更文挑战第4天】
23 2
|
21天前
|
数据采集 监控 数据管理
数据治理之道:大数据平台的搭建与数据质量管理
【10月更文挑战第26天】随着信息技术的发展,数据成为企业核心资源。本文探讨大数据平台的搭建与数据质量管理,包括选择合适架构、数据处理与分析能力、数据质量标准与监控机制、数据清洗与校验及元数据管理,为企业数据治理提供参考。
65 1
|
5天前
|
存储 大数据 数据管理
大数据分区简化数据维护
大数据分区简化数据维护
14 4
|
15天前
|
存储 大数据 定位技术
大数据 数据索引技术
【10月更文挑战第26天】
37 3
|
15天前
|
存储 大数据 OLAP
大数据数据分区技术
【10月更文挑战第26天】
49 2
|
18天前
|
消息中间件 分布式计算 大数据
数据为王:大数据处理与分析技术在企业决策中的力量
【10月更文挑战第29天】在信息爆炸的时代,大数据处理与分析技术为企业提供了前所未有的洞察力和决策支持。本文探讨了大数据技术在企业决策中的重要性和实际应用,包括数据的力量、实时分析、数据驱动的决策以及数据安全与隐私保护。通过这些技术,企业能够从海量数据中提取有价值的信息,预测市场趋势,优化业务流程,从而在竞争中占据优势。
61 2
|
20天前
|
数据采集 分布式计算 大数据
数据治理之道:大数据平台的搭建与数据质量管理
【10月更文挑战第27天】在数字化时代,数据治理对于确保数据资产的保值增值至关重要。本文探讨了大数据平台的搭建和数据质量管理的重要性及实践方法。大数据平台应包括数据存储、处理、分析和展示等功能,常用工具如Hadoop、Apache Spark和Flink。数据质量管理则涉及数据的准确性、一致性和完整性,通过建立数据质量评估和监控体系,确保数据分析结果的可靠性。企业应设立数据治理委员会,投资相关工具和技术,提升数据治理的效率和效果。
54 2
|
22天前
|
存储 安全 大数据
大数据隐私保护:用户数据的安全之道
【10月更文挑战第31天】在大数据时代,数据的价值日益凸显,但用户隐私保护问题也愈发严峻。本文探讨了大数据隐私保护的重要性、面临的挑战及有效解决方案,旨在为企业和社会提供用户数据安全的指导。通过加强透明度、采用加密技术、实施数据最小化原则、加强访问控制、采用隐私保护技术和提升用户意识,共同推动大数据隐私保护的发展。
|
26天前
|
SQL 存储 大数据
大数据中数据提取
【10月更文挑战第19天】
52 2
下一篇
无影云桌面