基于物联网平台的车辆时序数据存储实践

简介: 物联网平台 + Tablestore 时序表解决车联网中时序数据存储场景、需求。

近些年来,物联网技术得到了飞速发展,应用到了诸多行业里。智慧城市、智能家居、车联网、新能源等领域中都享受着物联网技术带来的红利。物联网技术在应用到日益复杂的场景的同时,也面临着越来越多的难题。不同于传统互联网,物联网数据的产生源由“人”转向了“物”。在传统互联网中,一条数据的产生可能是一次购物下单操作、一条朋友圈发布等,数据的结构、产生时间等都是动态的。而在物联网中,数据是由设备(终端)生成的,设备有着固定的型号与上报周期,特定的设备型号采集的数据维度也是固定的,由此可以看出物联网数据的结构、产生频率、时间都是可预料的。这类数据我们可以称之为时序数据。在物联网的应用领域中,会产生多种类型的时序数据,比如车速、集群水位、电表数等等,如下图举例。

时序数据场景解读

我们以车联网场景为例,来分析车联网场景中会产生哪些时序数据,以及具体的业务场景需求。


车辆时序数据特点

首先我们需要了解车联网场景中会产生哪些数据时序数据。

  • 车身数据。智能车辆会通过各类传感器定时采集车身状态信息,比如行驶速度、发动机转速、轮胎压力值、里程数等,这类数据是以一个固定的频率上报的。
  • 事件数据。另外一种是车辆事件数据,比如门锁上防、撤防、车辆碰撞、异常移动等,这类数据是由某个事件触发产生的。

不同的车辆设备上报数据的过程是独立的,每次上报数据都会带有时间戳,一台车辆在一段时间内上报的数据可以看作是一条时间线,一条时间线中包含了多条带有时间戳属性的数据。所以时间线的条数取决于设备个数,时序数据的规模取决于设备个数与上报周期。如下图展示了一条时间线:

从上述内容中我们可以总结出时序数据的如下几个特点:

  1. 数据规模大。假设一万台车辆每 10 秒上报一条 1KB 大小的数据,一年就会产生 30TB 的时序数据。
  2. 度量维度多且固定。车身传感器上报的是车内温度、发动机转速等行驶状态数据,而门锁传感器上报的则是门锁上防、门锁撤防等事件类数据。
  3. 数据随时间增长顺序生成。车辆都是随着时间推移间隔上报数据,每一条数据带有一个时间戳。


车联网场景需求

车联网场景中需要基于各种型号的传感器采集车身状态、事件信息等数据,通过对数据的处理和分析来实现业务需求。那么首先就需要构建能够支持大规模车辆接入的 MQTT 集群,用于满足时序数据的正常上报过程。数据采集完毕后,需要将时序数据持久化存储用于满足后续的查询分析的业务需求,为了降低存储成本,运营商通常只会选择的保留近一段时间内的数据,比如三个月或者一年,更早的数据访问频率非常低,常见的处理方式是冷归档或者删除。时序数据从 MQTT 集群转发到存储的过程中,TPS 会达到十万甚至百万级别,并且基本不会出现 Update 操作。数据写入到存储后,业务方可以查询或分析时序数据来满足需求,大致可以分为单时间线查询和多时间线查询两类。单时间线查询的数据量通常较小,对于延迟较为敏感,例如查询某台车辆一段时间内的行驶轨迹、计算某台车辆一段时间内的平均速度。多时间线查询命中的数据规模大,例如分析某种型号所有车辆的平均里程、分析某个城市所有车辆的平均排放值等。下面我们对车联网的场景需求做一个总结:


车辆设备接入

车身数据、事件数据持久化存储

数据写入

数据查询与分析

  1. 大规模车辆设备稳定连接
  1. 存储 TB、PB 规模时序数据
  2. 数据生命周期管理
  1. 高 TPS 低延迟写入
  2. 基本都是 Put 操作,极少有 Update 操作
  1. 单时间线范围查询、分析
  2. 多时间线聚合分析


时序数据对存储的需求

从上述对车联网场景需求的分析中可以总结出对存储侧的几个关键需求:


  1. 低成本存储

由于时序数据的规模太大,所以要求存储侧能够支持较低的存储单价。常见的时序存储产品降低用户存储成本的策略是冷热分层存储压缩存储数据保留策略(RP),其中冷热分层存储的做法是将旧数据迁移到低成本的存储介质中,以降低整体的数据存储单价;压缩存储是提供更高的数据压缩比,降低存储空间大小,从而达到降低存储成本的目的。RP 策略是能够支持用户设置数据保留的时长,定时清理掉旧数据,降低存储空间。


  1. 高并发低延迟写入

时序数据的写入并发取决于设备数和上报周期,在车联网业务中可轻易达到十万甚至百万 TPS,这就要求存储侧最好是可以弹性伸缩的集群架构。而如果是单机存储,当业务规模增大时,就必须对机器资源进行扩容,这将进一步带来额外的运维成本。并且时序数据对写入延迟非常敏感,比如在车辆轨迹实时大屏场景中,如果写入延迟太高,将导致车辆实际位置与大屏显示位置存在误差,这显然是难以接受的。


  1. 大规模数据分析

车联网业务中需要对单条时间线或多时间线进行复杂的查询和分析,例如上文提到的轨迹查询、排放值分析等等。参与聚合分析的数据量可能达到上百万行,这就要求存储系统对分析性能进行优化,例如支持易于分析的数据格式等。在查询方式上,存储侧需要兼容 SQL 语法,降低用户的使用门槛。


下面列出了常见的几款存储产品在时序数据存储需求上的对比:


存储成本

扩展性

查询方式

分析性能

InfluxDB

InfluxQL

RDS

SQL

Tablestore

API/SQL


通过对存储产品的对比可以看出,在存储成本、可扩展性、易用性和分析性能上,Tablestore 具有更好的优势。下面我们将基于阿里云物联网平台 + 表格存储 Tablestore 架构来实现车联网时序数据存储的业务需求。


物联网平台 + Tablestore 架构介绍

架构图

架构介绍

  • 物联网平台。阿里云物联网平台提供了可靠的设备连接通信能力,支持设备数据采集上云,规则引擎流转等功能。本文架构中物联网平台负责车辆设备的接入,通过不同的规则引擎配置将车身数据、事件数据分别转发到下游 Tablestore 时序表中存储。
  • 表格存储 Tablestore。表格存储 Tablestore  是阿里云自研的一款存储产品,适用于物联网设备监控、机器监控数据、车联网等场景。支持数据冷热存储、数据压缩存储、数据生命周期管理等众多能力,相比传统存储成本可降低 90%。本架构中表格存储 Tablestore 作为车身、事件数据的存储库,并且在 Tablestore 上使用 SQL 语法查询、分析数据。


案例背景

某厂商负责全市的出租车运营,为更方便的管理和运营车辆,厂商定时采集车辆的行驶状态数据。现在需要将车辆上报的时序数据接入到云端进行存储,为降低业务成本,厂商选择保留近三个月的数据。车辆每次上报的数据格式如下:

//车身数据样例
car_data ={"vin_id": 车架号
"city": 所在城市
"model": 型号
"time": 上报时间
"gps": 位置坐标
"speed": 行驶速度
"mileage": 里程
"emission": 排放值
}

业务上需要基于上述的时序数据来实现如下几个需求:

  1. 查询某台车辆一段时间内的位置信息,用于轨迹展示。
  2. 计算某台车辆一段时间内的平均行驶速度。
  3. 计算某个型号的车辆的平均里程数。
  4. 计算某个城市的车辆一段时间内的平均排放值。


实现步骤

本文将采用 物联网平台 + Tablestore 架构来实现上述案例,首先需要开通物联网平台服务和表格存储 Tablestore 服务。Tablestore 在多地域以实例(数据库)提供 Serverless 服务,开箱即用按量计费,无需任何运维操作。上述案例将以下面几个步骤来进行:时序数据存储初始化、车辆数据上报、配置规则引擎、时序数据查询分析


1. 时序存储表初始化

时序表数据模型介绍

首先创建 Tablestore 实例,并且创建两张时序表,分别存储车身数据(car_data_table)和事件数据(event_data_table)。Tablestore 时序表定义了固定的时间线 Schema ,分别是度量名称,数据源,标签。在车辆时序数据写入时,需要设计哪些字段与时间线中的属性对应,如下图展示了车身数据的一条记录存储结构:

创建时序表

创建 Tablestore 时序表支持设置数据生命周期 TTL,服务端将自动删除过期的数据。例如下图创建了用于存储车身数据的时序表,并且仅保存三个月内的数据。

2. IoT平台数据转发到存储

物联网平台中的规则引擎功能提供了将 Topic 中的数据转发到 Tablestore 时序表中存储的能力。如下图规则引擎中包括了数据源、数据目的和解析器脚本。

  • 数据源中需要指定哪些 Topic 中的数据将参与解析处理和转发。
  • 解析器脚本为用户自定义的 JS 代码或 SQL 语句,负责对数据进行规则处理。
  • 数据目的为 Tablestore 时序表所处的空间配置,比如服务地址、实例名、表名等。

下图展示了车身数据的 Topic 经过解析器脚本处理后,写入 Tablestore 时序表的过程:

配置完规则引擎并启动后,设备上报的数据将经过解析器处理后写入到对应的 Tablestore 时序表中。下面将使用物联网平台提供的设备模拟器模拟上报一条车身数据,验证数据链路的正确性。

3. 模拟设备上报数据

物联网平台提供了设备模拟器、设备端 SDK 等多种方式实现设备上报数据到平台的过程,下面我们使用设备模拟器模拟上报一条车身数据,如下图所示:

设备数据上报到平台后,将被规则引擎转发到 Tablestore 时序表中存储。下图展示了 Tablestore 控制台中存储的车身时序数据:

4. 时序数据查询与分析

在 Tablestore 时序存储引擎中,自动对时间线的列构建了索引。客户端可以使用 SQL 语法直接查询分析时序表中的数据。下面展示了上述案例中的几个业务需求实现:

  1. 查询某台车辆一段时间内的位置坐标
select gps from `car_series_table::muti_model` where _m_name ='car_series_data'and _data_source ='vin_id_1488'and _time >1655189452942704and _time <1655189872942704;

  1. 分析某台车辆一段时间内的平均速度
select avg(speed)from `car_series_table::muti_model` where _m_name ='car_series_data'and _data_source ='vin_id_1488'and _time >1655189452942704and _time <1655189872942704;

  1. 计算某个型号车辆的平均里程数
select avg(mileage)from `car_series_table::muti_model` where tag_value_at(_tags,"model")='model_0'

  1. 计算某个城市的车辆一段时间内的平均排放值
4. 
select avg(emission)from `car_series_table::muti_model` where tag_value_at(_tags,"city")='cn-hangzhou'and _time >1655189452942704and _time <1655189872942704;

总结

本文阐述了在车联网时序数据场景的一些业务需求,包括了大规模设备稳定连接、数据低成本存储、单/多时间线分析等,这对于网关和存储系统都有着较高的要求。文章中采用了物联网平台 + Tablestore 架构实现了完整的车联网时序数据,基于 Tablestore 时序模型实现了海量车身数据、事件数据低成本存储,并使用 Tablestore SQL 实现了对单台、多台车辆的查询与分析。

如果对本文章的架构感兴趣或有意向了解更多物联网中的数据存储场景解决方案,欢迎关注“物联网存储 IoTstore”微信公众号。同时可加入钉钉群(44327024) - “物联网存储 IoTstore 开发者交流群”,群内提供免费的在线专家服务,或扫描下方二维码加入。

相关实践学习
钉钉群中如何接收IoT温控器数据告警通知
本实验主要介绍如何将温控器设备以MQTT协议接入IoT物联网平台,通过云产品流转到函数计算FC,调用钉钉群机器人API,实时推送温湿度消息到钉钉群。
阿里云AIoT物联网开发实战
本课程将由物联网专家带你熟悉阿里云AIoT物联网领域全套云产品,7天轻松搭建基于Arduino的端到端物联网场景应用。 开始学习前,请先开通下方两个云产品,让学习更流畅: IoT物联网平台:https://iot.console.aliyun.com/ LinkWAN物联网络管理平台:https://linkwan.console.aliyun.com/service-open
目录
打赏
0
17
15
1
6
分享
相关文章
深度学习入门:从理论到实践新技术趋势与应用:探讨新兴技术如区块链、物联网、虚拟现实等的发展趋势和应用场景
【8月更文挑战第30天】本文将介绍深度学习的基本原理和实践应用。我们将从深度学习的定义、历史和发展开始,然后深入探讨其工作原理和关键技术。接着,我们将通过一个简单的代码示例来展示如何实现深度学习模型。最后,我们将讨论深度学习在现实世界中的应用和挑战。无论你是初学者还是有经验的开发者,这篇文章都将为你提供深度学习的全面理解。
边缘计算在物联网中的实践与挑战
边缘计算在物联网中的实践与挑战
未来已来:探索区块链、物联网与虚拟现实技术的融合趋势与实践应用
【10月更文挑战第34天】随着科技的迅猛发展,新兴技术如区块链、物联网(IoT)和虚拟现实(VR)正逐步渗透到我们的生活中,不仅改变着我们的生活方式,还在重塑全球的经济结构。本文将深入探讨这些技术的发展现状、相互之间的融合趋势以及在实际应用中的创新场景。我们将通过具体案例分析,揭示这些技术如何共同作用,推动社会向更加智能、互联的方向发展。
70 3
智能物联网平台:Azure IoT Hub在设备管理中的实践
【10月更文挑战第26天】随着物联网技术的发展,Azure IoT Hub成为企业管理和连接数百万台设备的强大平台。本文介绍Azure IoT Hub的设备管理功能,包括设备注册、设备孪生、直接方法和监控诊断,并通过示例代码展示其应用。
98 4
新技术浪潮下的探索与实践:区块链技术、物联网、虚拟现实的融合与创新
【10月更文挑战第6天】本文旨在探讨新兴技术——区块链、物联网、虚拟现实在现代科技革命中的发展趋势及其应用场景。通过分析这些技术的基本原理和相互作用,我们揭示了它们如何共同塑造未来社会的面貌。文章将深入讨论这些技术带来的挑战与机遇,并提出相应的应对策略。
37 7
PolarDB在物联网(IoT)数据存储中的应用探索
【9月更文挑战第6天】随着物联网技术的发展,海量设备数据对实时存储和处理提出了更高要求。传统数据库在扩展性、性能及实时性方面面临挑战。阿里云推出的PolarDB具备高性能、高可靠及高扩展性特点,能有效应对这些挑战。它采用分布式存储架构,支持多副本写入优化、并行查询等技术,确保数据实时写入与查询;多副本存储架构和数据持久化存储机制保证了数据安全;支持动态调整数据库规模,适应设备和数据增长。通过API或SDK接入IoT设备,实现数据实时写入、分布式存储与高效查询,展现出在IoT数据存储领域的巨大潜力。
98 1
大数据及AI典型场景实践问题之通过KafKa+OTS+MaxCompute完成物联网系统技术重构如何解决
大数据及AI典型场景实践问题之通过KafKa+OTS+MaxCompute完成物联网系统技术重构如何解决
政府在推动物联网技术标准和规范的统一方面可以发挥哪些作用?
政府在推动物联网技术标准和规范的统一方面可以发挥哪些作用?
120 50
制定统一的物联网技术标准和规范的难点有哪些?
制定统一的物联网技术标准和规范的难点有哪些?
78 2
探索未来技术潮流:区块链、物联网、虚拟现实的融合与创新
【10月更文挑战第41天】随着科技的不断进步,新技术如区块链、物联网、虚拟现实等正在逐步渗透到我们的日常生活中。本文将深入探讨这些技术的发展趋势和应用场景,以及它们如何相互融合,共同推动社会的进步。我们将通过具体的代码示例,展示这些技术在实际应用中的潜力和价值。无论你是科技爱好者,还是对未来充满好奇的探索者,这篇文章都将为你打开一扇通往未来的窗口。
111 56

物联网

+关注

热门文章

最新文章

相关产品

  • 物联网平台
  • AI助理

    你好,我是AI助理

    可以解答问题、推荐解决方案等