如何解决IoT数据的存储计算的实践案例

简介: 物联网数据往往来自于智能设备或者传感器设备,这些设备只要运行中,将持续不断产生设备数据。同时这些数据的使用价值根据场景千差万别,其中时效性对不同场景有很大影响,如何解决好存储和计算是物联网数字化场景的关键问题。

背景说明

物联网数据往往来自于智能设备或者传感器设备,这些设备只要运行中,将持续不断产生设备数据。同时这些数据的使用价值根据场景千差万别,其中时效性对不同场景有很大影响,大致场景如下:

1)设备监控运维场景下,超过小时周期的数据参考价值就很小了,并且往往需要秒级处理要求;

2)在线业务场景下,应用系统需要使用一定周期的数据,比如7天,进行事务型应用场景,并且往往需要分钟级处理要求;

3)经营统计分析场景下,往往需要保持1~2年的数据周期,并且往往按小时或按天出计算结果;

4)基于人工智能的分析场景下,设备全周期的数据是AI模型的基础,并且处理要求跟业务场景各不相同。

客户面临的挑战

在不同的数据生命周期中,客户需要采用不同的技术方案去存储和计算这些数据,在面对着不同的业务场景,以下是较为典型的选型模式:

1)在设备监控运维场景下,数据存储在MQ等流数据存储产品中,并使用Flink等流计算框架进行计算;

2)在事务型在线业务场景下,数据存储在OTS、TSDB等在线数据库进行存储和计算;

3)在统计分析场景下,数据存储在MaxCompute、Hadoop等大数据仓库中,使用Spark或Python进行计算;

4)在人工智能的应用场景下,往往与大数据仓库组合使用,比如在dataworks上使用PAI,Hadoop上使用Spark ML等。

当客户在面对几种或全部这些存储计算场景时,需要采用不同的技术方案选择和使用,面临的主要挑战:

1)数据链路和架构过于复杂,技术方案选型眼花缭乱;

2)在不同产品间同步和存储数据,往往存在数据冗余和一致性风险;

3)不同生命周期的数据存储难以规划使用费用较优的存储方案。

我们的解决方案

针对这些共性的问题的抽象和思考,阿里云IoT平台逐步建设了一套物联网数据存储、计算的方案。

平台提供了IoT数据存储服务,包括数据分层存储,并且在数据存储上提供数据导出、变更通知订阅、及连接大数据产品的组件等必要的存储相关服务。同时也建设了计算组件供快捷处理IoT数据,主要包括实时数据处理、交互式分析及离线计算。

分层存储

简单算一笔账,现在平台某家摩托车厂商客户每天产生约20GB数据,按5年时间大概产生36TB数据。使用在线数据库产品大概年费用在30万~50万不等,采用IoT平台归档存储年费用不到2万元。

如果客户需要分析数据,可以从归档存储中取回数据,假设取回全部21TB数据年费用差不多8万元。当然更合理的方式是按照数据使用情况来规划备份生命周期和存储类型,同时切分一个归档存储和标准存储的时间范围,以达到成本较优存储方案,如下示意存储规划:

image.png

计算模式

实时计算

为了满足物联网实时计算场景,平台提供了实时数据解析模块,基本情况如下:

image.png

支持的详细功能项如下表:

image.png

官网地址:https://help.aliyun.com/document_detail/307080.html

交互查询

为了满足数据洞察分析,提供一个SQL工作台,可以直接在工作台上编写任意SQL脚本分析观察数据。

image.png

另外满足物联网场景,在工作台上开箱即用IoT数据,包括数据如下表:

image.png

官网地址:https://help.aliyun.com/document_detail/325548.html

离线统计分析

SQL工作台编写的脚步完成了数据分析洞察,可以配置小时、日调度,系统会定时产出SQL脚本的分析洞察结果。

image.png

官网地址:https://help.aliyun.com/document_detail/468676.html

人工智能分析

针对于特定场景,平台内置了人工智能算法模型,这些模型原生对接存储的数据,大限度降低算法的使用门槛。

官网地址:https://help.aliyun.com/document_detail/410542.html

数据获取

分析后数据如何被获取?平台提供了多种方式:

免费报表

为了临时看数,我们提供了免费的可视化报表,使用介绍如下:https://help.aliyun.com/document_detail/188673.html

云云对接

在业务系统使用这些数据,我们提供了data api,使用介绍如下:https://help.aliyun.com/document_detail/253890.html

数据集成

被企业数仓(Dataworks)集成走,我们提供了iot reader,使用介绍如下:

https://help.aliyun.com/document_detail/2244394.html

csv导出

另外我们提供数据本地导出功能,可以按照时间段导出成csv文件。使用介绍如下:https://help.aliyun.com/document_detail/464055.html

image.png

相关链接

产品免费使用(可以领取企业实力1个月):https://free.aliyun.com/?product=9602820&spm=5176.28055625.J_5831864660.8.6ee6154aqJejSH&scm=20140722.M_9553144.P_154.MO_1802-ID_9553144-MID_9553144-CID_20080-ST_7663-V_1

相关实践学习
钉钉群中如何接收IoT温控器数据告警通知
本实验主要介绍如何将温控器设备以MQTT协议接入IoT物联网平台,通过云产品流转到函数计算FC,调用钉钉群机器人API,实时推送温湿度消息到钉钉群。
阿里云AIoT物联网开发实战
本课程将由物联网专家带你熟悉阿里云AIoT物联网领域全套云产品,7天轻松搭建基于Arduino的端到端物联网场景应用。 开始学习前,请先开通下方两个云产品,让学习更流畅: IoT物联网平台:https://iot.console.aliyun.com/ LinkWAN物联网络管理平台:https://linkwan.console.aliyun.com/service-open
相关文章
|
3月前
|
物联网 数据管理 Apache
拥抱IoT浪潮,Apache IoTDB如何成为你的智能数据守护者?解锁物联网新纪元的数据管理秘籍!
【8月更文挑战第22天】随着物联网技术的发展,数据量激增对数据库提出新挑战。Apache IoTDB凭借其面向时间序列数据的设计,在IoT领域脱颖而出。相较于传统数据库,IoTDB采用树形数据模型高效管理实时数据,具备轻量级结构与高并发能力,并集成Hadoop/Spark支持复杂分析。在智能城市等场景下,IoTDB能处理如交通流量等数据,为决策提供支持。IoTDB还提供InfluxDB协议适配器简化迁移过程,并支持细致的权限管理确保数据安全。综上所述,IoTDB在IoT数据管理中展现出巨大潜力与竞争力。
106 1
|
消息中间件 传感器 监控
IoT企业物联网平台,数据服务开发实战
IoT企业物联网平台开发实战
431 0
|
17天前
|
存储 JSON 运维
智能物联网平台:Azure IoT Hub在设备管理中的实践
【10月更文挑战第26天】随着物联网技术的发展,Azure IoT Hub成为企业管理和连接数百万台设备的强大平台。本文介绍Azure IoT Hub的设备管理功能,包括设备注册、设备孪生、直接方法和监控诊断,并通过示例代码展示其应用。
21 4
|
3月前
|
存储 分布式计算 物联网
Apache IoTDB进行IoT相关开发实践
当今社会,物联网技术的发展带来了许多繁琐的挑战,尤其是在数据库管理系统领域,比如实时整合海量数据、处理流中的事件以及处理数据的安全性。例如,应用于智能城市的基于物联网的交通传感器可以实时生成大量的交通数据。据估计,未来5年,物联网设备的数量将达数万亿。物联网产生大量的数据,包括流数据、时间序列数据、RFID数据、传感数据等。要有效地管理这些数据,就需要使用数据库。数据库在充分处理物联网数据方面扮演着非常重要的角色。因此,适当的数据库与适当的平台同等重要。由于物联网在世界上不同的环境中运行,选择合适的数据库变得非常重要。 原创文字,IoTDB 社区可进行使用与传播 一、什么是IoTDB 我
175 9
Apache IoTDB进行IoT相关开发实践
|
3月前
|
存储 传感器 监控
理解并利用物联网(IoT)数据的技术探索
【8月更文挑战第11天】物联网数据是数字化转型的重要资源。通过深入理解物联网数据的特性和价值,并采取有效的收集、处理和分析策略,我们可以更好地利用这些数据为企业决策提供支持、优化运营效率、创造新的商业模式并推动数字化转型的深入发展。
|
4月前
|
存储 分布式计算 物联网
Apache IoTDB进行IoT相关开发实践
IoTDB是专为物联网(IoT)设计的开源时间序列数据库,提供数据收集、存储、管理和分析。它支持高效的数据写入、查询,适用于处理大规模物联网数据,包括流数据、时间序列等。IoTDB采用轻量级架构,可与Hadoop和Spark集成,支持多种存储策略,确保数据安全和高可用性。此外,它还具有InfluxDB协议适配器,允许无缝迁移和兼容InfluxDB的API和查询语法,简化物联网项目的数据管理。随着物联网设备数量的快速增长,选择适合的数据库如IoTDB对于数据管理和分析至关重要。
246 12
|
4月前
|
存储 分布式计算 物联网
Apache IoTDB进行IoT相关开发实践
The article introduces IoTDB, an open-source time-series database designed for efficient management of IoT-generated data. It addresses challenges like real-time integration of massive datasets and security. IoTDB supports high-performance storage,
142 0
Apache IoTDB进行IoT相关开发实践
|
4月前
|
分布式计算 NoSQL 物联网
麻省理工IOT教授撰写的1058页Python程序设计人工智能实践手册!
Python是世界上最流行的语言之一,也是编程语言中使用人数增长最快的一种。 开发者经常会很快地发现自己喜欢Python。他们会欣赏Python的表达力、可读性、简洁性和交互性,也会喜欢开源软件开发环境,这个开源环境正在为广泛的应用领域提供快速增长的可重用软件基础。 几十年来,一些趋势已经强有力地显现出来。计算机硬件已经迅速变得更快、更便宜、更小;互联网带宽已经迅速变得越来越大,同时也越来越便宜;优质的计算机软件已经变得越来越丰富,并且通过“开源”方式免费或几乎免费;很快,“物联网”将连接数以百亿计的各种可想象的设备。这将导致以快速增长的速度和数量生成大量数据。 在今天的计算技术中,最新的创新
|
4月前
|
分布式计算 NoSQL 物联网
麻省理工IOT教授撰写的1058页Python程序设计人工智能实践手册!
Python是世界上最流行的语言之一,也是编程语言中使用人数增长最快的一种。 开发者经常会很快地发现自己喜欢Python。他们会欣赏Python的表达力、可读性、简洁性和交互性,也会喜欢开源软件开发环境,这个开源环境正在为广泛的应用领域提供快速增长的可重用软件基础。
|
5月前
|
存储 分布式计算 物联网
Apache IoTDB进行IoT相关开发实践
IoTDB是面向物联网的时序数据库,专注于时间序列数据管理,提供高效的数据处理、集成Hadoop和Spark生态、支持多目录存储策略。它还具有InfluxDB协议适配器,允许无缝迁移原本使用InfluxDB的业务。文章讨论了IoTDB的体系结构,包括数据文件、系统文件和预写日志文件的存储策略,并介绍了如何配置数据存储目录。此外,还提及了InfluxDB版本和查询语法的支持情况。IoTDB在物联网数据管理和分析中扮演关键角色,尤其适合处理大规模实时数据。