背景
随着物联网应用场景的深入,企业开始进入挖掘设备上传的数据,用于客户端应用扩展后服务营收,同时也用于数字化运营、风控,帮助企业高效治理,和产品演进决策依据。
但是物联网数据上云后涉及到的大数据链路开发治理,以及产生的成本都是企业需要面临的挑战,本文以一个真实客户案例整理出的实践案例,介绍如何基于阿里云物联网平台数据服务产品能力搭建企业物联网大数据应用架构。
业务描述
案例企业有4个业务同时使用物联网数据:
① 企业信息部门需要分析 1年范围的设备时序数据,产出设备增长、活跃的企业经营指标;
② 业务部门需要查询近 3天左右,用于分析设备启停周期的业务应用;
③ 企业风控部门需要追踪设备近6个月的记录,用于事故追溯查询等。
④ 客户端客户设备中心,需要透出单设备统计指标,提供增值服务以增加客户使用粘性,和周边产品的运营销售。
老架构
基于以上业务场景,案例企业搭建的数据架构图如下:
1)为了满足①、②业务场景,从物联网配置云产品流转到OTS,并且向上兼容“信息部门”至少存储 1年时序数据。
2)为了满足③业务场景,增加一条云产品流转到Lindorm,用于服务风控业务。
3)统计指标在物联网平台调度生成后,通过Data API轮询同步到RDS,作为客户端查询使用。
存在的问题
主要面临3大挑战,
第一,整体数据架构复杂,数据链路多存在稳定性风险,增加管理和运维的难度和成本;
第二,JAVA应用轮询调用Data API,无法满足大规模数据同步的性能要求;
第三,产生不必要的中间存储成本,企业信息部门无需实时分析时序数据,但是为了兼容业务需要额外多存储了362天的数据。
新架构
物联网平台作为企业设备上云的基础设施,看到了这个共性场景。推出了IoTDataSource产品模块,目前已经发布了Dataworks版本(iot reader),企业可以在Dataworks配置集成任务直接从物联网平台集成数据到企业数仓。
IoTDataSource Flink版本正在规划开发
案例企业新架构如上图,在满足4个业务场景需求的同时,主要改变是
1)按需配置云产品流转OTS的数据存储周期(3天过期);
2)物联网数据直接配置Dataworks集成任务,一份时序数据用于“信息部分”分析使用,同时配置数据同步任务到Lindorm。
3)JAVA应用无需轮询调用物联网平台的Data API,直接集成入仓后同步到RDS指标库。
带来的好处
1)按需规划高性能存储时长,合理选择离线和实时业务所需存储,大大降低了整体数据存储成本。
存储成本计算公式:高性能存储空间(1年)*T1 元/TB/月 - (高性能存储空间(3天)*T1 元/TB/月 + 离线存储空间*T2 元/TB/月)
2)方便设备时序数据集成企业数仓,设备时序数据更容易融合业务维度分析,增加设备数值化的应用价值。
3)数据链路更简洁,合并4条数据链路为分析和事务两条链路,降低管理和运维的难度和成本。
后续规划
除了离线场景,实时更是物联网必须的场景应用。目前已经规划了IoTDataSource For Flink,大概6月底左右开放公测。
相关链接
数据集成:https://help.aliyun.com/document_detail/2244394.html
产品免费使用(可以领取企业实力1个月):https://free.aliyun.com/?product=9602820&spm=5176.28055625.J_5831864660.8.6ee6154aqJejSH&scm=20140722.M_9553144.P_154.MO_1802-ID_9553144-MID_9553144-CID_20080-ST_7663-V_1