截止到2021年年底,包括中国在内的国家和地区超过一半以上的新组装车辆都已配备了互联网接口。当前全球联网车数量已经超过了3亿辆,预计到2025年全球联网车辆则将突破10亿辆。作为全球车联网用户的重要组成部分中国车联网用户规模达到2000万人次,已经成为了全球车联网市场的主力军。随着大数据、云计算、AI等技术创新融合,将大大加快车联网市场深层次发展。
从车联网的整体规模来看,国内市场增速显著高于全球市场增速,并将成为全球最主要的市场。2016年的国内市场和2017年的国外市场规模分别约为77亿美元和1529亿美元,至2020年,国内外市场规模分别约为338亿美元和3062亿美元,年复合增长率约63.7%和21.3%,国内是国外的约3倍,至2025年,国内外市场规模分别约为2162亿美元和5506亿美元,年复合增长率约44.9%和12.5%,国内是国外的约3.6倍。综合盖世和埃森哲的预测,至2025年,国内市场将占全球市场的27%,成为全球最主要的市场。
在如此强大的背景之下,我们可以基于大数据、物联网等先进技术解决一些实际的问题,为用户和汽车生产厂商提供更加优越的感知和客观的效益。在实际的项目实施的过程当中也会遇到一些实际的难题,比如对于获取大型车企累计大量车辆相关数据,在传统模式数据存储和计算方式下,无法满足原始车辆数据高效存储、快速计算、智能推荐等需求,我们不得不部署一些终端设备用于收集车辆上报原始数据,在通过嵌入式代码解析为车远程服务提供商数据、充电站、充电柱、充电接口等数据、第三方数据等等,原始数据经过ETL转换存储到分布式文件系统中和菲关系型数据库中。
在PaaS和SaaS层,提供实时计算服务与离线计算服务,最终通过API接口提供数据查看,以报表和大屏展示分析结果数据,通过数据建模与机器学习算法,实现智能分析推荐。
项目部署架构:
CDH 是以一种可靠、高效、可伸缩的方式对大量数据进行分布式处理的软件框架。它适用于任何规模的非结构化数据,并具有极强的容错能力。
数据采集流程:
数据分析流程:
本项目由数据收集开始,将获取到的数据发送到kafka,然后由实时计算框架flink进行数据批处理,根据不同的需求将数据写入对应的业务数据库。
数据实时分析流程: