浅谈车企如何点燃大数据

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

随着汽车市场逐步饱和,竞争加剧,车企希望通过拥抱大数据实现精细化经营,领先一步。但是大数据化的过程却并非一蹴而就,也不是简单大数据技术选择,更应该看成一个企业级系统工程,本文结合大数据项目实践和行业理解,着重阐述了如何系统看待大数据建设和关键问题解决思路。

背景

随着汽车普及不断深入,中国汽车市场逐渐饱和,增速放缓,迈入竞争运营阶段到。根据有关报告,2015年,占我国汽车产量98%的37家主要汽车企业形成整车产能3122万辆。其中乘用车产能2575万辆,产能利用率为81%;商用车产能547万辆,产能利用率仅为52%。同时随着近年大数据兴起,越来越多的车企也选择投身大数据潮流,希望通过拥抱大数据,提供更加精细化的业务运营,营销模式变化,乃至企业转型,提供自己运营竞争力。如国际顶级车企大众、宝马、奔驰、还是国内企业长城、吉利等都纷纷开启了自己大数据之路(图1)。

图1 车企大数据典型案例

图1 车企大数据典型案例

然而在大数据化过程中,车企却会发现过程并不是那么一帆风顺,在和车企交流中,往往能听到业务部门的抱怨:

数据质量怎么这么差,用户姓名一看就是随便输入的,手机号码居然只有9位

销量统计错了,把提车数统计到了实销数里了

你做的分析功能我们不需要,对了我们库存预测到底能不能做

…….

信息化部门却会觉得感觉到困惑

我们已经采用先进的大数据技术平台了,但是做些什么业务呢

我们哪里知道业务部门对应计算口径是什么,业务需求不清楚

你这个业务需求,我们没数。。。。

………..

由此如何构建一个高效大数据平台,这不仅仅是简单IT系统建设,更不是简单购买了大数据平台就是实现大数据分析。企业大数据化更应该是一个系统,而是贯穿了管理-业务-系统-数据,逐步规划,逐步建设,而不是一蹴而就。因此基于大数据思考、实践模式,联想总结出企业大数据建设框架(图2),针对其中关键问题提出思考和分析

图2.企业大数据建设框架

图2.企业大数据建设框架

大数据之“本”:多源之水,夯实数据仓库

对于成熟的车企要利用大数据产生价值,必然需要构建丰富的数据体系才 能发挥出大数据平台价值,否则将成为无源之水,无本之木。对于车企而言,通常需要围绕四个主要要素构建数据源才能满足整体业务需求:主机厂、渠道、客户、车。

那么车企的有哪些数据呢?通常大部分车企数据传统来源已经有了相对成熟生产系统体系,包括销售领域的分销商管理系统(DMS),经销商使用的CRM、客服中心(Call center)、生产管理系统,质量管理系统(QIS)等等,因此可以满足日常主机厂自身日常运营分析、产品分析以及对渠道运营分析,但是相比,仍然存在如下问题:

客户数据匮乏,相比电信、金融行业,车企行业客户触点过少,而是周期过长,无法构建多维的客户数据

产品质量数据往往通过售后服务反馈,进行被动故障分析排查,难度较高,无法缺少过程数据进行,更无法做到预测性故障分析;

客户信息传播行为发生变化,更多进行网络信息传播,因此通过传统销售系统、售后系统、客服系统相对被动无法满足快速获取信息的需求

因此为了发挥大数据的价值,就需要增加新的数据源,满足业务分析对数据多样化、化的需求

1) 车联网系统:

目前越来越多的主机厂考虑部署或者已经部署车联网系统,从大数据角度来说,通过车联网系统有效补充用户日常数据缺失,以ADAS系统为例,可以捕获如下数据:

用户驾驶行为数据:用户每次驾驶里程,转向习惯,行驶速度、是否有疲劳驾驶等,可以有效帮助客户画像数据构建

产品参数实时获取:不同零部件的关键运营指标,如转速、温度、电子指标等,从而为精细化产品质量预测和分析提供了基础

2) 网络舆情信息:

网络已经是用户信息传播的主要渠道,相比主机厂传统方式,网络信息会更早、更全面反映用户对主机厂的相关信息,通过部署自有网络爬虫系统或者购买第三方的SAAS服务,可以针对重点门户、知名行业网站、论坛、电商平台等

通过爬虫系统可以捕获网络新闻、论坛帖子、用户评论等网络信息

基于大数据技术处理,通过网络信息进行市场营销、品牌影响力、用户习惯、产品质量等分析,以品牌为例,可以完成品牌日常热度、口碑倾向等分析。

3) 第三方外部数据

行业性数据:通过乘联会等行业组织的数据引入,可以有效解决市场趋势分析的数据引入;

第三方用户标签数据:和第三方数据合作中,车企往往希望能得到用户级的数据交换,考虑到第三方数据匹配成功率不足的问题,这就需要车企构建:统一的用户标签体系和用户多ID体系;此外更为可行的做法是充分利用第三方的做好用户画像分析数据,优先完善用户群统计数据;

大数据之“智”:以终为始,业务驱动数据价值

业务需求驱动大数据方向,大数据的价值通过业务呈现。对于车企而言,大数据分析可以有效提供运营体系关键领域效率,主要包括三个方向(图3):商业敏捷运营,产品精准设计和制造领域智能化

图3 车企大数据应用方向

图3 车企大数据应用方向

那么面对不同业务场景,大数据分析如何展现自身作用,根据德勤咨询的大数据分析不同类型统计研究,可以看出在当前大数据应用下依次从三个层面进阶:统计分析、根因分析和预测性分析(图4)

统计应用分析作为基础分析能力,不仅仅为高级分析提供了数据基础,同时在业务层面覆盖面更广泛,而预测性分析则充分体现了大数据智能化能力,提供了业务精细化决策的手段。无论哪种分析能力其实都是业务需要的,关键在于如何和业务场景匹配。

图4 不同大数据分析类型

图4 不同大数据分析类型

以汽车售后环节的在保车辆理赔业务为例:在保车辆理赔是车企售后服务重要业务,对于出现配件故障在保车辆,车企需要支付相应的维修工时、配件费用等等,每个月车企花费的理赔费用通常都在几百万,乃至千万级别。

因此基于理赔业务理解,针对理赔业务关键场景,联想构建了大数据业务设计(图5)

图5 在保理赔分析

图5 在保理赔分析

1) 理赔视图:

对于车企需要能够监控整体理赔指标,及时发现整体理赔变化状况,从而及时采取应对策略。这就要求能够对理赔业务提供全局洞察,同时能够及时发现变化,通过理赔地图设计可以很好满足业务快速的洞察

对于理赔地图主要解决了统计分析和数据可视化的需求,重点需要实现如下功能:

定义出理赔业务的KPI体系:通常为理赔金额、单次理赔金额、理赔- – 对于理赔KPI各项指标提供趋势变化统计分析旧件数、理赔台次等,对于环比、同比等异动能够明确标识

提供地域下钻功能,从而实现业务不同层次探查;

提供地域、车型分布统计占比分析

2) 理赔诊断树

理赔业务不仅仅是售后服务,同时也为产品品质分析提供了基础,在整车中通常有几百件关键配件,如何快速发现那些旧件产生了理赔金额,这些旧件是否因为批次原因,还是因为超过一定里程原因?

通过围绕旧件种类、旧件类型、旧件批次、旧件使用里程等旧件特征构建出理赔旧件的分析结构树,可以用于分析理赔金额、件数进行分层结构探查,也就针对理赔同比或者环比剧烈变化时,进行异动探查,快速定位到导致异动的旧件因子。

3) 异常理赔预警

在保理赔中存在服务店,骗取配件、维修费用事件,过去由于,因此车企没有很好手段进行异常理赔的分析,只能通过服务店整体理赔数量和金额进行判断,随着车联网系统开始进入车辆预装,为异常理赔预测提供可能性。

通过已有故障配件和无故障配件的里程、行驶行为、受力、温度、湿度、电磁等环境参数采集,构建出配件故障概率模型,针对理赔配件通过历史数据回溯,计算出配件故障概率,从而作为是否异常理赔判断参考。

大数据之“准”:以规矩制方圆,构建数据管控体系

国内车企相对来信息化还没有进入精细化阶段,因此数据质量往往不高。以笔者参与的国内某车企大数据项目为例,就遇到如下情况

1) 业务系统缺少数据约束:经销商管理系统录入的用户身份证号码没有基本校验,用户手机号位数不全等;

2) 业务部门业务口径混乱:词汇定义随意,出现不同部门对同一个业务术语不同解释;车企使用术语和行业通用术语不一致;业务口径没有明确定义等;

结果调研了十多个业务部门,竟然有90%部门第一个意见就是数据质量差,无法进行有效用户分析,系统使用率和使用效率大打折扣。究其根源,就是企业没有建立数据管控体系,尤其以数据标准体系缺失为首要原因。

“没有规矩不成方圆”,只有数据标准体系的建立,才能够确立数据质量管理基础。构建数据标准体系需要包括三方面内容:

1) 数据标准体系

数据标准体系(图5)需要包含两层设计:

数据体系结构:数据体系结构设计应该和业务紧密相关,采用分层设计

数据的标准定义:需要数据来源、数据属性、业务定义、数据格式、数据宿主等关键信息

图6数据标准样例

2) 数据标准管理组织

数据标准体系结构随着业务的演进不断优化,而每个数据则必须找到唯一管理者,才能保证数据的唯一性解释,因此数据标准管理组织包括了两个关键角色:

数据标准体系规划团队:负责数据标准体系设计和优化,通常可以由信息化部门牵头。

数据owner:作为数据的拥有者,负责数据名称定义、业务口径、数据变更申请等工作,通常建议由业务部门负责;

3) 数据标准管理流程

大数据就像流动的水一样具有生命,不断流动,因此就需要围绕数据生命周期:建立-变更-退出建立数据管理流程

建立:重点确定数据拥有者,使用者以及业务定义

变更:重点说明变更申请原因,变更的内容、变更对其他数据影响;

退出:重点确定退出原因,对其他数据影响;

结束语

越来越多车企会重视大数据对运营带来的价值,构建自己的大数据平台。那么要想能够让大数据平台高效运作,这不仅仅单纯涉及到大数据技术方案,而是系统性工程,因此选择具有端到端的大数据解决方案能力的供应商将使车企的大数据之路事半功倍。


本文作者:联想大数据组

来源:51CTO

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
大数据
风剑分享“站在上帝视角看数据”,点燃企业大数据梦想与思潮
“2018年,在人工智能、区块链等概念的花式风口与泡沫之下,企业服务领域反以其针对B端企业的重实用性与宽“护城河”,正有条不紊的发展着。云服务、企业OA、协同SaaS产品、大数据服务等各种兼具敏捷性与实用性的产品层出不穷,企服产品的提效应用让许多企业摆脱了冗杂的工作流程,提升了业务效率,涌现而出的商业机会则成为了新经济突破口。
|
2月前
|
存储 机器学习/深度学习 分布式计算
大数据技术——解锁数据的力量,引领未来趋势
【10月更文挑战第5天】大数据技术——解锁数据的力量,引领未来趋势
|
1月前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
360 7
|
1月前
|
存储 分布式计算 大数据
大数据 优化数据读取
【11月更文挑战第4天】
53 2
|
1月前
|
数据采集 监控 数据管理
数据治理之道:大数据平台的搭建与数据质量管理
【10月更文挑战第26天】随着信息技术的发展,数据成为企业核心资源。本文探讨大数据平台的搭建与数据质量管理,包括选择合适架构、数据处理与分析能力、数据质量标准与监控机制、数据清洗与校验及元数据管理,为企业数据治理提供参考。
90 1
|
1月前
|
机器学习/深度学习 存储 大数据
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系,保留最大方差信息,实现数据压缩、去噪及可视化。本文详解PCA原理、步骤及其Python实现,探讨其在图像压缩、特征提取等领域的应用,并指出使用时的注意事项,旨在帮助读者掌握这一强大工具。
70 4
|
1月前
|
存储 大数据 数据管理
大数据分区简化数据维护
大数据分区简化数据维护
25 4
|
1月前
|
存储 大数据 定位技术
大数据 数据索引技术
【10月更文挑战第26天】
59 3
|
1月前
|
存储 大数据 OLAP
大数据数据分区技术
【10月更文挑战第26天】
71 2