如何打造数据治理闭环?以金融行业为例 by彭文华

简介: 如何打造数据治理闭环?以金融行业为例 by彭文华

这是彭文华的第155篇原创

最近总有好玩的事情。刚搞定一个交通行业大数据项目的咨询工作,又来一个保险行业数据治理的咨询业务。我一开始还很忐忑,怕跨行业了,经验就不好使了。结果发现,保险行业数据治理也还是那一套么。同时感慨,还是这种公司重视数据啊,这项目做的太舒服了!

今天就给大家分享一下保险行业数据治理项目心得,我觉得这个行业的数据治理可以作为标杆了。

另外,我在挑战春节不打烊,每天都分享原创文章,欢迎加我个人微信:shirenpengwh,加入催更群。


保险客户数据治理背景

保险行业乃至于整个金融业,对数据价值的感知是最早、也最完整的。因此,他们对数据治理的需求是非常旺盛的。这是行业属性使然,当然也有保监会的政策要求。

保险客户数据是保险行业非常重要的数据资源,很多保险险种的精算,都是以客户为基础,加上其他各种乱七八糟的数据一起算好的。


所以,保险客户数据的治理背景基本上可以分成三类:

1、业务需要

2、数据管理需要

3、政策需要


业务需要很容易理解,辛辛苦苦收集上来的客户基本信息都填错了,联系不上人了,这保险买给谁啊?收上来的数据越全、越精准,我们就可以“分级分群定优客”,按互联网的话来说,就是做客户分层,精准营销,最终保业绩,拿年终啊!


数据管理需要也能理解,毕竟各种后续的数据分析、精算都是以客户数据为依托的么。客户数据都错了,那分析结果肯定有偏差啊。


政策需要就不用多解释了吧?保监会的话,谁能不听啊?


保险客户数据治理的目的也很简单,就是提升客户关键信息的真实性。一般来说就是三要素:身份证号、客户姓名、客户手机号码。


保险行业数据问题分析

虽然保险行业非常重视数据,但是多年保险业务的快速发展,的确也带来了非常多的数据问题。

各地分公司基本都是各自为政,谁都把客户当自己的命根子。业务员那边就更是了,甚至还有人故意隐藏真实客户数据,就是怕别人抢走自己的客户。

这就出现了一个非常搞笑的场景:业绩都完成,保费蹭蹭涨,可就是客户电话一个都打不通,打通了也不是本人,是本人也不一定是真人。我就亲眼见过一个保险代理人让她朋友照着信息读,回答对面的电话,也不知道是帮忙干啥。

所以啊,上到组织层面,下到业务执行层面,都有不同层级的数据准确性的阻碍。你说这数据能好的了么?

说起来,这保险行业的情况,跟二手房的情况简直是一模一样的!政府也一样呼吁“真房源”的好多年,市场上也没解决,最后还是贝壳搞定的。我觉得某个保险公司也得向贝壳的ACN规则学习一下,没准能颠覆保险行业,成为保险巨头呢。


保险客户数据治理流程

基本上各个行业的数据治理的流程也就长这样:

当然,上面是实操版,在执行的时候,当然还得按照项目管理的逻辑,先得做整体计划,定岗定人定则,颁布数据治理管理办法。中途还得不断的监督、控制,还得设定几个里程碑,保证按时按质按量完成任务。不过那些都是项目管理的事情,这里就不赘述了。


数据治理的前两步肯定是数据收集、数据处理及分析。这两步基本上都是数据工程师在干活。


数据收集其实就是把平台、Call Center、CRM、各业务系统(承保、理赔、农险等)、投诉系统等各个系统中的客户数据全部拿过来。

数据处理其实就是做客户的归并,用技术进行数据治理。把能技术能清洗、匹配上的数据给弄好,比如去掉手机号码的+86、客户名字中间的空格啥的。然后设定各种规则进行有效性判定,比如:三要素数据缺失、不规范、验真为假。


真正到了数据治理的环节,一般来说,都会分成两部分去处理:

1、存量客户数据清洗;

2、增量客户数据质量控制。


对付存量客户数据,组织层面,需要集团进行全面的数据质量核查,并把结果分发到各地分公司。各地分公司拿到问题数据清单,基本上就得分析问题原因构成,根据不同因素,制定清理方案。

如果是技术能解决的,那还好说。技术解决不了的,就安排业务员进行存量数据清理工作。总之就是各个分公司,根据问题数据清单,对照数据质量整改标准和任务量,各自安排数据清理工作。因为技术规则已经清晰过一遍了,这部分基本都得靠人工清洗。这个工作量可想而知,是最费劲的,最耗人工的。


对于增量客户数据,相对来说还好办一些。让下面严格执行就可以了。保险毕竟是一个客户数据收集的强控场景,毕竟跟个人的钱息息相关。

严格执行的方法其实也好控制,反正保险公司会在销售、承保、理赔、咨询、服务等很多环节跟客户接触,每个环节都跟客户重复询问和核对信息就好了。

业务员重新确认好客户数据之后,客户资源系统这边就得开始动起来了,根据最新的客户数据,反复比对,确认无误后,更新客户数据,做数据补齐、数据归并等处理。这客户数据有效性不就一点点的上去了么?


业务员那边正在人工清洗数据呢,我们这边也别闲着,各种监控得弄上啊!监控大屏要摆上领导桌面,发领到手机上;各种监控日报、周报、月报都得设计好,定期分发下去;各种分公司数据有效性排行榜都得安排上。这效率,嗷呜的一下就上去了!

扯个题外话,有些人说,数据分析没啥用的,看不到实际价值。不是说数据换成钱就是价值啊。有些时候,一张排行榜就能成倍的提升效率,这不是价值么?

除了数据驱动,其实还得靠组织驱动。所以还会组建督导小组,一方面进行进度监控,另一方面对问题比较严重的分公司进行监督指导,辅助他们做好数据治理工作。


当然啊,KPI驱动也是很重要的。最后的成效指标也得放出来,形成最终的数据治理的闭环。一般来说,以客户真实率、验真为真客户续保率两个指标为最终成效指标。

最后的最后,好歹得给人颁个奖吧,辛辛苦苦干了大半年了。这一点其实还是很重要的,要不下次谁还有积极性啊!


总结

数据治理是一个老生常谈的话题。数据治理最难的事情就是如何推动组织重视、执行这件事情。但是这个事情在保险行业有天然的推动力(政策、价值),同时也有天然的阻力(个人利益与组织利益的冲突)。


保险行业数据治理工作流程与其他行业的数据治理流程大致相仿,都是先收集数据,再用技术进行清洗、归并。这部分其实可以用之前提到的One ID的方法,效率会很高。

技术处理完之后,剩下的无效客户数据就得交给人工处理了。总部做好数据质量分析、过程监控、督导的工作,各个分公司彻底贯彻执行。利用KPI、排行榜等各种方法和手段,驱动所有人共同达成数据治理的目的。

数据更新完之后,系统再去做一次客户判别和数据归并,这样数据质量就会不断的提升。


个人理解,数据治理最难的部分不是技术,而是如何调动整个组织的力量一起来做。其实技术在这里能做的事情很少,绝大多数时候需要业务、人事等各个部门的共同努力。我之前在做政府行业数据治理的时候也比较轻松,但是在互联网公司里就非常困难。后来总结了一下,无非也就是组织驱动力这个原因导致的。


今天的分享就是这样。欢迎大家加我个人微信号:shirenpengwh ,一起探讨大数据、数据分析相关知识。每天分享一篇原创内容给大家,我们一起学习,共同进步。

相关文章
|
Web App开发 缓存 数据库
DMS产品常见问题之DMS数据规定失败如何解决
DMS(数据管理服务,Data Management Service)是阿里云提供的一种数据库管理和维护工具,它支持数据的查询、编辑、分析及安全管控;本汇总集中了DMS产品在实际使用中用户常遇到的问题及其相应的解答,目的是为使用者提供快速参考,帮助他们有效地解决在数据管理过程中所面临的挑战。
|
4月前
|
消息中间件 人工智能 Apache
Apache RocketMQ × AI:面向 Multi-Agent 的事件驱动架构
本文介绍基于Apache RocketMQ新特性构建异步化Multi-Agent系统的技术实践,涵盖Agent能力发现、语义化Topic、Lite-Topic动态回调等机制,实现任务闭环与高效协同,推动Agentic AI从静态流程迈向自主协作。
260 8
Apache RocketMQ × AI:面向 Multi-Agent 的事件驱动架构
|
10月前
|
传感器 存储 Java
Android 3D效果的实现
本文详细讲解了如何在Android中实现3D效果,基于官方Demo并结合实际需求进行调整。通过传感器(Sensor)获取设备旋转数据,利用OpenGL ES绘制3D立方体,实现了动态旋转的视觉效果。文章分为需求分析、效果展示、实现步骤及源码解析,涵盖传感器注册与注销、OpenGL核心方法使用等内容,适合初学者学习参考。文末附完整代码,便于实践操作。
309 0
Android 3D效果的实现
|
存储 Java Linux
【Zookeeper】基于3台linux虚拟机搭建zookeeper集群(二)
【Zookeeper】基于3台linux虚拟机搭建zookeeper集群
713 1
【Zookeeper】基于3台linux虚拟机搭建zookeeper集群(二)
|
人工智能 PyTorch 算法框架/工具
【AI系统】动手实现 PyTorch 微分
本文介绍了使用操作符重载(OO)编程方式实现的自动微分,特别是采用反向模式(Reverse Mode)的实现方法。文中详细解释了操作符重载的基本概念及其在自动微分中的应用,以及反向模式的工作原理。通过 Python 示例代码,演示了如何手动实现类似 PyTorch 中自动微分的核心机制,包括定义 `Variable` 类、`Tape` 结构以及实现基本的数学运算符重载。最后,通过一个具体的数学函数示例展示了如何利用上述机制计算梯度,帮助读者理解反向模式自动微分的全过程。
407 1
【AI系统】动手实现 PyTorch 微分
|
SQL Java 应用服务中间件
Apache Doris 自定义C++ UDF之流程详解(1)
Apache Doris 自定义C++ UDF之流程详解(1)
663 0
|
移动开发 前端开发 架构师
前端架构师需要具备什么能力以及代码能力?
【7月更文挑战第17天】 前端架构师是技术、领导与管理的融合,需精通HTML/CSS/JS及React/Vue等框架,擅长工程化、跨平台开发与安全。他们设计高效架构,优化性能,领导团队,做技术选型,并持续学习分享,确保代码质量和团队成长。
893 7
|
存储 Ubuntu Linux
在Linux中,如何配置和使用KVM?
在Linux中,如何配置和使用KVM?
|
机器学习/深度学习 缓存 自然语言处理
从头开始构建 Transformer: 注意力机制
从头开始构建 Transformer: 注意力机制
|
云安全 人工智能 监控
直播流量下,涌动的安全风险
针对直播前、直播中、直播账号和直播边界的有效防控,阿里云给出业内最佳安全实践。
3051 0
直播流量下,涌动的安全风险