如何打造数据治理闭环?以金融行业为例 by彭文华

简介: 如何打造数据治理闭环?以金融行业为例 by彭文华

这是彭文华的第155篇原创

最近总有好玩的事情。刚搞定一个交通行业大数据项目的咨询工作,又来一个保险行业数据治理的咨询业务。我一开始还很忐忑,怕跨行业了,经验就不好使了。结果发现,保险行业数据治理也还是那一套么。同时感慨,还是这种公司重视数据啊,这项目做的太舒服了!

今天就给大家分享一下保险行业数据治理项目心得,我觉得这个行业的数据治理可以作为标杆了。

另外,我在挑战春节不打烊,每天都分享原创文章,欢迎加我个人微信:shirenpengwh,加入催更群。


保险客户数据治理背景

保险行业乃至于整个金融业,对数据价值的感知是最早、也最完整的。因此,他们对数据治理的需求是非常旺盛的。这是行业属性使然,当然也有保监会的政策要求。

保险客户数据是保险行业非常重要的数据资源,很多保险险种的精算,都是以客户为基础,加上其他各种乱七八糟的数据一起算好的。


所以,保险客户数据的治理背景基本上可以分成三类:

1、业务需要

2、数据管理需要

3、政策需要


业务需要很容易理解,辛辛苦苦收集上来的客户基本信息都填错了,联系不上人了,这保险买给谁啊?收上来的数据越全、越精准,我们就可以“分级分群定优客”,按互联网的话来说,就是做客户分层,精准营销,最终保业绩,拿年终啊!


数据管理需要也能理解,毕竟各种后续的数据分析、精算都是以客户数据为依托的么。客户数据都错了,那分析结果肯定有偏差啊。


政策需要就不用多解释了吧?保监会的话,谁能不听啊?


保险客户数据治理的目的也很简单,就是提升客户关键信息的真实性。一般来说就是三要素:身份证号、客户姓名、客户手机号码。


保险行业数据问题分析

虽然保险行业非常重视数据,但是多年保险业务的快速发展,的确也带来了非常多的数据问题。

各地分公司基本都是各自为政,谁都把客户当自己的命根子。业务员那边就更是了,甚至还有人故意隐藏真实客户数据,就是怕别人抢走自己的客户。

这就出现了一个非常搞笑的场景:业绩都完成,保费蹭蹭涨,可就是客户电话一个都打不通,打通了也不是本人,是本人也不一定是真人。我就亲眼见过一个保险代理人让她朋友照着信息读,回答对面的电话,也不知道是帮忙干啥。

所以啊,上到组织层面,下到业务执行层面,都有不同层级的数据准确性的阻碍。你说这数据能好的了么?

说起来,这保险行业的情况,跟二手房的情况简直是一模一样的!政府也一样呼吁“真房源”的好多年,市场上也没解决,最后还是贝壳搞定的。我觉得某个保险公司也得向贝壳的ACN规则学习一下,没准能颠覆保险行业,成为保险巨头呢。


保险客户数据治理流程

基本上各个行业的数据治理的流程也就长这样:

当然,上面是实操版,在执行的时候,当然还得按照项目管理的逻辑,先得做整体计划,定岗定人定则,颁布数据治理管理办法。中途还得不断的监督、控制,还得设定几个里程碑,保证按时按质按量完成任务。不过那些都是项目管理的事情,这里就不赘述了。


数据治理的前两步肯定是数据收集、数据处理及分析。这两步基本上都是数据工程师在干活。


数据收集其实就是把平台、Call Center、CRM、各业务系统(承保、理赔、农险等)、投诉系统等各个系统中的客户数据全部拿过来。

数据处理其实就是做客户的归并,用技术进行数据治理。把能技术能清洗、匹配上的数据给弄好,比如去掉手机号码的+86、客户名字中间的空格啥的。然后设定各种规则进行有效性判定,比如:三要素数据缺失、不规范、验真为假。


真正到了数据治理的环节,一般来说,都会分成两部分去处理:

1、存量客户数据清洗;

2、增量客户数据质量控制。


对付存量客户数据,组织层面,需要集团进行全面的数据质量核查,并把结果分发到各地分公司。各地分公司拿到问题数据清单,基本上就得分析问题原因构成,根据不同因素,制定清理方案。

如果是技术能解决的,那还好说。技术解决不了的,就安排业务员进行存量数据清理工作。总之就是各个分公司,根据问题数据清单,对照数据质量整改标准和任务量,各自安排数据清理工作。因为技术规则已经清晰过一遍了,这部分基本都得靠人工清洗。这个工作量可想而知,是最费劲的,最耗人工的。


对于增量客户数据,相对来说还好办一些。让下面严格执行就可以了。保险毕竟是一个客户数据收集的强控场景,毕竟跟个人的钱息息相关。

严格执行的方法其实也好控制,反正保险公司会在销售、承保、理赔、咨询、服务等很多环节跟客户接触,每个环节都跟客户重复询问和核对信息就好了。

业务员重新确认好客户数据之后,客户资源系统这边就得开始动起来了,根据最新的客户数据,反复比对,确认无误后,更新客户数据,做数据补齐、数据归并等处理。这客户数据有效性不就一点点的上去了么?


业务员那边正在人工清洗数据呢,我们这边也别闲着,各种监控得弄上啊!监控大屏要摆上领导桌面,发领到手机上;各种监控日报、周报、月报都得设计好,定期分发下去;各种分公司数据有效性排行榜都得安排上。这效率,嗷呜的一下就上去了!

扯个题外话,有些人说,数据分析没啥用的,看不到实际价值。不是说数据换成钱就是价值啊。有些时候,一张排行榜就能成倍的提升效率,这不是价值么?

除了数据驱动,其实还得靠组织驱动。所以还会组建督导小组,一方面进行进度监控,另一方面对问题比较严重的分公司进行监督指导,辅助他们做好数据治理工作。


当然啊,KPI驱动也是很重要的。最后的成效指标也得放出来,形成最终的数据治理的闭环。一般来说,以客户真实率、验真为真客户续保率两个指标为最终成效指标。

最后的最后,好歹得给人颁个奖吧,辛辛苦苦干了大半年了。这一点其实还是很重要的,要不下次谁还有积极性啊!


总结

数据治理是一个老生常谈的话题。数据治理最难的事情就是如何推动组织重视、执行这件事情。但是这个事情在保险行业有天然的推动力(政策、价值),同时也有天然的阻力(个人利益与组织利益的冲突)。


保险行业数据治理工作流程与其他行业的数据治理流程大致相仿,都是先收集数据,再用技术进行清洗、归并。这部分其实可以用之前提到的One ID的方法,效率会很高。

技术处理完之后,剩下的无效客户数据就得交给人工处理了。总部做好数据质量分析、过程监控、督导的工作,各个分公司彻底贯彻执行。利用KPI、排行榜等各种方法和手段,驱动所有人共同达成数据治理的目的。

数据更新完之后,系统再去做一次客户判别和数据归并,这样数据质量就会不断的提升。


个人理解,数据治理最难的部分不是技术,而是如何调动整个组织的力量一起来做。其实技术在这里能做的事情很少,绝大多数时候需要业务、人事等各个部门的共同努力。我之前在做政府行业数据治理的时候也比较轻松,但是在互联网公司里就非常困难。后来总结了一下,无非也就是组织驱动力这个原因导致的。


今天的分享就是这样。欢迎大家加我个人微信号:shirenpengwh ,一起探讨大数据、数据分析相关知识。每天分享一篇原创内容给大家,我们一起学习,共同进步。

相关文章
|
弹性计算 关系型数据库 数据库
搭建PostgreSQL主从架构
PostgreSQL是一个关系型数据库管理系统(RDBMS),支持NoSQL数据类型(JSON/XML/hstore)。本教程介绍如何在两台CentOS 7操作系统的ECS实例上搭建PostgreSQL主从架构。
|
5月前
|
传感器 存储 Java
Android 3D效果的实现
本文详细讲解了如何在Android中实现3D效果,基于官方Demo并结合实际需求进行调整。通过传感器(Sensor)获取设备旋转数据,利用OpenGL ES绘制3D立方体,实现了动态旋转的视觉效果。文章分为需求分析、效果展示、实现步骤及源码解析,涵盖传感器注册与注销、OpenGL核心方法使用等内容,适合初学者学习参考。文末附完整代码,便于实践操作。
158 0
Android 3D效果的实现
|
存储 安全 Java
隐私保护与数据安全:FunAudioLLM的安全性设计
【8月更文第28天】随着人工智能技术的普及,隐私保护和数据安全变得尤为重要。FunAudioLLM(虚构名称)是一款专注于语音合成的软件库,它不仅提供高质量的语音合成服务,还非常重视用户的隐私和数据安全。本文将详细介绍FunAudioLLM如何确保用户数据的安全性和隐私保护,并通过具体的代码示例展示如何使用该引擎时实施最佳实践。
311 0
|
10月前
|
人工智能 PyTorch 算法框架/工具
【AI系统】动手实现 PyTorch 微分
本文介绍了使用操作符重载(OO)编程方式实现的自动微分,特别是采用反向模式(Reverse Mode)的实现方法。文中详细解释了操作符重载的基本概念及其在自动微分中的应用,以及反向模式的工作原理。通过 Python 示例代码,演示了如何手动实现类似 PyTorch 中自动微分的核心机制,包括定义 `Variable` 类、`Tape` 结构以及实现基本的数学运算符重载。最后,通过一个具体的数学函数示例展示了如何利用上述机制计算梯度,帮助读者理解反向模式自动微分的全过程。
202 1
【AI系统】动手实现 PyTorch 微分
|
12月前
|
存储 数据管理 调度
HarmonyOS架构理解:揭开鸿蒙系统的神秘面纱
【10月更文挑战第21天】华为的鸿蒙系统(HarmonyOS)以其独特的分布式架构备受关注。该架构包括分布式软总线、分布式数据管理和分布式任务调度。分布式软总线实现设备间的无缝连接;分布式数据管理支持跨设备数据共享;分布式任务调度则实现跨设备任务协同。这些特性为开发者提供了强大的工具,助力智能设备的未来发展。
557 1
|
开发框架 .NET Linux
ASP.NET Core部署到linux(CentOS)
ASP.NET Core部署到linux(CentOS)
669 0
ASP.NET Core部署到linux(CentOS)
|
SQL Java 应用服务中间件
Apache Doris 自定义C++ UDF之流程详解(1)
Apache Doris 自定义C++ UDF之流程详解(1)
477 0
|
移动开发 前端开发 架构师
前端架构师需要具备什么能力以及代码能力?
【7月更文挑战第17天】 前端架构师是技术、领导与管理的融合,需精通HTML/CSS/JS及React/Vue等框架,擅长工程化、跨平台开发与安全。他们设计高效架构,优化性能,领导团队,做技术选型,并持续学习分享,确保代码质量和团队成长。
586 7
|
机器学习/深度学习 缓存 自然语言处理
从头开始构建 Transformer: 注意力机制
从头开始构建 Transformer: 注意力机制
|
芯片
灌电流与拉电流的含义及电路解析
上拉电阻是用来解决总线驱动能力不足时提供电流的,一般说法是拉电流。下拉电阻是用来吸收电流的,也就是灌电流。在数字电路中,拉电流和灌电流是衡量电路输出驱动能力(注意:拉、灌都是对输出端而言的,所以是驱动能力)的参数。 在集成电路中,拉电流输出和灌电流输出是一个很重要的概念。 一、什么是拉电流 由于数字电路的输出只有高、低(0,1)两种电平值,高电平输出时,一般是输出端对负载提供电流,其提供电流的数值叫“拉电流”。例如在使用反向器作输出显示时,当输出端为高电平时才符合发光二极管正向连接的要求,但这种拉电流输出对于反向器只能输出零点几毫安的电流用这种方法想驱动二极管发光是不合理的(因发光二极管
466 2