4月9日,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》公布。「数据」首次作为一种新型生产要素写入中央文件中,与土地、劳动力、资本、技术等传统要素并列为要素之一。
于企业经营成长,于政府服务治理,于社会建设发展,「数据是核心资产」都已成为共识。
而在实践场景中,海量的数据则如同不断涌出的原油,必须经过提炼、加工才能转化成汽油、机油为引擎所用。
5月6日,数据中台建设实战系列课程「数智加速度」第5课,奇点云数据产品专家星魁带来分享《企业数据资产管理方法论》,解答关于数据资产的那些事儿,例如:如何把数据变为数据资产,如何管理、评估数据资产,数据资产化给企业带来的变化等。
星魁,奇点云合伙人、数据产品专家,原阿里巴巴数据产品专家、原阿里巴巴双11媒体大屏负责人、原阿里巴巴数据小站产品创始人。
下文为分享节选:
01 什么是「业务数据化」?
业务数据化是企业数字化转型的第一步,也是数据资产化的前提。
一般来说,业务数据化有三个环节:
1、业务系统化
梳理业务,用系统去承载业务环节,例如会员系统、订单系统、商品系统等,如果没有那就需要构建新系统,实现把数据存下来。
2、信息结构化
在业务系统化的过程中会发现,有很多数据是非结构化的,例如摄像头录下的视频数据、店内陈列的照片数据等。我们需要通过视觉算法等方式,将非结构化的视图声数据转为可分析的结构化数据。
3、数据集中化
很多企业的数据是分散在各个部门的,尤其是大企业、传统企业,各个部门掌握一部分数据,互不流通,或有着很高的交换门槛,譬如2012年前的阿里巴巴,消费者数据分散在淘宝、天猫、聚划算等。而数据作为新型生产要素,只有流动、分享、加工处理才能创造价值(国务院发展研究中心创新发展研究部研究员吕薇,2020)。企业需要统筹分散割裂在各个单元,才能看到数据的全貌,更好地发挥「大数据」的价值。
有听众朋友提出:「为什么要集中?那为什么大企业都采用分布式呢?」这里的数据集中化不是指把所有数据存储在一个地方,而是指打通各单元之间的数据壁垒,由企业去统筹数据资产。而分布式其实是一种存储方式,并不与理念上的数据集中化矛盾。
02 什么是「数据资产」?
数据资产化是企业数字化转型的基石,是把数据原矿提纯为数据金子的必经之路。
那么为了完成从原矿到金子的转变,企业数据应该向什么方向发展以实现数据资产化?以消费者数据资产为例,我们有四个评价指标:
1、标签化
即能通过数据提炼出形象的标签,例如消费者的性别、品牌偏好等。这种标签是概括性的、易懂的,而非绝对值指标。
如果数据只能告诉我「这个消费者,昨天花了100多元钱,买了一只某品牌、草莓红的口红」,那不是标签化。需要将统计数据标签化,比如此消费者对口红的偏好是「中端、某品牌、草莓红」,才是标签化。
2、价值化
指已对原始数据进行了清洗、治理、提炼,转化为可衡量的数据,基于这个数据可推导转化为GMV。比如掌握了100万消费者资产,其中有1万是铁杆粉丝,每年复购3次,每次客单100元,那么单铁杆粉丝的价值就是1万3100元=300万元,其他的忠诚度不高的用户以此方法类推。
3、可应用
做数据看板算不算完成了数据资产化?不算。
数据不止是用来「看」的,而需要面向效果运营,最终可转化为服务并支持变现,为企业带来看得见的效益。例如,把消费者数据运用到广告投放中,提升广告的触达和转化;基于对消费者的偏好数据,对产品研发做下一步的升级等等。
4、可持续
这里指的是数据需要保持新鲜度,并源源不断地注入新的数据,是「活水」。
打个比方,短短一个月内,消费者的消费偏好就可能发生改变,譬如受到怀孕的影响,从偏好美妆类产品转为天然护肤类产品,开始关注孕妇养护和婴幼儿的产品。有的用户本来可能买东西前要看小红书,直播风起后,很快转为直播购物,购物习惯都发生了改变,流量渠道也会发生变化。
拿旧的消费者数据,一定不能指导现在的市场活动。
数据需要标签化、价值化、可持续、可应用,才是「数据资产」,才可以说企业真正拥有数据主权。
03 数据资产管理「五步骤」
从方法论上讲,企业管理数据资产要经历这5个步骤:
1、业务数据化
上文已经谈到,业务数据化是企业数字化转型的第一步,也是数据资产化的前提。
例如,零售企业需要围绕人、货、场,构建能落数据的业务系统,把物理世界的业务放到数字世界上,把数据攒起来,这是开采原始的金矿。
2、实体归一化
同实体,融通多源数据,从而发挥最大价值。
例如,在不同平台,同一用户可能有不同的id,积累了不同标签的数据,至少要打通一个手机号关联的数据,才能让用户形象更加丰满,从而去做有针对性的服务。在阿里的数据中台体系里,这方面叫OneID,对应的技术是ID-Mapping。
3、数据资产化
数据资产化在上文也谈到了,简单来说就是「把数据原矿提纯为数据金子」,把数据标签化、价值化,让数据可持续、可应用。
在这里,我们也需要注意一个问题,数据量越来越大,有些领域已经步入了指数级增长,不得不面对一笔不小的数据存储开支。降低成本,让数据成为资产并尽快发挥价值,成为企业必要的课题。
4、数据服务化
技术底层透明化,把数据提供给各个业务单元去调用,业务单元只需要从业务的角度出发使用数据服务,无需考虑底层数据技术。
5、数据业务化
数据一定要用起来,去服务业务,为企业带来降本增效。在这个过程中,数据中台(或企业的信息数据部门)也就实现了从成本中心到利润中心的转变。
04 数据资产管理「六要素」
在管理数据资产的过程中,有六大要素需要企业去重视:
1、标准体系
有一个平台某数据口径为A,另一个平台某数据口径为B,这个A和B指向同一个内容吗?那到底是以谁为准呢?正如秦始皇统一文字度量衡,统筹企业数据,标准化很重要。
具体来说,有数据同步标准、数据建模标准、数据规范定义、元数据标准、数据服务标准等五大类标准。
数据建模标准、数据规范定义的两大核心要点
2、健康体系
库里那么多数据,可能针对一个用户一个指标都有好几个不同数据,哪个数据是真实的呢?是否存在很多错漏数据呢?例如我们曾经遇到过,一个女鞋品牌里的消费者数据,曾经有一大串都是「男性」,后来发现是之前的运营人员「图方便」随便选择了一个值,这就影响到了数据的健康分。
我们从准确性、完整性、一致性、及时性等四大标准定义来理解数据资产的健康度。像给数据资产体检一样,通过对每一项检查,都有一个标准,建立健康体系,达标了100分,不达标扣分,最终可以得出一个数据资产总的健康分,去提醒数据运营管理人员不断地完善资产质量。
3、价值评估
100万的用户数据,到底是「值」一个亿还是两个亿?如何评估数据能为企业带来的价值?
我们从覆盖率、健康度、调用度、业务效果、业务依赖等五个角度,去评估数据资产的价值。
最直接可衡量价值的指标就是GMV,比如前面说到的消费者数据资产,掌握了多少消费者,就掌握了多少GMV资产。
4、资产ROI
上文我们也谈到了,存储数据成本不菲。在发挥数据价值的同时,也需要降低存储数据原矿石的成本。同样是这么多数据,有人投入100台机器,有人只需要投入10台机器,这就有了巨大的ROI差别。
数据资产不仅要衡量价值,也要衡量成本。在企业数智化转型的进程中,需要不断去权衡,做到价值与成本的平衡(资产价值>计算成本+存储成本+其他成本…),才可以称为合格的「数据资产」。
5、资产安全
数据既然成为资产,安全自然非常重要,包括数据安全(高危告警、数据脱敏、数据分级等)及系统安全(传输加密、防篡改、防入侵等)。
6、组织保障
还是这个老例子,对于人力资产,我们有HR体系去保障;对于物质资产,我们有财务、采购等部门去保障;那么对于DT时代极为核心的数据资产,组织保障自然不可缺失。
一方面,需要有数据平台团队(或请外部服务商支持配合)来完成一系列的数据工作,另一方面,也需要有一系列的规范机制去保障数据管理的正常运行。
罗马不是一天建成的。
我们可以为企业数据资产化描绘一张理想而完备的蓝图,但企业不可能一下子完成所有的进程;前面我谈到的五步骤、六要素,企业也很难快速做到「万事俱备,只欠东风」。不妨按照需求紧急程度、业务匹配度等划分为数期,逐步实施,「让车子先跑起来,边跑边换轮子」,把数据用起来,让企业更快看到数据的价值。
用起来,是企业管理数据资产的最佳启动方式。