阿里巴巴的数字化价值
数据中台的概念是阿里提出来的, 所以讲述数据中台的价值的时候,不可避免要把数据中台对于阿里的价值说清楚。我认为阿里巴巴首次把自己数字化能力展示出来的实践窗口是2015的双11大屏,而以前主要形式是年度的行业报告。大屏对于当时整个业务实时展现,把背后牵扯的数据处理能力展示的淋漓尽致。
阿里的核心电商业务,本身是完全数字化的。从进入淘宝的首页到搜关键字,找到具体的宝贝,加购,支付,后面的物流,所有的一切,全部是通过自己的信息化系统来完成了一整个的业务闭环,所以它本身是一个完全数字化的东西。
在这个过程当中,沉淀了大量的用户行为数据、商品交易数据、物流数据还有售后数据,基于这些数据,整个阿里内部的数据团队做了大量的针对于自己业务的数字赋能提升。
这些数据最大的价值,主要体现在三方面:首先是广告,即精准营销。阿里巴巴的千亿美元的市值,很多是建立在广告的基础上;另外一个是推荐,阿里GMV超过15%是由推荐系统直接带来的;最后是整个电商内部的交易安全。可以看到在阿里内部的整个数字化的场景,其实是跟互联网行业高度吻合的。因为互联网行业里面大数据的应用场景其实主要就是体现在广告,推荐和风控。这三大板块对阿里的商业帝国起到了至关重要的作用,除此之外,在内部则主要体现在精细化的数字化运营。
这里引发出一个思考:广告、推荐和风控的价值是数据中台的价值还是算法的价值?算法是否可以脱离中台直接产生价值? 中台的价值针对于这三个算法场景提供什么样的价值?
最初,淘系、天猫、聚划算都有自己独立的推荐团队,但现在是统一的团队。当初每一个团队基本上都是使用自己的基础数据,因为在公共层项目前用户数据、商品数据都不是打通的。
2013-2014年,阿里启动了数据公共层项目,这个项目的出发点是节省资源和统一基础数据。因为当时整个阿里云包括算法团队等各个团队,所用到的分析的集群已经远远超过了5000台,按照当时的规模,如果不做数据公共层这个项目的话,每年都要在新购资源上面花费1亿多。启动这个项目之后,让算法工程师的工作起点从数据源搬移到公共层之上,不用去处理庞大的基础数据信息的工作,以便快速交付算法场景。
接下来大家没想到的是,数据公共层这个项目越做越有价值。它不仅达到了最初的目的,还把整个公司集团的用户数据和商品数据做了一个统一的管理。
所以对于企业来讲,做数字化转型是首先思考的是应用场景,由此来思考针对场景是否需要一个统一的数据中台。砍树优先还是磨刀优先,这应该是每一个企业的决策人需要思考的问题,应该有自己的一套认知。
传统企业数字化的必要性和重要性
现在的传统企业数字化转型越来越迫切了,我个人觉得主要是因为互联网企业带来的压力,因为互联网企业是直接面向终端客户运营的。
1、互联网企业本身是数字化运营的,所以它具有更敏捷的业务转型能力和业务调整能力。
2、借助自己的流量的优势,不断对传统企业进行降维打击,它的业务边界延伸越来越长。如果说传统企业完全不做一条类似于互联网企业的数字化的生意的话,必然面临来自互联网企业的竞争.比如各种C to XX。
3、传统公司业务无法在线, 但是业务数字可以在线, 通过数字化运营进行反攻。通过数据技术和算法去切入业务流,形成一个智能化的闭环,然后让企业的生产经营全过程都可度量和可预测。
把概念清晰化,从企业决策人角度来讲,做数字化转型之前应该问自己三个问题:
1.你是否清楚了解企业过去的经营情况和当前的业务情况?
2.是否对企业当前的经营情况,组织情况,都了然于心?
3.对未来所作的决策,不论转型也好,场景优化也好,是否有数可依?
所以企业数字化转型一个很大的意义在于,不再依赖于下属汇报的各种各样的数据,而是通过数字化的系统来获取这部分数据。传统企业现在的数据可能大部分来源于企业信息化过程当中所产生可公开的数据,如传感器、操作设备。传统企业在数据方面的最大弊端,在于没有触达最终客户端,缺少了全量用户的声音,往往只能参考一个取样的声音。这也是说互联网公司拿到用户的声音去降维打击传统企业的一个原因。
实时数据更有价值
我们跳出来看看传统企业会有哪些数据。数据可以总结为以下4份:用户日志的数据,各种统计的数据,业务系统的数据,还有整个业务过程的数据。盘点下来之后,再从时间维度分为不同的量级。比如毫秒、秒级产生的数据、分钟级数据,年度报表则是年度级的数据。从时间轴的角度来讲,不同时效性的数据会有不同的价值。对于不同的企业来讲,可能不同时效性的数据价值的重要程度就不一样。对5G,loT这种较为巨大的行业场景来说,会更关注时效性低的一些数据,可以对于未来企业的战略方向做一些准备。对于目前很多传统的经营企业来讲,可能更关注天级、月级的数据,因为那是代表企业业务过程的。并且由于业务部门信息化数据的不完整,很多较大企业依然靠人为上报数据,这种情况下,数据则集中在天级左右。
对于不同的用户来讲,对于数据在不同的维度上的关注也是不同的。比如说时效性大概在秒级的数据,可能是系统运维的人员比较关注的,因为要保障整个系统的使用,不能宕机。那对于开发来讲,主要是要做到问题诊断,有可能就是在运维的数据之上。有一部分运营,比如说阿里小二,更注重实时,因为包含运维运营的各种安全性。对于业务数字的运营,则可能在天级以上。前面提到阿里的三个最大的场景,基本上都应用的是实时数据。这也是目前所认为的趋势,实时数据的价值往往比离线数据价值大。
通用算法方面,实时数据的时序预测方法是可以直接运用在实际处理上的,根本不需要再做各种离线算法在场景下面的各种数据清理和特征构造。所以对于时序数据来讲,可以直接把算法服务作用在时序数据上,比如aws开放的forecast服务。
其次,也更有助于我们关注场景通用模型。现在大部分企业都在建自己的终端客户渠道,建设了之后,免不了就会收集到大量的终端渠道的用户行为数据。它包含就是各种各样的用户行为,比如点击浏览、跳转,在体现用户行为分析的基础上,我们的这个产品内置各种各样的公开的漏洞分析、留存分析、还有用户画像等产品。实时数据可以帮助我们玩转模型。
数据中台在实际场景中的解决方案
以某医疗器械公司为例,由于业务线分支庞大,数据的汇报则标准不一,就给决策造成了难题。而用数据中台则可以完美地解决这个问题。
问题概况
解决方案
数据中台的项目以数据场景的咨询为入口。从产品销售分析的角度,业务预测和预警的角度,销售过程管理的角度,客户分析的角度,运营成本管理的角度,还有渠道管理的角度做大量的规划和设计。
在之前,只能用销售分析的系统处理报表数据,用客户画像系统处理客户数据,是重复造轮子的一个怪圈。而阿里已经帮我们探了路,可以用数据中台这个方案来解决问题,磨刀不误砍柴工。就可以避免这个情况了。
另外,不管是对数据处理的逻辑的复杂程度,还是对于数据处理的技术上的要求,数据处理依然是很复杂的过程。所以一定需要数据中台的产品再加上方法论,来将原始数据转换成可以直接给数据分析和数据挖掘人员去做实用的基础。而数据中台本身就是一个工具性的产品和工具性的方法论。
传统数据中台的实施路径
指定完整的规划,统一架构平台,统一标准规范,然后按照数据源做统一的数据采集,再做统一的数仓设计,形成统一的数据资产,最后再基于统一的数据资产做各种各样的数据运用。
在实施过程中,基于数据应用的维度上做一个敏捷数据中台开发,以数据应用为交付单位。在交互数据应用的过程中,慢慢形成整个企业的数据中台,是不小的挑战。但收获也会很大,包括对数据技术的深入了解,阿里云的数据产品的理解,还有对整个行业知识的理解。这些都赋予我们思索数据中台的价值的能力,以及抽象模型的能力。
驻云实施数据中台的两条路
最后,在了解了业务、产品、组织、系统后,知晓过去,理清现在,判断未来。如此,才能做好适合的中台架构设计。