12月6日,“中台客栈——‘数’下英雄会”在杭州湖畔大学举行。活动由奇点云、袋鼠云、新华智云、数澜科技联合甲子光年主办。奇点云、袋鼠云、新华智云、数澜科技几位创始人,作为国内最早接触数据中台的阿里系数据老兵,在2016年前后不约而同地走进数据中台赛道。3年的时间,在各自深耕的行业和领域中获得了越来越多客户的认可。如今,国内数据中台第一梯队的老将们聚首湖畔,深度论道,廓清“数据中台”迷雾,与企业、与社会共同展望数智化未来。
来自蚂蚁金服、戴尔、乌镇智库、浙江省数字经济学会、浙江省大数据科技协会、杭州数字经济联合会等机构30余位关注数据中台的行业专家、企业高管出席活动,与嘉宾共同探讨数据中台。
从左至右:甲子光年联合创始人程曼祺,奇点云创始人张金银(花名:行在),数澜科技创始人甘云锋(花名:风剑),袋鼠云创始人陈吉平(花名:拖雷),新华智云首席数据官李金波(花名:介然)
01 数据中台是“新瓶装旧酒”?为什么以前的方式行不通了?
场景和业务倒逼出了“数据中台”
行在,2004年加入阿里巴巴,原阿里云大数据平台“数加”创始人,2016年创立奇点云。他认为,某种意义上来说,是场景和业务需求倒逼出了“数据中台”。很多企业以往的业务系统是条块化建设的,例如淘宝和淘宝商城(天猫前身)各自都有货源体系,但因条块化建设,阿里巴巴难以看到自己的数据全貌,也无法将数据打通。奇点云曾服务过的一家大型综合体内部有12个系统(来自不同的供应商),分别都包含消费者信息,但无从整合。而数据中台可以做到。
奇点云创始人张金银(花名:行在)
除了数据的打通整合,风剑谈到,多云适配,也是推动数据中台出现的重要原因之一。“上云”已成为DT时代企业的共识,但认为上云就可以消除数据孤岛,其实也很大程度上误导了企业和政府。“这里一套阿里云,那里一套华为云,大家互不相关,就好像你有一个山头,我有一个地盘,反而加剧了数据孤岛。国外曾有一篇报道,预测未来五年全球范围内85%的企业会是多云环境。既然多云环境是必然的,底层的数据能力如何整合打通?这时候大家发现,无论是什么样的IT系统或者云架构,无论是在哪朵云上,通过数据中台,都可以让自己的这些系统的数据互联互通,在企业购买和使用的多个云环境中的数据自由流动。正是多云环境的产生,决定数据中台未来会变成企业的一个必选项。”风剑曾是阿里云创新数据工作室及人工智能创新业务主要负责人,在职期间其打造了阿里巴巴集团最重要的数据资产服务,被集团CEO评价为“最有价值的数据战略资产”。2016年创立数澜科技。
数澜科技创始人甘云锋(花名:风剑)
数据中台 VS 数据仓库 VS 数据平台 VS数据湖
作为阿里巴巴首个数据仓库建立者,行在谈到:数据中台可以实现“从看,到用,到赋能”。20年前,数据仓库出现,企业在数仓上建BI给决策者看报表,是“看”的阶段。后来阿里发现,数据可以为一线运营的“小二”所用,还可以搭建TCIF(消费者信息数据系统)帮助阿里了解消费者、优化广告投放,也就进入“用”的阶段。在“用”的基础上,数据中台可以为企业“赋能“,实现降本增效。简单来说,“用”和“赋能”是数据仓库无法实现的”中台“价值。数据湖则像一个杂货铺,更多是堆集数据,而数据中台不仅需要“存”数据,还是要把它“通”、“用”起来,因此中台更像沃尔玛或者淘宝,分门别类,清晰可见。
介然,2008年加入阿里巴巴后曾负责淘宝网数据平台广告数据研发团队、数据产品数据研发团队、阿里大数据平台基础数据团队,任职期间亲手打造了阿里数据中台基础核心数据体系。目前在阿里和新华社合资成立的新华智云担任首席数据官。介然从媒体行业的视角对数据中台和平台的异同进行进一步阐释:“平台更强调系统的建设,而中台更强调能力的服务。”媒体对数据的依赖非常强——线索发现、自身绩效评估、稿件编辑校验等都需要数据,可以说在媒体行业,数据就是生产资料。在平台的阶段,更多的是为了收集数据,管理数据,而数据中台则是要为媒体建立核心能力,提高发现新闻线索的能力、内容生产能力、新闻传播的能力以及信息追踪的能力等等。
袋鼠云创始人陈吉平(花名:拖雷),新华智云首席数据官李金波(花名:介然)
拖雷,2004年加入淘宝,在阿里任职11年,是淘宝最早的数据专家、淘宝第一代数据仓库建设者、阿里巴巴大数据平台开创者,曾是阿里集团数据治理、数据规划、数据安全的负责人,2016年创立袋鼠云。谈及数据湖与数据中台的异同,拖雷以京东的“亚洲一号”项目举例补充道,如果今天的“亚洲一号”只有仓库而没有管理系统的话,可能就是数据湖。“但今天‘亚洲一号’最强的不是在于这个仓库面积有多大,放了多少货,而是在于管理系统能很方便地管理任何货物,比如知道任何一件货物的位置、数量,可以快速获取、配送,以达到高效管理。这就是数据中台的能力。”
当然,“数据中台”需求大热,并不代表数据仓库、数据平台、数据湖等方式都要全盘否定。在风剑看来,数据湖为构建数据中台提供了一个良好的基础,大量数据的整合沉淀为数据的接入、使用提供了一定便利,但这只解决了“看见数据”的问题,并没有解决“数据怎么用”这个问题,在未来面对不确定性的场景时,数据中台相较于数据湖将发挥出更强大的功效。
02 数据中台是一种技术?
在拖雷看来,数据中台更多的是一种理念。“对于企业来说,数据是能源,是生产资料,可以为下一阶段的智能化打下良好基础。所以今天的数据中台对于机构、企业,就是构建一个数据大脑。产品做得好,组织架构配合得好,当然这颗数据大脑会运行得更好。”
拖雷用其自创的“数据中台五步法”进一步阐释了他对数据中台的理解:第一步——数据资产盘点,就好像盘点家里有多少食材,能做多少菜,梳理完才知道想做什么,能做什么;第二步——数据中台建设,这就需要一个具体产品来做支撑;第三步——数据的清洗和加工,好比造房子前要先打地基,干的都是“脏活、累活”,而这部分工作也是最会被误解的,因为业务方看不见;第四步——数据的应用,对于很多企业来说,他们最关注的就是数据能不能用起来。第五步——持续迭代,真正的数据中台需要持续迭代,而不是一劳永逸的。
“我们把数据中台的英文定义为Office而不是平台(Platform),说明它并不是一个纯技术上的概念。”介然补充道,数据中台需要技术,但绝不仅仅是技术。这也是在场四位嘉宾的一致共识。
03 数据中台:一个时代的选择,谁先用谁先受益
数据中台将在DT时代帮助企业极大地发挥数据的力量,这已经成为了大多数企业及政府的共识。那究竟什么样的企业更适合做数据中台?
介然言简意赅地给出了他的判断原则:做数据中台的核心,还是要强调数据在业务上发挥价值。如果说任何一家机构的业务需要利用到数据去改善或提升它的业务价值,那它就适合做数据中台。介然补充道,媒体大脑数据中台有一个用户是江西省融媒体中心,该中心通过中台打通省市县三级融媒体中心和互联网数据,做到百县联动,省宣可以更好地协调全省媒体资源,讲好江西的故事;而地县级的基层融媒中心也可以通过媒体数据中台提高生产效率。
在座4位所属的中台服务公司覆盖了多个行业,包含零售、地产、媒体、政府,风剑也谈到,数据中台的服务对象不会止于某个特定的行业或群体。“再过十年,不管你是什么样的客户,是政府还是企业,都需要数据中台。就像ERP之于企业,所产生的价值是渗透到企业中的角角落落,这就是我为什么说数据中台一定是一个企业级的战略,而非部门级的。”
拖雷认为,现在是信息化2.0时代,数据中台把数据汇集在一起,形成企业的数据大脑。到了信息化3.0时代,会真正形成智能化趋势,未来所有的企业都是数据化企业,需要利用大数据来作为驱动力。“什么样的企业更适合做中台?就好比每个人需要代步工具,有的人买汽车,而有的人买自行车就行了。同样的,每个企业都需要一个数据中台,一个数据大脑。不要觉得数据中台就是一辆汽车,它也可以是自行车、电动车。代步是一个刚需,数据化驱动也是一个刚需。”
观时代趋势,指今朝行动,谈及未来,行在补充到:“用老套的话说,数据中台、数据驱动一定是未来,这和20年前互联网爆发的时候一样,谁先用谁先受益。”
04 数据中台服务之路,难关几重?
“数据中台元年”走到尾声,市场对中台的认可度越来越高,但对中台服务公司来说,仍存在不少发展的阻碍。譬如,数据不够完备,价格低于价值,行业设定的准入门槛不合理、把业务提升要求强加在中台服务公司上等等。
数据不够用?开放数据共享,既要卖产品也要卖服务
介然谈到,数据不全、不够用是普遍现象,今天企业能够意识到自己的数据不够用,已经是一个进步。很多企业可能不知道自己有多少数据,也不会想到如何把数据用起来。
同时,数据中台不仅要帮助企业把自己的数据用好,还要能把企业要用到的数据汇集到中台里来,将不足的数据通过行业甚至互联网数据补足,这样价值更高。“以媒体行业为例,我们要打造面向媒体的数据中台,而当前媒体自身数据的业务价值可能还不如行业数据的价值高,所以汇集行业产生的数据也应是中台能力的一部分。我们长期的愿景也是要打造‘开放数据分享的第一平台’,将开放数据和媒体技术相结合。”
行在介绍,建设数据中台有三个阶段,在线化、数据化和智能化,三阶段相辅相成。在数据化环节,往往难以要求企业在做中台之前都已经有非常完备的数据。奇点云的做法是帮助客户产生新数据,通过AI、IOT来帮助客户补充数据。另外,与新华智云相似,也会加入互联网公开的数据来丰富数据。“举个例子,我们有一位做生鲜超市的客户,以前通过买手在Excel里计算明天要进多少生鲜,我们入场后为他们建了一个智能订货的算法,一方面做了数据升维,把周边的消费者信息、天气、节假日等考虑进去,另一方面用算法代替了人工经验。做出来效果很好,比历史提升了35%。我们做中台的公司除了帮客户解决TA数据使用的问题,还要帮助TA解决数据生产的问题。”数据中台卖产品,也要卖服务,二者不可分割。
“价值驱动”攻克付费意愿难关
风剑介绍:“相比国外,国内对企业软件付费的意向是很弱的。另外,很多行业会设定许多准入标准,比如证券行业、金融行业,而标准都是十几年前定的。”
拖雷也谈到,袋鼠云给客户带来的价值远远高于数据中台服务的价格。对此,他呼吁大家用“价值驱动”来攻克难关:“未来的企业服务一定要做到价值驱动,不做价值驱动的话跟外包就没有区别。而且我相信环境在好转,付费意愿会越来越强。中国的2C发生天翻地覆的变化花了10年左右,中国的2B我相信也一定会有天翻地覆的变化。关键企业愿不愿意改变,我们愿不愿意改变,这是很关键的基础。”
05 “造电网还是造电器?”数据中台服务生态可期
同样为企业服务,与不同类型的企业合作,企业的侧重点亦有所不同。拖雷分享道:“客户其实有不同类型,如果有比较懂技术的客户(例如企业的技术部门),TA知道这个东西能带来的价值,就会直接买我们的平台产品。如果是企业的业务部门,则往往更关注数据中台完成后能为业务带来什么价值。”
当然,同样是阿里系出身的数据中台公司,袋鼠云、奇点云、新华智云、数澜科技对数据中台的服务价值侧重点亦有所不同。
风剑强调,数澜科技的愿景是成为客户信赖的数据应用基础设施供应商,就像建造楼房一样,通过数澜扎实的技术能力和行业最佳实践,给企业提供一个中台底座,赋予企业超乎想象力的未来空间。“想尽办法把过往的一切业务数据化,汇聚联通,再想尽一切办法把这些数据变成可用的资产,最后提供工具方法技术把这些资产沉淀为数据服务。”目标在于让客户的数据可见、可用、可运营,但数据中台的价值基础,是客户是否主动去拥抱科技带来的变化。不会有人比企业更懂自身的业务,数澜是要帮企业构建数据能力,帮助企业解决更通用的场景化问题。
介然所属的新华智云聚焦于用中台解决媒体行业的痛点。他谈到:“公司里有媒体从业经验很丰富的人,和阿里过去的技术经验丰富的人结合在一起,是可以攻克一些问题的。如果我们只做技术性的平台,在媒体行业里会比较难生存。中台到底是技术推动还是业务推动,我觉得不一定要分得很清楚,它可能是一个综合体。只不过今天新华智云的中台一定需要解决媒体行业的业务痛点。”
同样把重点落脚在行业的行在补充道:“我们不仅提供底层数据平台的产品,例如奇点云自研的大数据智能服务平台DataSimba,同时也希望我们的行业专家能和客户一起共创,让土地(底层数据平台)变得肥沃的同时也能为客户种出几棵苹果树(数据应用)。才能让客户真正实现数据化企业运营,盘活企业的数据资产,创造更多商业价值。奇点云现在主要是在零售行业,但我们绝对不止于零售。未来我们一定会多行业拓展,大家也会在这个生态里不断成长。”
拖雷总结道:“我们不同的企业关注点不同是很正常的,大家会形成一个生态,成为伙伴。就好像有的服务商去做电网(数据中台基础设施),有的去做电器(数据应用),不会要求做电器的一定要去把电网也给做了,只做电器一样能成很大的企业。”
从概念定义到本质辨真,从需求热潮到实践瓶颈,从市场定价到价值赋能,从基础设施到业务应用,短短2小时,行在、拖雷、介然、风剑与主持人曼祺畅谈数据中台大小事。高手过招,切磋琢磨,仰望星空,脚踏实地,企业数智化转型的未来蓝图在“争锋论剑”中徐徐展开。
如何看待对企业下一个十年变革会产生重要影响的数据中台?无论是克服万难搭好基础设施,还是想用业务应用去解决具体痛点、节本增效,相信在场嘉宾心里已经有了自己的答案。