大数据文摘: 什么样的数据团队才称得上顶级?
车品觉: 我想先定义一下顶级。
一般人听到顶级一般会想,团队里有一个非常厉害的科学家,但是我定义的顶级是整个团队的配合天衣无缝,像一个篮球队。
数据团队是指数据部门的团队还是整家公司作为一个数据团队。如果是后者,必言产品,有一个产品可以辅助公司每一个人的数据,这个时候就对数据核心团队的要求很高。不再是公司的中央数据部门解决公司数据问题,而是整个公司都在解决整个公司的数据,这是很不一样的,能够达到这个境界,不再单纯依靠某个部门解决数据问题,而是整个公司都在产生依靠数据,才能说是顶级数据团队。
数据科学家只是整个环节中的一环,厉害的数据科学家会帮公司想几年后的东西,而不是现在就产生结果。如果作为整个团队,那么肯定是有一些灵魂人物出现,这些人不一定是数据技能有多厉害,而是懂得翻译,从数据能力到业务创新,或者商业团队的意愿转达给技术团队,这种角色是最难的。
大数据文摘: 这样的人才我们应该给在业务团队培养还是在技术团队培养呢?
车品觉: 我想答案应该是,哪边有这样的人,我们就去培养。
因为这种人非常少,再加上如果讲顶级大数据团队,在数据上继续构建,还要多一个东西,还有其他领域的数据在自己领域的增值是什么?(其他场景的数据进到我的主场景的时候会产生什么价值),这是个跨界的东西。需要一个人指挥这个团队的前进方向。
我希望用一个公司的例子来解释这个问题。我不是夸阿里很厉害,但目前来讲,我见到的公司,还几乎没有一个公司像阿里一样,对自己的数据岗位有一个很清晰的描述,也即绩效考核。比如一个P8的数据开发的人需要做什么?职责是什么,怎么知道他做得好?
因此,要建设一个顶级数据团队,你要知道怎么盘点这个数据团队,盘点一个团队肯定分两种:为了业务盘点技术,还是为了技术盘点业务,这两种有什么不一样,这是很多公司不具备的,我觉得这才是宝贵的。我在阿里这么多年,这是我最引以为傲的,至于培养了多少人,这不是重要的。
阿里的考核指标如何,阿里会让P8自己描述,你需要做什么。阿里有个优点,团队多,所以经过很多P8的描述,你就可以发现一个共同点,做一个P8要有什么样的水平。还有一个关键点,晋升一个P7到P8,到底晋升的时候有没有一个严谨的晋升之道,这也是建立一个数据团队的必经之路。
作为总监,会有一个数据的价值观,我会问你为了别人做了什么,有没有贡献过数据给别的部门,或者上下游,举个例子。这样就可以发现,团队凝聚力就很高,这不仅仅是说你自己做了什么,而是为整个大的队伍做了什么。
大数据文摘: 数据团队的构成上,嵌入式和中央式的数据团队更看好哪一个?
车品觉: 我更看好这两者混合的数据团队,就好像打架,肯定有前锋,但是前锋和后方部队的工作不一样。你可以培养很懂数据的团队来产生价值,但是谁来培养培养数据呢?数据不是资产,是资源。要时刻问自己,你的资源够不够?如果现在够,还需要问一下,公司准备在两三年后做的事情,资源又够不够?
所以数据战略应该和业务战略是同步的,业务战略走多高,数据战略也应该走多高。而数据战略又分为数据能力的战略和数据资源的战略,我们现在很多人都提到一个问题,数据的发展会成为很多东西的壁垒。数据要越来越像一个战略,算法是技术,是一个效率问题,产品和业务场景是变现,我觉得这三个点要分开来讲。
大数据文摘: 数据应用落地需要数据、业务、工程三方合作,这三方(数据团队与IT团队和业务团队)应该如何有效协作?
车品觉: 这实际上是有一个上下游的关系,最难的点是,下游的人想做上游的事情,上游的人想干掉下游的人,就是在大部分的数据团队,大家都想一条线都做完,所以问题的关键在管理。但是当中需要想的是,为什么下游的人想做上游的事情。关键在晋升。一般业绩考核都是在前段,如果你的绩效没有鼓励供应枪炮的人也得到认可,那供应枪炮的人就会想,为什么我不自己去前线。
如果把这一点逐步平台化,这个问题会改善。我们有一次在阿里,打开了整个云,看数据的重复,发现非常多,每个人都在建自己的底层。从管理者的角度来说,怎么解决?把用得多的数据变成公共层,没有人可以copy出去。
借这次采访,我也希望让更多数据公司的管理者知道,数据不是自然变好的。比如说有一年,阿里曾经把公司的三大团队拉到一个酒店,描述自己在干嘛,发现都一样。阿里有几个大团队,我所在的部门、广告、推荐,让大家都画一下自己在做事情的图,发现做的都一样,数据很多重复,每一个都想干掉对方,都在建同样的架构。如果一个公司没有CTO,没有人对此负责人,会很乱。数据重复会导致算法重复,产品重复。我在阿里这些年也在努力做这样的事情,把18个产品变成6种,算法、数据集中起来变公用。先收,而不是扩,才能做出精锐的顶级团队。
大数据文摘: 如何看待数据驱动?
车品觉: 数据驱动的定义是,我在做一个决策的时候是不是数据支持的。
这里我想举三个例子。
如果给你看一份报告,让你对这个事情有了一定的认知,接下来做了一个正确的决定,算不算数据驱动?
在一个保险计算中,有没有风险工具在其中,直接把大数据算法能力放在风控领域中,算不算数据驱动?
有一个无人飞机,这个飞机的飞行是按照数据的,风向、天气变化数据,这算不算数据驱动?
这三个都是数据驱动,但是第一个不能看待feedback。数据的闭环有很多断点,第二个场景下,数据是可以回来的,但是也存在一些断点,也不完全是一个非常紧密的数据回流;第三个是一个base on feedback的数据驱动。
当然这三个都是数据驱动,但是一个比一个有更紧密的数据回流,而且改进的时间是一个比一个更短。首先公司要明白,刚刚说的三种数据驱动在一家公司会同时存在,它是基于管理层还是中层还是直接应用。管理层的问题是不可能完全数据化的,几乎没有数据,需要基于判断,基于不完美数据的判断,第二个闭环情况下,是可以在部分环节套进去,第三个是可以自适应的。
大数据文摘: 数据团队建设最大的痛点是什么?
车品觉: 人才缺乏。
在一个行业正走红的时候,找人很难找,即使是阿里,也很难得心应手找到合适的人。刚刚讲的东西也就更关键了,依靠团队,而不是依靠某一个人,在大家都没有人的时候,我刚刚进阿里的时候就是这样,一定要打配合,我常常跟我的团队说,我们不是单人作战的,我们是一起打的。
大数据文摘: 对有志于进入数据科学领域学生/数据团队领导人的建议和意见。
车品觉: 最好在培养的时候能培养多一点domain的人才,其实AI和大数据都有两类:基础AI/大数据和应用AI/大数据,应用是跟行业联系起来的,这两种人才的培养是不一样的,在应用端的培养,应该在大学时候给予多一些行业知识。我在念书时候,有business computing,懂商业。当然我们也不仅要培养应用类AI/大数据,也要培养基础的。
原文发布时间为:2018-08-27
本文作者:文摘菌