业界 | 对话车品觉:顶级数据团队该像支配合默契的篮球队

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

大数据文摘: 什么样的数据团队才称得上顶级?

车品觉: 我想先定义一下顶级。

一般人听到顶级一般会想,团队里有一个非常厉害的科学家,但是我定义的顶级是整个团队的配合天衣无缝,像一个篮球队。

数据团队是指数据部门的团队还是整家公司作为一个数据团队。如果是后者,必言产品,有一个产品可以辅助公司每一个人的数据,这个时候就对数据核心团队的要求很高。不再是公司的中央数据部门解决公司数据问题,而是整个公司都在解决整个公司的数据,这是很不一样的,能够达到这个境界,不再单纯依靠某个部门解决数据问题,而是整个公司都在产生依靠数据,才能说是顶级数据团队。

数据科学家只是整个环节中的一环,厉害的数据科学家会帮公司想几年后的东西,而不是现在就产生结果。如果作为整个团队,那么肯定是有一些灵魂人物出现,这些人不一定是数据技能有多厉害,而是懂得翻译,从数据能力到业务创新,或者商业团队的意愿转达给技术团队,这种角色是最难的。

大数据文摘: 这样的人才我们应该给在业务团队培养还是在技术团队培养呢?

车品觉: 我想答案应该是,哪边有这样的人,我们就去培养。

因为这种人非常少,再加上如果讲顶级大数据团队,在数据上继续构建,还要多一个东西,还有其他领域的数据在自己领域的增值是什么?(其他场景的数据进到我的主场景的时候会产生什么价值),这是个跨界的东西。需要一个人指挥这个团队的前进方向。

我希望用一个公司的例子来解释这个问题。我不是夸阿里很厉害,但目前来讲,我见到的公司,还几乎没有一个公司像阿里一样,对自己的数据岗位有一个很清晰的描述,也即绩效考核。比如一个P8的数据开发的人需要做什么?职责是什么,怎么知道他做得好?

因此,要建设一个顶级数据团队,你要知道怎么盘点这个数据团队,盘点一个团队肯定分两种:为了业务盘点技术,还是为了技术盘点业务,这两种有什么不一样,这是很多公司不具备的,我觉得这才是宝贵的。我在阿里这么多年,这是我最引以为傲的,至于培养了多少人,这不是重要的。

阿里的考核指标如何,阿里会让P8自己描述,你需要做什么。阿里有个优点,团队多,所以经过很多P8的描述,你就可以发现一个共同点,做一个P8要有什么样的水平。还有一个关键点,晋升一个P7到P8,到底晋升的时候有没有一个严谨的晋升之道,这也是建立一个数据团队的必经之路。

作为总监,会有一个数据的价值观,我会问你为了别人做了什么,有没有贡献过数据给别的部门,或者上下游,举个例子。这样就可以发现,团队凝聚力就很高,这不仅仅是说你自己做了什么,而是为整个大的队伍做了什么。

大数据文摘: 数据团队的构成上,嵌入式和中央式的数据团队更看好哪一个?

车品觉: 我更看好这两者混合的数据团队,就好像打架,肯定有前锋,但是前锋和后方部队的工作不一样。你可以培养很懂数据的团队来产生价值,但是谁来培养培养数据呢?数据不是资产,是资源。要时刻问自己,你的资源够不够?如果现在够,还需要问一下,公司准备在两三年后做的事情,资源又够不够?

所以数据战略应该和业务战略是同步的,业务战略走多高,数据战略也应该走多高。而数据战略又分为数据能力的战略和数据资源的战略,我们现在很多人都提到一个问题,数据的发展会成为很多东西的壁垒。数据要越来越像一个战略,算法是技术,是一个效率问题,产品和业务场景是变现,我觉得这三个点要分开来讲。

大数据文摘: 数据应用落地需要数据、业务、工程三方合作,这三方(数据团队与IT团队和业务团队)应该如何有效协作?

车品觉: 这实际上是有一个上下游的关系,最难的点是,下游的人想做上游的事情,上游的人想干掉下游的人,就是在大部分的数据团队,大家都想一条线都做完,所以问题的关键在管理。但是当中需要想的是,为什么下游的人想做上游的事情。关键在晋升。一般业绩考核都是在前段,如果你的绩效没有鼓励供应枪炮的人也得到认可,那供应枪炮的人就会想,为什么我不自己去前线。

如果把这一点逐步平台化,这个问题会改善。我们有一次在阿里,打开了整个云,看数据的重复,发现非常多,每个人都在建自己的底层。从管理者的角度来说,怎么解决?把用得多的数据变成公共层,没有人可以copy出去。

借这次采访,我也希望让更多数据公司的管理者知道,数据不是自然变好的。比如说有一年,阿里曾经把公司的三大团队拉到一个酒店,描述自己在干嘛,发现都一样。阿里有几个大团队,我所在的部门、广告、推荐,让大家都画一下自己在做事情的图,发现做的都一样,数据很多重复,每一个都想干掉对方,都在建同样的架构。如果一个公司没有CTO,没有人对此负责人,会很乱。数据重复会导致算法重复,产品重复。我在阿里这些年也在努力做这样的事情,把18个产品变成6种,算法、数据集中起来变公用。先收,而不是扩,才能做出精锐的顶级团队。

大数据文摘: 如何看待数据驱动?

车品觉: 数据驱动的定义是,我在做一个决策的时候是不是数据支持的。

这里我想举三个例子。

如果给你看一份报告,让你对这个事情有了一定的认知,接下来做了一个正确的决定,算不算数据驱动?

在一个保险计算中,有没有风险工具在其中,直接把大数据算法能力放在风控领域中,算不算数据驱动?

有一个无人飞机,这个飞机的飞行是按照数据的,风向、天气变化数据,这算不算数据驱动?

这三个都是数据驱动,但是第一个不能看待feedback。数据的闭环有很多断点,第二个场景下,数据是可以回来的,但是也存在一些断点,也不完全是一个非常紧密的数据回流;第三个是一个base on feedback的数据驱动。

当然这三个都是数据驱动,但是一个比一个有更紧密的数据回流,而且改进的时间是一个比一个更短。首先公司要明白,刚刚说的三种数据驱动在一家公司会同时存在,它是基于管理层还是中层还是直接应用。管理层的问题是不可能完全数据化的,几乎没有数据,需要基于判断,基于不完美数据的判断,第二个闭环情况下,是可以在部分环节套进去,第三个是可以自适应的。

大数据文摘: 数据团队建设最大的痛点是什么?

车品觉: 人才缺乏。

在一个行业正走红的时候,找人很难找,即使是阿里,也很难得心应手找到合适的人。刚刚讲的东西也就更关键了,依靠团队,而不是依靠某一个人,在大家都没有人的时候,我刚刚进阿里的时候就是这样,一定要打配合,我常常跟我的团队说,我们不是单人作战的,我们是一起打的。

大数据文摘: 对有志于进入数据科学领域学生/数据团队领导人的建议和意见。

车品觉: 最好在培养的时候能培养多一点domain的人才,其实AI和大数据都有两类:基础AI/大数据和应用AI/大数据,应用是跟行业联系起来的,这两种人才的培养是不一样的,在应用端的培养,应该在大学时候给予多一些行业知识。我在念书时候,有business computing,懂商业。当然我们也不仅要培养应用类AI/大数据,也要培养基础的。


原文发布时间为:2018-08-27

本文作者:文摘菌

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“大数据文摘”。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
6月前
|
人工智能
全球AI人才报告:硅谷40万人大裁员,码农地狱级面试12场!
【2月更文挑战第24天】全球AI人才报告:硅谷40万人大裁员,码农地狱级面试12场!
89 2
全球AI人才报告:硅谷40万人大裁员,码农地狱级面试12场!
|
数据采集 机器学习/深度学习 人工智能
国产框架MindSpore联合山水自然保护中心,寻找、保护「中华水塔」中的宝藏生命
国产框架MindSpore联合山水自然保护中心,寻找、保护「中华水塔」中的宝藏生命
|
人工智能 算法 安全
第二届 1024 中国工程师文化日议程全览,你不能错过的 N 个理由
第二届 1024 中国工程师文化日议程全览,你不能错过的 N 个理由
201 0
|
机器学习/深度学习 人工智能 搜索推荐
首发丨阿里云刘伟光:2万字解剖「保险科技」,管理者怎样做「正确的事」?
首发丨阿里云刘伟光:2万字解剖「保险科技」,管理者怎样做「正确的事」?
首发丨阿里云刘伟光:2万字解剖「保险科技」,管理者怎样做「正确的事」?
|
人工智能 编解码 达摩院
为拿下算法 “奥斯卡”,阿里团队设计了一个冠军方案
被誉为计算机视觉领域 “奥斯卡” 的 CVPR 刚刚落下帷幕,2021 年首届 “新内容 新交互” 全球视频云创新挑战赛正火热进行中,这两场大赛都不约而同地将关注点放在了视频目标分割领域,本文将详细分享来自阿里达摩院的团队在 CVPR DAVIS 视频目标分割比赛夺冠背后的技术经验,为本届大赛参赛选手提供 “他山之石”。
为拿下算法 “奥斯卡”,阿里团队设计了一个冠军方案
|
机器学习/深度学习 人工智能 JavaScript
洞悉2020年数据团队建设,我们和清华、领英一起搞了个大事情,你也可以参与!
洞悉2020年数据团队建设,我们和清华、领英一起搞了个大事情,你也可以参与!
247 0
|
人工智能 算法 前端开发
“数据科学家”或许不再性感,但“数据团队”的产业化才刚开始 | 专访领英全球数据科学团队负责人
“数据科学家”或许不再性感,但“数据团队”的产业化才刚开始 | 专访领英全球数据科学团队负责人
262 0
|
人工智能 物联网
阿里巴巴跨物理界招人,世界级音频专家冯津伟入职人工智能团队iDST
11月30日阿里巴巴正式宣布,前Polycom(宝利通)声学设计和信号处理首席工程师(Principal Engineer)冯津伟入职人工智能核心团队iDST,担任智能语音交互团队研究员,将负责语音交互设备端的声学设计和信号处理研究工作。
6921 0
|
区块链 物联网 人工智能
阿里巴巴选出年度十佳公益项目,统统都是暖科技,区块链、IoT、AI都用上,阿里工程师把公益秀出新高度
10个项目无一例外都与科技相关,印证了阿里“公益心态、商业手法、技术力量”的独特公益理念。
1612 0