导读:
● 数据的规模化使用有利于降低成本(如数据中心运行管理的优化)、提高收入(如电子商务领域的交叉销售与追加销售)、推动技术进步(如自动汽车的深度学习功能)。● 虽然每个数据用例都要求不同形式的技术理解和域理解(下文将会涉及),但就一般情况而言,项目管理技能仍然是成功的主要原因。
● 基础设施项目经理来说,最终交付的产品应该是一个通用的数据基础设施,它可以永久地收集、存储、处理相关数据,从而降低用例。有了这个产品,团队就能将重点放在原始数据的使用上,而不是收集和存储。
原文翻译:
数据产品的制作早在人工智能初露锋芒之前就已经开始了。但是,数据产品管理岗的设立与完善则是相对新近的事。这是直接发挥数据既是关键产品、又具备比较优势的新职能。今天,数据的规模化使用有利于降低成本(如数据中心运行管理的优化)、提高收入(如电子商务领域的交叉销售与追加销售)、推动技术进步(如自动汽车的深度学习功能)。
在人工智能的热潮中,动物分类算法与Go-playing智能体代表了数据产品管理的两大基石。但算法只是整个数据产品生态系统中的一部分。在大部分商业场景下,算法模型可能只占结果的极小部分。一家公司要想让数据像水流一样畅通无阻地流动,必须具备一个大型支持生态体系,并完成三大任务:
● 第一, 收集和存储于原始事件与交易行为并为之服务。● 第二, 与相关团队共同处理、开发和分享数据。
● 第三, 制作并部署算法模型,并在生产过程中加以监督。
这三项工作,最终都要有看得见、摸得着的商务成果。在数以万计的方向里,企业应该先做什么,再做什么?
Insight企业数据平台已帮助上万名员工成功转型数据产业,找到各式各样的岗位。在这个平台上,业界对能为数据团队掂量出轻重缓急、处理好协调问题的项目经理的需求增加。这篇文章试图描述理想的行业项目经理的形象,并阐明其重要意义。
数据产品管理究竟有什么用?
如果是小型项目团队,没有正式的项目经理,那么像机会评估、技术路线图、股东管理这些常规性的产品责任基本上是技术经理和个体工作者来做。放在大型团队里,这种分工就有很多不足,最主要的是以下四点:
● 其一,产品工作占据所有个体工作者的时间● 其二,不是每个个体工作者都有能力或者有意愿从事规模性的产品工作。
● 其三,企业单元和技术团队之间的距离越拉越大。
● 其四,个人技术团队之间的距离越拉越大。
在这个拐点上,企业有两条应对之道。一是把任务分解成若干个子项目,并确保个体工作者或小型技术团队有能力全程跟进,不必涉及其他团队,也就不用设立某种形式的总协调员。
第二条应对方案是建立一个正式的产品管理组织,专门负责维护数据源路线图,并在各团队与个体工作者之间协调任务的执行情况。这种方案对于电子商务和按需服务这种功能高度交叉的产品来说尤为普遍。
第一种方案要想发挥出全部威力,必须得是某个体工作者能够对产品进行调整,迅速取得客观的运行反馈,并在最差的情况下以不作大改为前提完成回滚。这种方案或许适用于免费的社交网络产品,但对于付费型、任务繁重的产品(如按需服务),基本上是毁灭性的。比来比去,大部分规模性的公司还是选择了第二种方案,专门成立一个产品管理组织。
数据项目经理的角色发展到了哪个阶段?
在数据演进的初期,像软件工程、软件数据、软件建模这种无关的数据技能,都是同属于数据科学的门类。现在,它们均已快速发展成为独立的岗位,比如数据工程师、数据科学家、研究人员、机器学习工程师等等。
类似的潮流也正出现在产品管理业内部。在数据项目经理这一宽泛的岗位类别之下,出现了若干个子岗位,例如基础设施、分析、应用机器学习/人工智能、探索与标准化、平台等。这些具体化的过程与技术项目岗曾经的演变如出一辙。不同的是,对数据项目经理岗来说,上述头衔还没有尘埃落定。其发生发展,不过是反映了数据产品工作相对独特的分工现象。
虽然每个数据用例都要求不同形式的技术理解和域理解(下文将会涉及),但就一般情况而言,项目管理技能仍然是成功的主要原因。我要强调这一点,因为一个数据项目经理每天的主要工作,还是处理优先级、沟通、股东管理、设计以及规范。
基础设施
规模条件下,个体项目团队的用例和数据需求各不相同。但为了尽快启动,这些团队往往倾向于打造独立的数据基础设施。这种倾向会造成重复劳动、数据孤岛,最终各个团队都会遭遇同样的数据规模性问题。
对基础设施项目经理来说,最终交付的产品应该是一个通用的数据基础设施,它可以永久地收集、存储、处理相关数据,从而降低用例。有了这个产品,团队就能将重点放在原始数据的使用上,而不是收集和存储。
基础设施项目经理的关键绩效指标是数据可用性、规模性与可靠性。基础设施项目经理应该精通数据工程技术,例如数据接入、批量实时处理、文件系统与发送。
分析
当代职场,决策者越来越依靠数据。从战略到产品和运营,从线下到实时,大量决策都是建立在分析的基础上。如果说,基础设施项目经理的职责是确保查询任务能够在海量数据背景下有效运行,那么项目分析经理则专注于将这些原始数据转化成可操作的见解,提供给经理、项目经理、运营团队等决策方。除此之外,项目分析经理还积极投身于关键绩效指标的认定工作与数据的探索工作,为商务决策建言。
在产品建造的语境下,一名项目分析经理的职责是创建一个自助分析、定制仪表盘和报告工具的混合体,促进观点在全公司层面的提炼与分享。项目分析经理涉及到多元化的相关方,既有睿智的数据科学家,也有经理这种“只读型”的消费者。
项目分析经理的关键绩效指标,主要是由查询任务的运行数量,发送的报告数量等证明该项目便捷性的因素。正是由于这种便捷性,数据用户才能从原始数据中提炼出需要的观点。
应用机器学习/人工智能
某些产品和功能本身会自然而然地从机器学习/人工智能中寻找解决方案,例如搜索、推荐、诈骗检测等。应用机器学习项目经理专注于把数据用在既有产品上——例如分析聊天记录,使客户服务路由实现自动操作,以及用高级人工智能设计出一种全新体验——例如照片分享软件的筛选器。说到底,他们的工作就是为了直接改进面向客户的功能的关键指标。
致力于上述功能的项目经理虽然并不总是冠以数据项目经理的名号,但他们一般都对数据科学的工作流及其机器学习模型有着深刻理解。他们天生就知道如何利用机器学习的力量,并且比起严守规则的职员,他们更懂得如何在极限边缘设计产品,提供优质的用户体验。
平台
公司规模越大,对标准化框架的需要也就越现实,特别是在实验和机器学习方面。这两个工作流程的用例往往与产品自身的本质紧密结合在一起。正是基于这个原因,开源方案才会这么难以满足众人的需求。
考虑到这个背景,大公司的个体数据团队会先着手建设专属的一次性系统,从而导致重复劳动和拖沓的生产周期。因此,谷歌、脸书、Uber之流已经正式把目光转向平台——以通用的框架来减少花在加工、调用、监视等普通任务上的精力。
之所以建立这些平台,目的之一就是为了取消管理数据、调用和监视结果的必要性,让数据团队能够把重心放在模型和实验上。还有一个目的,就是因为有了这些平台,所有用户都可以获取通用数据和特征,从而增强了可重用性。
平台项目经理的工作首先是证明平台如何发挥用途,然后是让早期使用者愿意付出尝试。一旦平台到达拐点,项目经理的角色就转变为找出举有高回报率的公分母,并将其嵌入平台。平台项目经理的关键绩效指标包括:平台上运行的模型、实验、投入市场所需的平均时间等。
标准化与探索
这也是规模团队的一个问题。公司越大,个体团队和人员所创造的数据量也会出现指数级的增长。数据的迅速输出造成一个问题:遍寻公司上下,没有一个中央场所可以查看到全部数据。
如果缺少一个记载、整合、显示海量数据的结构,那么组织对于数据源的掌握情况就受制于数据拥有者。结果,数据真正意味着什么,从何而来,有多可信,这些问题全都变得不确定。不仅如此,如果最熟悉那块数据的员工离职,关于这些数据源的知识也将一同消失。第三个常见的问题是,使用了相同数据的团队对于本质上一样的指标往往会给出不同定义。例如,最后七天在这个组可能叫做“整整最后七天”。到了另一个组,就可能叫做“最后168个小时”。
数据标准化与探索项目经理的职责是确保整个公司意识到数据的存在,并且以一套固定的方式使用这些数据。这个岗位经常生产数据目录和数据通道,为数据、仪表盘和指标的探索与定义提供便利条件,同时也负责识别和联系数据所有者,以便建立进一步对话。
数据通道的一个高级版本是降低计算指标的获取难度,并将其融合到建模、分析等各个用例中。
结语
数据产品管理依然在发展之中,本文也无意穷尽业界数据产品岗位的所有内容。数据项目经理可以是上述职责的混合体。至于是哪些职责,取决于公司发展阶段和组织结构。分析可以是基础设施的一部分,标准化与探索也可以是平台的一部分。而应用机器学习项目经理也可能负责整合资源,以构筑基础设施和调配环境,为模型的生产提供必要条件。
说到底,这些岗位都要创造一场有价值的、以数据为基础的用户体验,也要扫除所有障碍,确保团队能够提供这份价值。
原文发布时间为:2018-10-29
本文作者:品觉