「数据战略」建立数据驱动的组织

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 「数据战略」建立数据驱动的组织

前面的章节定义了什么是数据驱动的组织,并且讨论了建立一个组织以保持竞争力的重要性。现在,我们将花一些时间讨论构建数据驱动组织所需的实际步骤。

我们认为,一个数据驱动的组织应该具备三点:

  • 一种文化,在这种文化中,每个人都会接受使用数据做出商业决策的想法
  • 支持数据驱动文化的组织结构
  • 支持数据驱动文化并使数据自助服务的技术

我们将在本章中讨论前两个要点,并讨论构成引擎中关键核心的员工的角色和责任,这些核心员工推动数据驱动的组织从数据生产者、数据科学家、工程师、分析师到业务用户。

下一章将致力于支持数据驱动文化所需的技术。

创建自助服务文化

向实践数据操作的数据驱动组织过渡的最重要、也可以说是最困难的方面,是向数据思维转变所需的文化转变。这一转变需要确定和建立一个文化框架,使所有参与数据计划的人员都能从数据的生产者、建模者、分析者、工作中使用数据的员工协作,使数据成为组织决策的核心。尽管使这种协作和数据访问变得容易的技术非常重要,但它只是其中一个考虑因素。这一转变的一个关键重点领域是员工和组织。如第一章所述,在您实现真正的自助服务、数据驱动文化之后,您的业务应该会经历一次重大的竞争提升。

培养数据驱动决策的文化

为了成功地成为一个数据驱动的组织,您的员工应该始终使用数据来开始、继续或完成每一个业务决策,无论其大小。

是什么促使公司拥有成功的数据驱动文化?重要的是要明白,这并不一定与数据本身有关。那是次要的。技术本身排在第三位。数据驱动的决策首先是关于组织的。

不管你是否承认,你的企业已经有了一种决策文化。这种文化可能不适合采用数据驱动的方法。所有太多的公司都采用“HIPPO”(办公室里薪水最高的人)的决策方法,通过这种方法,会议中的高级人员可以做出最后的选择。不用说,这只河马可能是错的。但除非你有数据,也没有组织高层的许可来反驳,否则这个决定是成立的。

这就是关键所在:要成功地成为一个数据驱动的组织,你的员工应该始终使用数据来开始、继续或完成每一个业务决策,无论其大小。这种好奇的文化应该促使数据团队中的每个人,包括IT、数据工程师、数据科学家和数据分析师,不断改进和完善业务用户需要的工具,以告知他们的决策。由于数据在这种环境中被大量访问和使用,组织应该鼓励和部署人员、流程和技术,以尽量减少访问的障碍。

你知道,当数据驱动的计划开始从组织的底层而不是高层开始时,你已经成功地转变为数据驱动的文化。在一开始,通常会在一个组织中找到一个高层支持者来支持一个数据项目或一个在某些功能中使用数据的变更。例如,在迅速转变为数据驱动的企业中,一个常见的功能是营销。一家公司的首席营销官可以通过强制要求新的创意和活动进行试验和测试,以收集有关其有效性的数据,而不是仅仅依靠直觉和直觉来确定基调。这一信息将数据放在首位,然后这种情绪就会流向营销组织的其他部门。初始数据项目还有助于证明数据对高管的重要性,并帮助他们看到使用数据的直接好处。此外,成功的初始数据项目将成为如何在其他项目中使用数据的角色模型。

尽管这种自上而下的措施或项目是启动变革所必需的,但最终,当自下而上的自助服务数据访问需求出现时,公司真正成为数据驱动型公司。要做到这一点,就必须有工具和机制来支持员工自下而上的兴趣。例如,在自助服务工具和流程到位后,市场营销部门的员工可能会实际使用从以前的活动中收集的数据来提出一个假设,即新的活动或消息应该是什么样子的。实际上,数据开始成为整个部门肌肉记忆的一部分。

启用数据区域性的一个关键驱动因素是使数据团队能够轻松捕获组织中的所有数据。企业有大量的内部和外部数据源。这些服务包括不同的业务应用程序、产品应用程序、公共和私人客户交互点、监控系统、第三方数据提供商以及许多其他服务。这些系统的建立是出于操作原因,收集数据进行分析是事后考虑。因此,自然的趋势是不捕获任何这些数据,更不用说将它们合并到一个地方了。因此,来自所有这些来源的有价值的数据继续留在其筒仓中。在这个过程中,组织失去了许多通过将来自不同来源的数据放在一起而获得洞察力或优化的机会。

克服这一挑战的第一步是对所有数据源进行清点,并创建一个通用的数据捕获基础设施,该基础设施是整个公司的标准,并确定捕获和记录数据的正确方法。每个人都应该使用这些标准。下一步是整合所有数据,以便组织中的所有数据使用者都知道到哪里去找它。这就是我们在Facebook所做的,事实上,Facebook所有的海量数据存储仍然在一个集中的位置。

创建一个整合的数据存储库可以帮助每个人围绕数据进行协作。您将有数据分析师来分析数据并将结果反馈到业务中。他们会问这样的问题:“我如何使用数据来改进我的产品?“更进一步说,”我如何从我的客户那里获取数据,以改变产品的功能,也许是个性化?“随着数据捕获和整合的标准化,数据工程师很容易编写支持反馈循环的自助服务应用程序。然后,业务用户使用这些分析做出战略决策。

执行团队还将受益于标准化和集中化的数据。公司高层通常没有足够的时间或技能来分析数据。然而,他们需要数据来为自己的决定提供信息,这可能比公司里的任何人都要多。因此,构建业务仪表板是有意义的,这样执行团队就可以及时、自助地访问数据。例如,对于任何给定的公司,都会有反映业务中重要趋势和统计数据的业务指标:销售、价格、客户流失等。将这些统计数据保持在最新状态,并让高级管理人员能够访问这些数据,这将对您的业务产生巨大的好处。

重要的是要了解不同的利益相关者会出于不同的原因购买使用数据。您必须首先确定所有利益相关者是谁。然后,你必须明白什么会激励他们开始使用数据来做决定。

关于构建数据驱动文化的提示

以下是关于如何构建数据驱动文化的五个技巧。

1. 雇佣数据远见者

你需要看到“大局”并了解员工使用数据改善业务的所有方法的人。虽然这当然包括分析市场营销、销售和客户数据,但并没有到此为止。数据驱动的决策有助于内部运营,例如提高客户服务和支持的效率,降低库存成本。这一切都是从雇佣那些对数据能告诉他们的、有远见的人的前进方向持开放态度的人开始的。

2.将数据组织到每个人都可以访问的单个数据存储中

如果那些需要数据来做商业决策的人无法访问这些数据,那么宇宙中的所有数据都将无济于事。数据驱动的公司在整合数据的同时不断更新数据,以便员工能够在任何给定的时间点访问最准确的信息。这意味着消除数据竖井并有效地实现数据访问的民主化。当然,总有一些数据安全和法规遵从性问题,我们在第6章中讨论了这些问题,但是向每个人提供数据是自助服务数据文化的一个重要特征。始终允许员工查看影响其工作的数据。他们不仅需要在颗粒层面上看到这一点,而且需要以一种有助于他们理解大局的整体方式看到这一点。这样做将使您的员工更加了解、熟练和热情地使用数据来改进业务。

3.授权所有员工

所有员工在提出数据使用方法时,都应该感到主动性很好。当然,这种心态远远不止是使用数据。如果你建立了一个公司,所有员工都可以自由发表意见,只要他们有数据支持,即使这些意见与高级管理人员的假设相矛盾,那么你就是在建立一个组织,在这个组织中,最好的想法自然会被吸引到最高层,即使在发展最快的市场上,也能保持竞争力。

4.投资正确的自助数据工具

如果你的大多数员工不能理解你的数据,或者不能将其应用于业务问题,那么即使你的数据很容易访问,也不会对你的业务有多大帮助。您可以通过投资于正确的数据工具来解决这个问题,我们将在第5章中更详细地讨论这些工具。你应该根据你的目标来选择工具,但是作为一个起点,你的工具应该让你的员工更容易访问、共享和分析数据。您可能需要可以直接嵌入到您已经使用的业务工具中的工具;例如,Excel和Tableau。并确保投资于这些工具的培训。仅仅有一个“直观的界面”是不够的。您的员工是否了解数据分析、转换、统计和可视化的基本原则?为了获得工具的投资回报,您的员工必须准确了解每个工具提供的功能。培训可以是实时的、基于视频的或在线的,并且应该使用共享的数据存储,以便员工可以相互比较他们的数据发现和探索。

5. 追究员工的责任

科技只会带你走这么远。你还需要制定激励措施,鼓励员工使用技术和工具。您还应该有一种方法来衡量和评分朝向自助服务数据文化的进展。这意味着当员工有效地使用数据来驱动业务决策时,要让他们对自己的行为和进展负责。只有当你根据数据奖励员工的行为,你才能实现真正的文化转型。

自助服务、数据驱动文化的协作、社会层面也不容低估。没有它,你将失败,你在软件、数据处理工具和平台上的投资将被浪费。然而,尽管许多组织口头上支持这种协作和开放的概念,但很少有组织采取适当的行动。请记住,数据不属于IT、数据科学家或分析师。它属于这个行业的每个人。因此,您的工具需要允许所有员工创建自己的分析和可视化,并与同事分享他们的发现。

成为自助服务数据文化的潜在障碍

成为自助服务数据文化最常见的障碍是,您将面临来自团队的阻力,他们传统上是数据和用户之间的管道。他们可能会说,“我们不能让每个人都访问数据。有安全问题和法规遵从性问题。”虽然这些都是可以提出的有效问题,但您可以通过技术解决它们。如今,将用户身份与访问控制策略以及捕获审计日志的技术联系起来的技术可以轻松地解决此类异议。不要让这些问题成为阻碍你转变为真正自助服务文化的拐杖。

我们在Facebook看到的另一个潜在挑战是,当你向所有人开放数据存储时,你可能会发现你没有支持这种广泛访问的基础设施。要么是规模的限制,要么是处理所有传入的查询变得非常昂贵。您需要使用能够以经济高效的方式扩展的基础结构来解决这个问题。(详见第5章。)

但是,请记住,大多数障碍都是由传统的集中式数据团队设置的,他们不愿放弃对其他用户的控制。因为这是最有问题的挑战,公司需要专注于这个团队,也许重组或重组它。消除任何瓶颈,使这个集中的团队能够成为自助服务文化中的英雄,而不是阻挠者。所以,这确实是一种心理上的挑战,也是一种组织上的挑战。

创建一个数据驱动的文化并不总是容易的,但是它提供的好处是真实的和重要的。大数据正在改变企业经营业务的方式,因此它在改变企业文化方面扮演的角色也就不足为奇了。

支持自助服务文化的组织结构

在组织上,你如何支持一个数据驱动的公司?在大多数成功的数据驱动组织中,都有一个中心数据团队,负责发布数据并管理用于发布数据的基础设施。在其他情况下,可能有多个数据团队嵌入到不同的部门中,每个数据团队都满足该部门的需要。具有讽刺意味的是,后一种模型在创建数据驱动的文化方面通常不太成功,即使每个部门都有数据团队。原因很简单:这样的组织在不同的部门之间造成了低连接,最终导致了数据仓库的创建。因此,一个强大的、功能强大的中央数据团队对于在一个组织的不同部门之间建立连接是极其重要的。他们通常公布最重要的数据集,以确保有一个单一的真理来源作为分析的基础。

使用这些数据集的分析员通常嵌入到组织的不同部门中,帮助这些部门从数据集中提出问题。将其视为轮毂和轮辐结构,如图4-1所示。嵌入式数据分析员具有业务功能的领域知识,还了解可以帮助他们回答这些问题的数据集。他们有能力将系统语言转换为业务语言。


图4-1。组织中心和辐条模型(来源:Qubole)

这种技巧很关键,因为这两种语言有很大的不同。企业希望提出以下问题:

  • 我的业务中哪一个地理区域最适合投资?
  • 市场规模有多大?
  • 竞争对手是谁?
  • 今天最好的机会是什么?

然后,您需要能够回答这些业务问题并将其转换为一系列问题以询问数据的分析人员。因此,数据分析人员会将这些问题转换为SQL或其他命令,以从数据存储中提取相关数据。

在Facebook,我们有一个集中的数据团队。然后,我们在每个产品团队中都有分析师。我们还注意到,所有分析师都有一个中心论坛,在那里他们可以见面并交流他们正在做的事情,从而使数据智能能够在整个组织中流动。从本质上讲,该模型将自助式组织文化的数据驱动DNA传递到了整个公司。

轮毂和轮辐模型的工作原理

业务部门中嵌入的人员可以是数据分析师,也可以是数据科学家,这取决于业务部门的需求有多复杂。如果业务单元级别需要深入学习或机器学习,则需要数据科学家担任该角色;如果业务用户需要报告和回答业务问题,则数据分析师更适合嵌入。

各个业务功能的领域知识对于嵌入到功能团队中的数据分析师和数据科学家来说是必不可少的。分析员需要在理解一个域并将其转换为需要对数据提出的技术问题方面表现出色。它们成为数据和业务线用户之间的桥梁。因此,数据分析人员一方面可以接触到很多功能区域,另一方面可以接触到关于数据集的元数据。他们了解这些是如何相互关联的,这是能够有效地使用数据来回答业务问题的关键技能。

例如,在Facebook,我们在产品团队中嵌入了数据分析师:增长内部、广告等。这些数据分析师很快就他们所在的团队面临的具体问题加快了速度。

分析员本身和中央数据团队之间的耦合非常重要。分析人员自然依赖于数据团队,因为后者是托管数据集的主要发布者。然而,同样重要的是不同职能部门的分析师之间的互动。这种交互帮助他们推动协作和数据共享,而不是创建数据仓库。实现这种交互的一个典型方法是在中央数据团队内创建一个论坛,让所有数据专业人员,从数据科学家到数据工程师到数据分析师,讨论他们的数据使用和他们正在尝试做什么。

最后,这些专业人员得到了中央数据团队的支持。后者最终负责维护基础设施,并提供对数据用户所需数据集的访问。如果数据“价值链”中的任何一个环节薄弱,那么在实现真正的数据驱动文化的道路上就会产生摩擦。首席数据官通常是那些负有培育和增长数据价值链最终责任的人。

对数据分析师来说,培训是必不可少的

因为他们需要对数据、数据工具和嵌入它们的功能领域有同样深入的了解,所以数据分析师需要广泛的培训。培训可以是正式的课堂培训,也包括跟踪更有经验的分析师。这项工作的一个关键方面是学习特定领域的关键性能指标(KPI)。例如,市场部如何衡量成功?或者运营团队的关键目标,以及他们如何衡量成功?为了有效地将业务问题转换为数据查询,了解用于实现这些目标的目标、策略和策略,以及最终对这些成就的度量对于数据分析人员了解这些目标、策略和策略至关重要。

角色和责任

现在,您已经了解了什么是自助服务文化,以及如何将您的数据专业人员组织到中心辐射模型中,现在是时候更仔细地检查数据专业人员的具体角色和职责是如何组织的了。

当然,你需要工作中最好的人。当然,每一个业务都有不同的需求和目标,这意味着每一个数据团队都将由具有不同能力的不同类型的人员组成。然而,对于所有数据团队来说,无论他们支持什么业务,有些事情都是常见的。仔细指定团队每个成员的角色和职责将避免冲突和效率低下。

在本节中,我们将概述组建一个数据团队的最佳方法,该团队能够应对您在大数据世界中面临的挑战。

图4-2显示了数据中心业务中数据团队的主要角色。


图4-2。数据团队的核心角色(来源:Qubole)

什么是角色?

角色是工作角色的一个侧面。它不是一个人或一个职位。事实上,一个员工可能代表多个角色(在一个小公司中)。或者,一个角色可以在一个更大的企业中跨多个人员进行拆分。理解人物角色是很重要的,因为它能让你理解他们的痛点,他们关心什么,以及他们的最终责任。

如果您了解人物角色,那么您可以在尝试转换为数据驱动企业时,确定哪些消息可能与您正在交谈的人最相关。理解这不是一个层次结构,而是一个在上一节描述的hub-and-spoke模型中协同工作的协作团队是非常重要的。以下是你可能遇到的角色:

数据分析师

这些数据专业人员通常嵌入到业务线或功能组中。他们的工作是将业务问题转换为对可用数据集的查询。他们是数据用户,但不是程序员(与科学家阅读的数据相反)。这些人最熟悉业务的运行方式、战略目标是什么以及数据是如何融入的。他们对有助于实现高管目标和有效利用前端工具的实践有着深刻的理解。他们可能不完全了解数据分析算法的内部工作原理,但他们知道如何将这些函数和算法应用于他们试图回答的问题。数据分析员能够使用这些数据,并与高级管理层交流他们的研究结果。

数据工程师

这些数据专业人员负责将数据输入平台,以便数据科学家和分析人员能够访问它。他们负责提供从组织中的不同来源(包括最终产品)捕获数据的机制。此外,他们通常负责在清理和转换任何捕获的数据后在组织中发布核心数据集。简言之,数据工程师确保数据是可用的、整理的和清理的。他们通常是IT的一部分,向CIO或工程副总裁汇报。因为数据工程师与数据接收和处理有着内在的联系,所以他们必须与数据科学家和分析师保持开放的沟通渠道,以便在更下游的地方充分进行分析。它们还可能依赖于应用程序开发人员,以便在捕获数据的产品中放置工具。

数据科学家

他们是参与统计、机器学习和深度学习的数据团队的成员。它们依赖于先进的数据挖掘工具,负责组合预测和规定性分析。像R、Python和Scala这样的工具是他们最喜欢的环境,他们对深度学习和机器学习工具包有着深刻的理解。在某些行业,它们甚至可能被称为量子数,因为它们往往有很强的数学背景。

首席数据官

监督整个数据团队运作的人,通常直接向首席执行官或首席技术官汇报。

合规和安全团队

这些专业人员通过定期审计确保符合HIPAA等合规要求。

数据平台管理员

这些数据专业人员管理数据基础架构。他们负责生产数据库管理系统、数据仓库和大数据基础设施。管理员管理基础设施,使其运行良好,具有足够的容量,为使用基础设施的不同团队提供足够的服务质量,等等。他们也是控制数据访问权的人。它们建立组织的访问控制策略和安全策略的实现。他们的最终任务也是以最经济的方式提供基础设施和工具。

业务线用户

最终用户对数据做出决策。它们提供了报告、特别分析工具等。这些人会进行分析并采取行动;例如,在市场营销方面,活动经理可能会查看某些活动的roi,并决定相应地移动他们的预算。

当然,将数据作为产品销售的公司是不同的。当一个企业生产或销售的产品主要由数据构成时,角色将更加以产品为中心。它不那么重要,而产品经理在这样的环境中更为重要。组织中的每个人都更具技术性,因此数据知识通常通过业务线分布。

聚会的中心论坛

尽管组织中的数据用户是分布式的,但重要的是要理解没有层次结构。相反,这个组织提供了一种机制,让大家团结在一起,互相分享、协作和学习。所有这些角色都在战略数据计划中占有一席之地。例如,Facebook宣布了一项增长计划,数据科学家开发了数据分析师以及最终商业用户可以通过这些模型完成有助于公司增长的分析,无论是通过收购新用户、新产品开发还是其他手段。

这个中心论坛使Facebook的数据用户能够说一种共同的语言,并提供数据的共同定义,比如什么构成了地址或电话号码。团队还可以进行跨职能分析,其中为Ads团队开发并嵌入的分析可以使用团队创建的数据分析结果。

hub-and-spoke结构促进了这些对话,并将知识分散到整个组织中。这比传统的指挥控制模式有效得多。

摘要

在本章中,我们讨论了如何将您的业务转变为具有自助服务文化的数据驱动组织。我们讨论了不同的组织角色和职责,并提出了支持这种转变所需的非常重要的中心辐射式组织结构。通过学习和实现这些概念,您的业务将逐渐成为真正的数据驱动。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
2月前
|
人工智能 安全 搜索推荐
2024年度云治理企业成熟度发展报告解读(四)支柱结构关系及案例分享
从组织、成本、稳定、安全到性能、效率这样一个路径,我们一定要有策略地完成各个支柱之间的互相配合。云治理不仅仅是技术问题,而是需要多团队合作和管理策略的制定。
2024年度云治理企业成熟度发展报告解读(四)支柱结构关系及案例分享
|
2月前
建立积极企业文化
建立积极企业文化
66 10
|
2月前
建立积极的企业文化是一个系统工程
建立积极的企业文化是一个系统工程
53 5
|
2月前
|
数据采集 存储 大数据
数据治理:数据孤岛是企业信息化发展中难以避免的阶段
数据孤岛是企业信息化发展中难以避免的阶段。企业需要正视这一现象,通过完善数据治理体系、加强部门协作、采用先进技术手段等措施,逐步消除数据孤岛,实现数据的有效整合和利用。只有这样,企业才能在激烈的市场竞争中立于不败之地。
|
安全 Cloud Native 数据中心
【IT战略】技术现代化:如何开始建立基础
【IT战略】技术现代化:如何开始建立基础
|
数据采集 人工智能 安全
「数据战略」结果驱动的企业数据策略:组织和治理
「数据战略」结果驱动的企业数据策略:组织和治理
|
机器学习/深度学习 数据采集 存储
「数据战略」业务成果驱动的企业数据战略
「数据战略」业务成果驱动的企业数据战略
|
数据采集 机器学习/深度学习 存储
「数据战略」成果驱动的企业数据战略:工具和技术
「数据战略」成果驱动的企业数据战略:工具和技术
|
监控 数据可视化 数据管理
「数据战略」数据战略的范围和复杂性
「数据战略」数据战略的范围和复杂性
|
缓存 运维 监控
建立团队的性能文化
活跃用户数:如果要更进一步的划分用户类型的话,DAU(日活)是个很好的维度,通过监控,可以看出有多少用户在什么时间段进行了哪些业务操作,各个不同的业务场景,在系统使用高峰时,各自的占比时长等。
建立团队的性能文化