《数据分析变革:大数据时代精准决策之道》一1.4 全面看待运营型分析

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

本节书摘来异步社区《数据分析变革:大数据时代精准决策之道》一书中的第1章,第1.4节,作者: 【美】Bill Franks(比尔•弗兰克斯)译者: 张建辉 , 车皓阳 , 刘静如 , 范欢动 责编: 杨海玲,更多章节内容可以访问云栖社区“异步社区”公众号查看。

1.4 全面看待运营型分析

运营型分析是超越历史性分析实践的一种演进,但并不能说过去的经验无关紧要。贯穿本书的主题之一就是多年来核心原理的兼容性。本节将讨论几个值得考虑的重要主题,来全面了解运营型分析。

1.4.1 数据质量及时效性依然重要

数据质量及时效性对分析流程一直非常关键。随着企业的分析运营化,这一问题变得日益重要。当一个流程使用数秒前的数据在一秒钟后作出决策时,数据必须做到及时和准确。对于来自运营型分析流程的自动决策来说,实际上没有机会修正数据错误。

我有一个朋友在一家大型的物流公司工作。我不打算说出公司的名称是因为我不想针对某一家公司,很多企业都存在同样的问题。我的朋友曾经吐槽他们为司机提供正确导航路线时遇到的问题。他描述了一个在收集地图数据时遇到的一个有关数据质量的问题。

想一想你曾经使用过的普通地图应用或者GPS设备。你有没有注意到经常被指引到离目的地有些许偏差的地方?比如,宾馆的地址可能在Main街上,而停车场入口却在Elm大街的角落的不远处。你的地图应用会把你带到Main大街,而你还要考虑如何从那里到停车场。

这种细微的错误在你只是想去就餐或者找个商店时还只是令人有些恼火,毕竟某一次浪费一两分钟不算什么。然而,对于一家有几千名司机的公司,每天在数百次停靠的过程中不断经受同样的误导,就难以接受了。作为对策,我朋友的公司有一个大型团队,负责根据司机报告的最新信息更新公司的地图数据库。

数据质量不可忽视

数据质量的重要性不言而喻,在运营型分析的世界里更是如此。流程自动和快速的本质也意味着几乎没有机会捕获数据问题。数据必须可靠。

地图数据团队需要通盘考虑。团队成员标记出酒店停车场入口位于与官方入口有一定距离的角落。如果酒店因交通拥堵而更改了入口位置,在入口开放的同时数据库要得到更新。主流的地图应用会导航到住宅前面的街道。如果房子坐落在半公里泥土路的郊区呢?向那些地方发送物品造成的沿路颠簸而增加的五分钟车程对算法来说是很关键的。如果这家物流公司没有充分、及时、正确的数据,将会因效率降低造成数百万美元的损失。如果地图数据不够准确,优化驾车路径的分析流程也不会准确,所以公司对获得正确数据极其关切。

不难想象错误的数据是如何造成运营型分析脱轨的。这就又回到了为何企业不可以跨越传统分析直接转到运营型分析。运营型分析一个很重要的步骤仍然是收集所需数据并确保数据质量。分析一直遵循一错全错(garbage-in,garbage-out)的原则。不过在转向运营型分析时,不同之处是在执行分析和采取对策之前,几乎没有机会进行合理性检查和对貌似正确的数据进行校验。数据质量必须满足非常高的标准,否则数据错误首先导致分析错误,然后导致做出错误的决策。等到数据错误暴露出来时,可能已经造成了大量的实际损失。

1.4.2 运营型分析会压制创新性?

有人质疑分析和创新性的关系。分析在企业内占了主导地位,是否创新性会因此受到压制?换句话说,当自动化计算机算法越来越多地接管了决策,是否创新性和人为因素就淡出业务活动了呢?

我的观点是恰恰相反。我相信运营型分析会促进创新性。原因在于,当自动制定决策时,很容易跟踪那些决策的效率,跟踪决策能让企业测试哪些决策有效,哪些决策无效。不再需要开富有建设性和娱乐性的头脑风暴会议然后不得不选择一两个指定路程执行,分析使测试想法然后基于结果推进成为可能。创新性仍然用于帮我们做出选择。然而,这给更好的量化创新思维的潜力以及通过试验降低风险提供了可能性。这是网站一直在努力做到的。

让你的创新性思潮流淌起来

让分析释放而非压制你的创新性思维。只要创新性观点能够通过分析和试验进行验证,企业能够尝试比过去更多的创新性想法。

在主流网站,如 eBay 或者 Amazon,几乎可以保证,在每个看到的页面的某个位置,一定正在进行某种类型的测试。这些测试或许是顶部某个提示条的颜色,或许是有两个还是三个广告,或许是或长或短的产品描述这么简单。用户永远不会知道页面的哪些部分是用来测试的,哪些部分是标准的。这才是关键。这些都是为网站负责的,正在进行小型实验。行业领导者可迅速测试冒出的创新想法,并能够迅速地以最小代价且几乎没有风险判断它是否是胜出者。

拥抱分析并使其运营化实际上能够释放更多时间用于创新。通过打造先进的运营型分析流程,把简单的日常决策交由系统处理。工作人员只需坐在一边考虑尝试更具吸引力的想法。数据的收集与分析允许创造性与革新性在组织内部自由流动,而决不会对其进行压制。

1.4.3 运营型分析的很多概念并非全新

我们以一个案例结束本章的内容,来讲讲有多少传统的、经试验正确的规则适用于运营型分析。许多运营型分析从概念上并非全新的,不管其看上去有多么复杂和强大。通常运营型分析仅仅是长期最佳实践的最新最先进的逻辑扩展。速度、时效性和运营型分析的自动化实质是新的,但基础的分析概念本身往往并不是全新的。

一个广受欢迎的把老概念用新方式应用的案例是Web定制和关键字优化。这些概念之所以看上去新,是因为20多年前我们甚至还没有网页,更别提用几百种方式随意对其定制的能力。然而,隐藏在Web页面布局和关键字优化背后的概念却存在相当时间了。

在一次媒体见面会上,一个欧洲记者向我进行了一次精彩的演示。这个记者提到了他认识的一位在报纸行业工作了十几年的人。退回到20~25年前,当编辑准备每天的报纸时,经常会为哪些故事放在页面顶端和底部以及标题应该怎么写而争论不休。这位记者的朋友总能根据经验针对文章的位置布局以及标题书写发表好的看法。

此人的经验是如何起作用的呢?因为他经常私下跟踪并收集在他们的报纸订阅区域内各种不同位置什么故事和标题卖得最好的数据。其中一些数据得以记录下来,而更多的数据保留在他的头脑中。尽管并未意识到这一点,他还是有效地进行了关键字优化和页面布局优化。其逻辑、方法以及流程从抽象角度看与当今Web发生的现象吻合。他的工作方式无疑有些原始,但在本质上却遵循了相同的基本准则。有必要提出的是,今天所做的许多分析,恰是从前所做分析的扩展,尽管现在采用了更先进且更具分析性的手段。运营型分析也是如此。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
12天前
|
监控 供应链 数据可视化
运营数据分析在企业管理中的重要性
本文详述了构建高效营销策略体系的方法,涵盖市场调研、产品定位、差异化策略、品牌建设及数据分析等环节,强调了数据可视化工具在策略执行中的重要作用,旨在帮助企业提升市场竞争力和盈利能力。
|
1月前
|
数据采集 数据可视化 数据挖掘
数据驱动决策:BI工具在数据分析和业务洞察中的应用
【10月更文挑战第28天】在信息爆炸的时代,数据成为企业决策的重要依据。本文综述了商业智能(BI)工具在数据分析和业务洞察中的应用,介绍了数据整合、清洗、可视化及报告生成等功能,并结合实际案例探讨了其价值。BI工具如Tableau、Power BI、QlikView等,通过高效的数据处理和分析,助力企业提升竞争力。
62 5
|
29天前
|
数据采集 数据可视化 数据挖掘
掌握Python数据分析,解锁数据驱动的决策能力
掌握Python数据分析,解锁数据驱动的决策能力
|
2月前
|
数据挖掘 UED
ChatGPT数据分析——探索性分析
ChatGPT数据分析——探索性分析
53 1
|
2月前
|
数据可视化 数据挖掘 数据处理
ChatGPT数据分析应用——热力图分析
ChatGPT数据分析应用——热力图分析
116 1
|
2月前
|
数据挖掘
ChatGPT在常用的数据分析方法中的应用(分组分析)
ChatGPT在常用的数据分析方法中的应用(分组分析)
72 1
|
2月前
|
数据挖掘 数据处理
ChatGPT在常用的数据分析方法中的应用(交叉分析)
ChatGPT在常用的数据分析方法中的应用(交叉分析)
51 1
|
2月前
|
机器学习/深度学习 数据采集 数据可视化
如何理解数据分析及数据的预处理,分析建模,可视化
如何理解数据分析及数据的预处理,分析建模,可视化
63 0
|
24天前
|
机器学习/深度学习 算法 数据挖掘
数据分析的 10 个最佳 Python 库
数据分析的 10 个最佳 Python 库
73 4
数据分析的 10 个最佳 Python 库
|
4月前
|
数据采集 数据可视化 数据挖掘
数据分析大神养成记:Python+Pandas+Matplotlib助你飞跃!
在数字化时代,数据分析至关重要,而Python凭借其强大的数据处理能力和丰富的库支持,已成为该领域的首选工具。Python作为基石,提供简洁语法和全面功能,适用于从数据预处理到高级分析的各种任务。Pandas库则像是神兵利器,其DataFrame结构让表格型数据的处理变得简单高效,支持数据的增删改查及复杂变换。配合Matplotlib这一数据可视化的魔法棒,能以直观图表展现数据分析结果。掌握这三大神器,你也能成为数据分析领域的高手!
91 2
下一篇
DataWorks