数据分析的三大时间轴:过去、现在和未来-阿里云开发者社区

开发者社区> 技术小能手> 正文

数据分析的三大时间轴:过去、现在和未来

简介: 很多人用不同的定义解释“数据科学”,貌似都很合理,对数据科学这个问题的思考可以联想到与之相关的其他领域,例如业务分析、数据分析、商业智能、高级分析、机器学习,还有人工智能。 数据科学的“绝对定义”需要大量的“数据科学”背景才能被理解,这是一个递归的问题……可以说,统计学家或程序员理解什么是数据科学要容易得多,就像历史学家或语言学家所说的那样,前者已经以一种或另一种形式暴露于数据科学之中。
+关注继续查看

很多人用不同的定义解释“数据科学”,貌似都很合理,对数据科学这个问题的思考可以联想到与之相关的其他领域,例如业务分析、数据分析、商业智能、高级分析、机器学习,还有人工智能。

数据科学的“绝对定义”需要大量的“数据科学”背景才能被理解,这是一个递归的问题……可以说,统计学家或程序员理解什么是数据科学要容易得多,就像历史学家或语言学家所说的那样,前者已经以一种或另一种形式暴露于数据科学之中。这使我们想到,数据科学的相对定义可能更有用,以下是相关看法。

这是一个描绘所有上述领域的欧拉图。每个颜色代表一个不同的字段(混合的颜色表示交集),图上还有一个时间轴和使用案例。

3f48b7ae770eb6cd6c92a0e4430434128864ef17

(矩形的位置、大小和颜色表现出概念上的相似性和差异,而不是复杂性)

下面就来分析具体的概念。

一、商业

为了避免过度简化这个问题,这里认为“商业”这个词没有任何定义,而融合商业的一些应用案例则更有意思,例如商业案例研究、定性分析、初步数据报告、视觉报告、创建仪表板、销售预测。

8a175664be2d76e06b571785d945f819870d2930

二、数据

考虑到最初的选择,我们可以在业务和数据的交叉点中移动最近的四个术语,目前在图片中表示为紫色区域。这是因为“初步数据报告”,“视觉报告”,“创建仪表板”和“销售预测”属于数据驱动的商业活动。外部可以基于过去的知识、经验和行为反对存在商业活动范围内的“商业案例研究’和‘定性分析’,但你很快就会看到——这不是真正的数据科学。

72ff620c74bc72f662c1814c3ddb30a76617ab47

分析(Analysis)是指将你的问题分割成容易消化的区块的过程,你可以单独研究它们之间是如何相互关联的。另一方面,分析(Analytics)是将逻辑和计算推理应用于分析中获得的组件部分。在这样做的过程中,人们在寻找模式,并经常探索人与分析能力的结合。因此,与业务,数据相反的是,我们应该要更好地使用Business Analytics和Data Analytics。

三、时间

在进一步讨论之前,让我们先介绍一个时间轴,因为这对于后续的分割是至关重要的。我们将分析三个时态——过去、现在和未来。会有一条线分割图表,指出任何分析问题的当前时刻。左边的分析指数代表过去,右边的所有这些都可以进行预测分析。

3778ed9fb1deb472b77187f69cc4123af8dcdbc6

“销售预测”移到了右边,因为它的名字暗示着一个前瞻性的分析过程。广义的“定性分析”就是利用你的直觉和经验来规划你的下一步——从而寓意着未来。

数据科学是一个不能没有数据的领域。因此,它完全属于Data Analytics(数据分析)的范畴。它与Business Analytics(业务分析)的关系如何?嗯,事实证明,如果属于Data Analytics和Business Analytics范畴内的,同时也的确属于Data Science范畴。

391296f9c367343207489dcf549da4d5f5c04826

不过,需要说明的是,存在不直接和即时业务分析但属于数据分析的数据科学流程。例如,“优化钻井业务”需要数据科学工具和技术。数据科学家很可能每天都这样做。但是,虽然在“石油业务”领域,我们不能真正说它与Business Analytics直接相关。

在“相对定义”的概念上,要更好地说明这些点,“数字信号处理”就是数据分析的一部分,但不是Data Science,也不是Business Analytics。数据、编程和数学开始发挥作用,但并不像我们在Data Science中使用它们一样。为了一致性,让我们用时间轴来完成这件事——数据科学既是左边的,也是右边的线(如同其他的)。这就给我们带来了一个问题:是不是所有的领域都具有“过去属性”?

四、商业智能

商业智能(BI)是分析和总结历史数据的过程。

c8a31bbe592761408c613ea22e1b5fb9a7a3785b

商业智能(BI)是否就一定意味着过去?不一定,但它没有涉及到预测分析。如图所示,回归、分类以及其他所有典型的预测方法都属于Data Science的一部分,但不是BI。而且,商业智能完全是数据科学的分支,因此,当一个人在处理过去事件时,用到描述性统计、报告或可视化时,这说明是在做BI和数据科学。

五、机器学习和人工智能

人工智能(AI)是由机器展示的任何形式的智能,它类似自然(人类)智能,例如规划、自适应学习、解决问题等。

机器学习(ML)是不被编程的情况下,机器预测结果的能力。

当然,机器学习是人工智能的一种方法,但这两种方法常常被混淆,不可否认地是,人类目前探索的阶段处于深度学习阶段,这实际上也是抵达人工智能唯一可行的路径,因此,当我们在谈论AI所使用的人工智能的真实应用时,我们实际上是指的是深度学习。

在我们的图表中,两个术语符合以下方式。

9f0800116da5c3a6b79e079bae4daf83c913eaf9

可以看出,机器学习完全包含在Data Analytics(数据分析)内,如果没有数据,它将不能执行,此外,它还与Data Science重叠,因为它是数据科学家兵库里最好的工具之一。此外,它还是BI的一部分,只是不涉及预测分析。

“数据科学”中的机器学习实例是“客户端保留”、“欺诈预防”和“创建实时仪表板”(也是BI的一部分),其中突出的应用包括“语音识别”和“图像识别”。这两者也被认为属于数据科学范畴,这就是为什么我们把它们放在边界上。

为了阐述其中的关系,总体来说,机器学习完全属于AI的一部分,但AI本身也存在一些与业务和数据分析无关的子领域,例如“符号推理”。

六、高级分析

我们分析的最后一个领域是Advanced Analytics,它不是一个数据科学名词,而是一个营销的名词。它用于描述“不那么容易处理的”分析。从本质上来说,对于一个初学者来说,这个图表中的所有内容都是先进的。虽然不是最好的术语,但肯定我们在整个条款中使用的所有“适当”术语都是有用的。

32bf879fc6ddcc7189a906ce78df2b95cff14160

排除AI并加入Advanced Analytics(高级分析),相信这将是极富价值的收获。


原文发布时间为:2018-08-14

本文来自云栖社区合作伙伴“大数据地盘”,了解相关信息可以关注“大数据地盘”。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
带你读《SAS数据分析开发之道 软件质量的维度》第三章通信交流3.2系统数字返回码(四)
带你读《SAS数据分析开发之道 软件质量的维度》第三章通信交流3.2系统数字返回码
22 0
SAS进阶《深入分析SAS》之数据汇总和展现
SAS进阶《深入分析SAS》之数据汇总和展现 1. 通过Print过程制作报表 proc print <data=数据集>; run; 选项: obs=修改观测序号列标签 noobs不显示观测序列号 id语句在输出中取代观测序列 var选择输出的变量 where语句选择输出的观测 总结如下: proc print data=数据集<选项&g
1212 0
【Work Like Alibaba】 时间紧、任务重的2017双11数据大屏项目如何实现高效协作
阿里巴巴在面对重要紧急项目中是如何高效协作和把控质量的?在阿里,不同岗位的员工如何高效协作?本文将带大家换一个视角感受阿里员工是如何思考和解决问题的,从阿里2017双11数据大屏项目设计师的角度探讨如何寻找“完美”设计与项目规划的平衡点。
3372 0
带你读《SAS数据分析开发之道 软件质量的维度》第三章通信交流3.3系统字母数字返回码(二)
带你读《SAS数据分析开发之道 软件质量的维度》第三章通信交流3.3系统字母数字返回码
20 0
带你读《SAS数据分析开发之道 软件质量的维度》第三章通信交流3.4用户生成的返回码(二)
带你读《SAS数据分析开发之道 软件质量的维度》第三章通信交流3.4用户生成的返回码
23 0
利用Clion对几种排序算法进行时间复杂度与空间复杂度的分析
算法 利用算法解决问题的步骤: 1、将问题模型化 2、找到一个合适的算法 3、这个算法足够快吗?对空间友好吗 4、如果不是,找出为什么 5、找到一个方法解决这个问题 6、一直迭代直到这个问题被解决 ...
1010 0
+关注
技术小能手
云栖运营小编~
7208
文章
9
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载