多维度数据分析-阿里云开发者社区

开发者社区> 数据库> 正文
登录阅读全文

多维度数据分析

简介:

在零售业中,数据分析大多采用汇总、对比、趋势预测、交叉等几类方法,尤其是交叉分析使用率颇高。交叉分析,顾名思义,是指对数据在不同维度进行交叉展现,进行多角度结合分析的方法,弥补了独立维度进行分析没法发现的一些问题。可以说,数据分析的维度弥补了众多分析方法的独立性,让各种方法通过不同属性的比较,细分,使分析结果更有意义。
横看成岭侧成峰。我们在看待事物的时候,如果从不同角度看,往往会得出不同的结果。在对业务数据进行分析时,也会有这种现象。如现在对某个区域的销售数据进行分析。如果以年销售额来分析的话,也许可以发现每年的销售收入都在成比例增长。这是一个不错的结果。但是如果从客户的角度出发进行分析,管理员可能会发现一些老客户的销售额在逐渐降低。

什么是数据分析的维度?

我们如何理解多维数据中的维?维是人们观察事物的角度,同样的数据从不同的维进行观察可能会得到不同的结果,同时也使人们更加全面和清楚地认识事物的本质。


当数据有了维的概念之后,便可对数据进行多维分析操作,常见的多维分析操作主要有:钻取(上钻和下钻)、切片、切块、旋转。钻取:钻取是改变维度的层次,变换分析的粒度。钻取包括上钻和下钻,上钻是在某一维上将低层次的细节数据概括到高层次的汇总数据的过程,减少了分析的维数;下钻则是相反,它是将高层次的汇总数据进行细化,深入到低层次细节数据的过程,增加了分析的维数。切片和切块:在多维分析中,如果在某一维度上限定了一个值,则称为对原有分析的一个切片,如果对多个维度进行限定,每个维度限定为一组取值范围,则称为对原有分析的一个切块。在多维分析中,维度都是按某一顺序进行显示,如果变换维度的顺序和方向,或交换两个维度的位置,则称为旋转。

多维度数据分析的典型描述

比如一个典型的商品销售数据库,记录了商品销售的详细情况,则我们可从这么几个方面来对销售数据进行分析:从产品的角度,可以按产品的类别、品牌、型号来查看产品的销售情况;从客户的角度,可以按客户的类别、地区等来查看产品的购买情况;从销售代表的角度,可以按销售代表的部门、级别等来查看产品销售业绩;从时间的角度,可以按年度、季度、月份等来观察产品销售的变动情况。其中产品、客户、销售代表、时间分别是四个不同的维度,每个维度都从不同方面体现了销售数据的特征,而每个维度又可按粒度的不同划分成多个层次,称为维度成员,多维分析中另一个重要的概念是数据指标,简称指标,指标代表了数据中的可度量的属性,在上面的销售数据中有两个重要的指标是销售数量和销售金额。

多维度数据分析的典型案例


看起来还不错,显示的信息非常丰富,左边包含了以天为单位时间维和产品维,可以使用展开按钮进行汇总和展开,就像是细分的操作;上面的表头部分分两层罗列了地域维和指标维,Excel的透视表提供了丰富的设置,默认展现基于各个维度的汇总数据,让我们可以从“总-分”的角度观察数据,这对数据分析非常有用。假如我们使用上面的透视表进行交叉分析发现数据是否存在异常?

使用从总体到细节的分析方法,首先可以从查看每天销售额和转化率的汇总数据开始,折叠产品维之后观察最右侧的指标汇总列就可以看到每日汇总数据;如果某一天的销售额或转化率出现了大幅的下滑,我们就可以结合各种维度寻找问题的原因,就是基于各种维度的细节数据,展开产品维观察当天的哪类产品销售出现了问题,然后结合地域维的交叉数据,可以定位哪类商品在哪个省份的销售出现了问题,这样就有效地将问题定位到了细节的层面,能够更好地发现问题,进而解决问题。所以交叉分析其实正是体现了分析“分而析之”的本意。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享: