数据仓库复习(三)

简介: 维度与指标剖析

指标

  • 指标是衡量事务发展的标准,也叫度量,如平均值、最大值、最小值
  • 指标分为绝对数值和相对数值,绝对数值反映具体的大小和多少、如价格、分数

维度

  • 维度是事务的特征,如颜色、区域、时间等
  • 定性维度就是字符类型的特征,比如区域维度包括全国各省份
  • 定量维度就是数值类型的特征,如价格区间、销量区间

识别维度

IP 访问时间 课程ID
127.0.0.1 2019-10-01 00:00:00 10010
127.0.0.1 2019-10-01 01:00:00 10011
127.0.0.1 2019-10-01 02:00:00 10011

如上表:

按时间分析课程访问量,时间维度是课程访问量的分析依据,时间维度和业务中的课程访问量是对应的。

作为运营方会关注按时间段分析课程的访问量,作为教育机构则关注单个课程的访问量,都是课程访问量指标根据不同的维度去分析得到结果不同,这就是维度分析。

维度分层级

如:

  • 时间维度:一个层次四个级别:年、月、天、小时
  • 地区维度:一个层次三个级别:省、市、县

下钻与上卷

把获取高级别的汇总信息的过程叫上卷,把获取低级别的明细信息的过程叫下钻,比如:课程访问量分析,时间维度有四个级别,分别是年、月、天、小时,现在我们某个级别分析每天的课程访问量,比如按天分析课程访问量,此时我们可以按小时下钻分析,得出一天内每小时的课程访问量,也可以按月上卷,得到月度的课程访问量。

如:

下钻维度:

天、小时

上卷维度:

年、月

目录
相关文章
|
5月前
|
存储 数据采集 数据挖掘
【软件设计师备考 专题 】数据仓库和分布式数据库基础知识
【软件设计师备考 专题 】数据仓库和分布式数据库基础知识
253 0
|
存储 数据挖掘 大数据
第16章 数据仓库与联机分析处理技术——复习笔记
第16章 数据仓库与联机分析处理技术——复习笔记
|
SQL Oracle 关系型数据库
数据仓库入门教程
数据仓库入门教程
425 0
|
存储 数据挖掘 数据管理
数据仓库概论
数据仓库,英文名称Data Warehouse,可简写为DW和DWH,数据仓库顾名思义,是一个很大的数据存储集合,出于企业的分析性报告和决策支持目的而创建,它为企业提供一定的BI(商业智能)能力,指导业务流程改进、监视时间、成本、质量以及控制。数据库:数据库是面向交易的处理系统,它是针对具体业务在数据库联机的日常操作,通常对记录进行查询、修改。数据仓库的输入方式各种各样的数据源,最终的输出用于企业的数据分析、数据挖掘、数据报表等方向。数据库是面向事务的设计,数据仓库是面向主题设计的。数据库和数据仓库区别。
314 0
|
存储 数据采集 大数据
数据仓库面试知识总结
数据仓库面试知识总结
数据仓库面试知识总结
|
SQL 分布式计算 大数据
数据仓库实战教程
数据仓库已经是企业的数据竞争的核心了,学好数据仓库对提高自己和找到一份好的工作都至关重要,但是很多人对数仓的印象还是停留在写SQL的层面,其实今天的数仓更像是一个数据平台应用,我们学习的大数据技术其实最终的价值都体现在数据服务上,数仓是数据服务的基石,如果说业界以前还有离线和实时之分的话,那么现在实时数仓的提出与落地,未来数仓将是数据战争的最激烈的战场,一切大数据技术都将为数仓提供服务,也都将在数仓这一环节进行收口。 本专栏主要专注于数仓工具学习、数仓建模以及业务建模、SQL 实战和平台建设,最后以3家公司的数仓建建设和实时数仓作为结尾项目,这份教程有以下特点 1. 知识体系完善,从数仓的
817 2
|
SQL 存储 数据采集
数据仓库工程师面试题
数据仓库工程师面试题
数据仓库复习(六)
数仓建模-维度建模法
92 0
|
数据挖掘 OLAP OLTP
数据仓库复习(一)
对数据仓库基本内容进行概述
156 0
|
数据建模
数据仓库复习(七)
数仓建模-实体建模法
94 0