数据仓库的基本特征

简介: 面向主题:主题是一个在较高层次将数据归类的标准,每一个主题基本对应一个宏观的领域,基于主题组织的数据被划分为各自独立的领域,每一个领域都有自己的逻辑内涵互不交叉,如:产品,客户,销售,财政收入等。

面向主题:

主题是一个在较高层次将数据归类的标准,每一个主题基本对应一个宏观的领域,基于主题组织的数据被划分为各自独立的领域,每一个领域都有自己的逻辑内涵互不交叉,如:产品,客户,销售,财政收入等。因此,在数据进入数据仓库之前,必然要经过加工和集成,将原始数据结构做一个从面向应用到面向主题的大转变。

集成特性

指数据仓库能将多个异种数据源,如关系数据库、一般文件、层次数据库和网络结构化的数据库等集成在一起。在数据进入数据仓库之前,必须经过数据加工和集成,统一原始数据中的矛盾之处,确保命名约定、编码、结构、属性度量、冲突键码等的一致性

非易失

指数据存入数据仓库后基本上不再改变

时变的

指数据项与时间点有关,两层涵义:

数据仓库是不同时间的数据集合,它要求数据仓库中的数据保存时限能满足进行决策分析的需要(例如:过去的510年),而且数据仓库中的数据都要标明该数据的历史时期。

 
相关文章
|
缓存 Java API
JVM 四种引用和使用场景
在JDK 1.2之后,Java对引用的概念进行了扩充,将引用分为强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Weak Reference)、虚引用(Phantom Reference)四种,Java 4种引用的级别由高到低依次为:强引用 > 软引用 > 弱引用 > 虚引用。
214 0
|
消息中间件 设计模式 SQL
从Lambda架构到Kappa架构再到?浅谈未来数仓架构设计~
Linked大佬Jay Kreps曾发表过一篇博客,简单阐述了他对数据仓库架构设计的一些想法。从Lambda架构的缺点到提出基于实时数据流的Kappa架构。本文将在Kappa架构基础上,进一步谈数仓架构设计。 现代实时数仓和重要性已经越来越高,离线数仓积累的历史数据又很难被抛弃。采用新型的数仓架构,融合实时数仓和离线数仓的优点是一个值得讨论的话题。本文结合ECS的设计模式,探讨了如何设计了一套全新的混合数仓架构。
17844 0
|
资源调度 监控 数据处理
【Flink】Flink集群有哪些角色?各自有什么作用?
【4月更文挑战第18天】【Flink】Flink集群有哪些角色?各自有什么作用?
|
关系型数据库 MySQL 索引
【Database】排错:Mysql5.6报错Specified key was too long; max key length is 767 bytes
在某个实验系统部署的过程中,出现mysql报错,是特定版本的处理错误,在查阅官网文档时得到解决方案
1741 0
【Database】排错:Mysql5.6报错Specified key was too long; max key length is 767 bytes
|
算法 安全 编译器
【C++ 关键字 override】C++ 重写关键字override(强制编译器检查该函数是否覆盖已存在的虚函数)
【C++ 关键字 override】C++ 重写关键字override(强制编译器检查该函数是否覆盖已存在的虚函数)
764 0
|
IDE Java 应用服务中间件
如何检查并解决类路径中的类库版本冲突问题
类路径中的类库版本冲突可能导致应用运行异常。解决方法包括:1. 使用依赖管理工具(如Maven、Gradle)检查依赖树,找出冲突的库;2. 调整依赖版本或排除特定版本;3. 清理缓存,重新构建项目。
516 2
|
自然语言处理 数据处理 调度
《Havenask分布式索引构建服务--Build Service》
Havenask是阿里巴巴智能引擎事业部自研的开源高性能搜索引擎,深度支持了包括淘宝、天猫、菜鸟、高德、饿了么在内几乎整个阿里的搜索业务。本文针对性介绍了Havenask分布式索引构建服务——Build Service,主打稳定、快速、易管理,是在线系统提升竞争力的一大利器。
102372 3
《Havenask分布式索引构建服务--Build Service》
|
存储 消息中间件 分布式计算
flink的常见知识点总结(一)
flink的常见知识点总结(一)
|
存储 SQL 运维
流批一体在 AI 核心电商领域的探索与实践
搜索、推荐、广告等核心电商领域,涉及海量的电商、用户行为等数据,需要支持大规模深度模型参数更新,是一个典型的批次/实时计算结合的场景,阿里智能引擎事业部基于大数据存储和计算引擎技术(Flink),针对复杂业务特点,简化用户 ETL 开发流程。
流批一体在 AI 核心电商领域的探索与实践
|
机器学习/深度学习 并行计算 C语言
推荐几个不错的CUDA入门教程(非广告)
推荐几个不错的CUDA入门教程(非广告)
1011 1