什么是企业数据仓库?

简介:

如今,数据分析已经成为帮助企业做出战略决策的关键。软件工具可以帮助企业发现模式或者发现各种流程的洞察。用于实施这些策略的数据系统通常作为供应商特定的企业数据仓库解决方案而存在。在这些应用程序中,信息被加载和结构化,以便从非常大的数据集合中提供最有效的结果。


数据仓库

数据仓库是用来提供新的业务洞察力的数据中心存储库。这些数据代表了业务的全面一致的观点。通常,这些历史数据集具有以下特征::

·面向主题:数据仓库通常提供特定的主题或业务需求,如销售或生产效率。

·时变性:数据是历史性的,因此可以用特定的时间框架来分析结果,例如在过去两年中按每月或按季度计算。企业数据仓库通常是由事务系统中封装的数据提供的,其中只有最近的数据是必需的。例如,事务系统可能只反映客户最近的电话号码,而数据仓库将包含所有以前使用的号码。

·集成性:数据仓库将来自多个不同来源的信息整合到同一视图中。例如,不同的商店可能具有相同产品的不同名称,但它们仍将具有相同的库存单元(SKU)或零件号。

·非易失性:存储在企业数据仓库中的信息不会改变。为了保持历史数据的完整性,它是只读的,从不改变。

什么样的数据加载到数据仓库?

业务数据操作几乎是实时的,例如从连锁商店在POS机终端捕获的销售信息。每日销售数据由系统捕获并送入数据文件。然后,这些文件将得到ETL(提取,转换和加载)软件或脚本的管理,或将该数据“归一化”到可直接上传到数据仓库表中的字段。

例如,一家大型零售连锁店将要捕捉销售商品的数据,例如,销售人员,商店,时间,付款方式,特别优惠或优惠券等等。另一家公司可能更有兴趣收集客户服务活动以进行定期绩效分析。

大多数存储的数据是关系型的。这意味着信息以能够与单个表链接的数字ID字段的形式存在,例如链接到文本的产品名称的产品ID列表和每个不同ID的描述。这可以节省企业数据仓库的空间,同时在数据报告中提供更有意义的信息。

数据仓库与传统数据库的区别

数据库通过捕获信息(无论是电子自动的还是人工采集的)来支持日常操作。这些也称为事务或操作数据库。它们主要用于从源头捕获信息。数据库还允许对信息进行编辑,以更加密切地反映真实世界的变化。它们针对数据输入进行了优化:协调小型而频繁的更新和添加。数据被组织成行或单个记录。

虽然这两个系统都可以用于报告,但数据仓库是为聚集大量固定信息而设计的。从事务数据中运行的报表中的信息可能会发生更改。

数据仓库主要用于报告和分析业务操作,以便识别模式。信息通常从一个或多个数据库中提取,成为数据仓库中的历史记录。数据仓库将反映所有的变化。大多数企业数据仓库解决方案要求以列或以维度(如时间或位置)的方式存储信息,以检索一系列度量单位,如美元或数量。这允许在相同的报告工具中深入了解各种细节。

数据集市

规模较小的公司,甚至大公司当接近一个特定的数据项目,可能将数据分割更小的、更有限的数据集,被称为“数据集市”。这样可以消除过多或不相关信息的运营开销。数据集市可以根据需要从数据仓库中提取,或者单独存在。

新公司或小公司可能不需要维护数据仓库。但是在大中型企业中,通常每天都使用事务性数据库和数据仓库。重要的区别是,企业数据仓库解决方案是只读和优化的,用于分析不断增长的业务数据,以支持业务决策。 


本文作者:Harris编译

来源:51CTO

相关文章
|
5月前
|
存储 数据管理 BI
揭秘数据仓库的奥秘:数据究竟如何层层蜕变,成为企业决策的智慧源泉?
【8月更文挑战第26天】数据仓库是企业管理数据的关键部分,其架构直接影响数据效能。通过分层管理海量数据,提高处理灵活性及数据一致性和安全性。主要包括:数据源层(原始数据)、ETL层(数据清洗与转换)、数据仓库层(核心存储与管理)及数据服务层(提供分析服务)。各层协同工作,支持高效数据管理。未来,随着技术和业务需求的变化,数仓架构将持续优化。
90 3
|
8月前
|
存储 机器学习/深度学习 数据采集
【专栏】在数字化时代,数据仓库和数据湖成为企业管理数据的关键工具
【4月更文挑战第27天】在数字化时代,数据仓库和数据湖成为企业管理数据的关键工具。数据仓库是经过规范化处理的结构化数据集合,适合支持已知业务需求;而数据湖存储原始多类型数据,提供数据分析灵活性。数据仓库常用于企业决策、财务分析,而数据湖适用于大数据分析、机器学习和物联网数据处理。企业需根据自身需求选择合适的数据存储方式,以挖掘数据价值并提升竞争力。理解两者异同对企业的数字化转型至关重要。
146 2
|
SQL 存储 分布式计算
Serverless数据仓库探索,助力企业敏捷数据分析
本文介绍了如何通过通过Serverless的OLAP产品,帮助企业升级至更加敏捷的分析平台架构,大幅简化架构复杂度并提高分析效率。
Serverless数据仓库探索,助力企业敏捷数据分析
|
8月前
|
SQL 存储 数据挖掘
Serverless数据仓库实践,助力企业敏捷数据分析
现代的云原生数据仓库架构传统的云数据仓库需要用户购买一个预置的数据资源进行7*24的长时间运行;这种方式对于当下崇尚敏捷创业者来说使用负担较大,对于探索类或成长型业务缺少灵活的使用模式以满足低成本数据分析诉求;随着这个问题被越来越多的企业关注,Serverless的使用方式开始逐渐被各大厂商提及,B...
Serverless数据仓库实践,助力企业敏捷数据分析
|
SQL 存储 分布式计算
Serverless数据仓库实践,助力企业敏捷数据分析
敏捷云原生数据仓库架构传统的云数据仓库需要用户购买一个预置的数据资源进行7*24的长时间运行;这种方式对于当下崇尚敏捷创业者来说使用负担较大,对于探索类或成长型业务缺少灵活的使用模式以满足低成本数据分析诉求;随着这个问题被越来越多的企业关注,Serverless的使用方式开始逐渐被各大厂商提及,Big Query, Snowflake,Redshift等都进行了类似的布局,而国内的数仓产品还处于探
Serverless数据仓库实践,助力企业敏捷数据分析
|
存储 关系型数据库 数据挖掘
一份【疫情礼包】请查收,云数据仓库AnalyticDB PostgreSQL为中国企业加油
疫情肆虐下,企业的生存面临着前所未有的挑战。 AnalyticDB PostgreSQL 希望为中国企业贡献一份力量!
375 1
|
存储 Cloud Native NoSQL
企业数据如何存储?阿里云云原生数据仓库大揭秘 | 开发者社区精选文章合集(九)
面对海量数据,如何存储?如何保证存储数据不丢不错?本合集带你揭秘阿里云云原生数据仓库核心技术!
企业数据如何存储?阿里云云原生数据仓库大揭秘 | 开发者社区精选文章合集(九)
|
存储 SQL Cloud Native
阿里云“万仓计划”重磅发布,助力每个企业构建属于自己的云原生数据仓库
“万仓计划”推出“免费实时一键建仓服务”、“1元体验的云原生数据仓库”、“完善的开发者生态及应用生态”等一整套方案,助力企业低成本、低门槛构建属于自己的数据仓库。
阿里云“万仓计划”重磅发布,助力每个企业构建属于自己的云原生数据仓库
|
存储 Cloud Native 关系型数据库
金融数据智能峰会 | 数据规模爆炸性增长,企业如何进行精准决策?云原生数据仓库数据化运营实战分享
在日前的2021阿里云金融数据智能峰会——《云原生驱动数智化运营的“增长黑马”》专场上,阿里云数据库资深技术专家魏闯先 从数据价值链路角度切入,为大家解读云原生数据仓库如何支撑数据化运营、全链路营销和阿里集团双11业务,并展示金融客户最佳实践案例和应用场景。本文内容根据演讲录音及PPT整理而成。
654 0
金融数据智能峰会 | 数据规模爆炸性增长,企业如何进行精准决策?云原生数据仓库数据化运营实战分享

热门文章

最新文章