关于数据仓库-Inmon-企业信息工厂(CIF)概览

本文涉及的产品
阿里云百炼推荐规格 ADB PostgreSQL,4核16GB 100GB 1个月
简介:
翻译总是一件很痛苦的事情,看着别人翻译的很烂,心里总是会暗暗骂上几句,当自己翻译的时候,才了解翻译的痛苦。。。
关于DW2.0和CIF,我没什么直观的感觉,数据仓库终究还是数据仓库。。。

Corporate Information Factory (CIF) Overview

企业信息工厂 (CIF)概览

 
 
摘要描述 
Operational Systems are the internal and external core systems that support the day-to-day business operations. They are accessed through application program interfaces (APIs) and are the source of data for the data warehouse and operational data store. (Encompasses all operational systems including ERP, relational and legacy.)
业务系统 是支持日常业务操作的内外部的核心系统。通常它们可以通过应用程序接口 (APIs) 进行访问,同时也是数据仓库和 ODS 系统的数据源。 ( 包括所有的业务系统例如 ERP ,相关和遗留的系统等等 )
 
Data Acquisition is the set of processes that capture, integrate, trans-form, cleanse, reengineer and load source data into the data warehouse and operational data store. Data reengineering is the process of investigating, standardizing and providing clean consolidated data.
数据获取 是获取,集成,转换,清洗,重构和数据加载到数据仓库和 ODS系统的一系列的过程。数据重构是调研、标准化以及清洗统一数据的过程。
 
The Data Warehouse is a subject-oriented, integrated, time-variant, non-volatile collection of data used to support the strategic decision-making process for the enterprise. It is the central point of data integration for business intelligence and is the source of data for the data marts, delivering a common view of enterprise data.
数据仓库 是基于主题的、集成的、时变的、非易失的数据的集合,为企业的战略决策制定过程提供支持。这是商业智能数据集成的核心,也是数据集市的数据源,同时提供了一个企业数据的公共视图。
 
Primary Storage Management consists of the processes that manage data within and across the data warehouse and operational data store. It includes processes for backup and recovery, partitioning, summarization, aggregation, and archival and retrieval of data to and from alternative storage.
基本存储管理 由数据仓库和 ODS中管理数据的一系列过程构成。它包含备份和恢复、分区、摘要、聚合、从替代存储中归档和恢复的一系列过程。
 
Alternative Storage is the set of devices used to cost-effectively store data warehouse and exploration warehouse data that is needed but not frequently accessed. These devices are less expensive than disks and still provide adequate performance when the data is needed.
替代存储 是这样一套设备,通常被用来低成本且有效的存储数据仓库数据,同时能够探测和访问那些必要但是低访问率的数据仓库数据。这些设备一般比磁盘便宜,同时能够提供足够的性能,当访问数据的时候。
 
Data Delivery is the set of processes that enable end users and their supporting IS group to build and manage views of the data warehouse within their data marts. It involves a three-step process consisting of filtering, formatting and delivering data from the data warehouse to the data marts.
数据交付 是一套能够保证终端用户和决策支持群组构建和管理数据仓库视图的过程。它包括 3个步骤:从数据仓库中过滤、格式化、交付数据到数据集市中。
 
The Data Mart is customized and/or summarized data derived from the data warehouse and tailored to support the specific analytical requirements of a business unit or function. It utilizes a common enterprise view of strategic data and provides business units more flexibility, control and responsibility. The data mart may or may not be on the same server or location as the data warehouse.
数据集市 是来源于数据仓库的定制化数据或者摘要数据,裁减后用来满足对业务功能的特殊分析需求。它利用企业的公共视图,向企业单元提供更大的弹性、控制和响应。数据集市和数据仓库不一定在同一台服务器和同一位置。
 
The Operational Data Store (ODS) is a subject-oriented, integrated, current, volatile collection of data used to support the tactical decision-making process for the enterprise. It is the central point of data integration for business management, delivering a common view of enterprise data.
ODS 是基于主题的、集成的、当前的、易失的数据的集合,用来向企业提供决策支持。这是业务管理中数据集成的核心,同时交付企业数据的公共视图。
 
Meta Data Management is the process for managing information needed to promote data legibility, use and administration. Contents are described in terms of data about data, activity and knowledge.
元数据管理 是提供数据可理解、使用和管理的管理信息的过程。主要用来记录数据、行为和知识。
 
The Exploration Warehouse is a DSS architectural structure whose purpose is to provide a safe haven for exploratory and ad hoc processing. An exploration warehouse utilizes data compression to provide fast response times with the ability to access the entire database.
探测数据仓库 是决策支持架构,它的目的是为探测和增强查询提供安全接口。一个探测数据仓库利用数据压缩技术提供快速响应能力。
 
The Data Mining Warehouse is an environment created so analysts may test their hypotheses, assertions and assumptions developed in the exploration warehouse. Specialized data mining tools containing intelligent agents are used to perform these tasks.
数据挖掘仓库 是在探测数据仓库中开发的,分析员能够测试他们假设、推断、设想的创建的环境。专业的数据挖掘功能包括用来实施该任务的智能代理。
 
Activities are the events captured by the enterprise legacy and/or ERP systems as well as external transactions such as Internet interactions.
行为 是通过企业遗产系统或 ERP系统获取的事件,同时也包括向互联网交互的外部交易。
 
Statistical Applications are set up to perform complex, difficult statistical analyses such as exception, means, average and pattern analyses. The data warehouse is the source of data for these analyses. These applications analyze massive amounts of detailed data and require a reasonably performing environment.
统计应用 是被用来实施复杂的、难度较大的统计分析,例如异常、方法、平均值和方式分析。数据仓库是这些分析的数据源。这类应用能够分析大量明细数据,同时也需要一个适度的实施环境。
 
Analytic Applications are pre-designed, ready-to-install, decision sup-port applications. They generally require some customization to fit the specific requirements of the enterprise. The source of data is the data warehouse. Examples of these applications are risk analysis, database marketing (CRM) analyses, vertical industry "data marts in a box," etc.
分析应用 是预设计、预安装、决策支持应用。这通常需要一些定制工作,来满足企业的特殊需求。它的源数据来自于数据仓库。这些应用的例子通常是风险分析、 CRM分析等等。
 
External Data is any data outside the normal data collected through an enterprise's internal applications. There can be any number of sources of external data such as demographic, credit, competitor and financial information. Generally, external data is purchased by the enterprise from a vendor of such information.
外部数据 是由企业内部应用系统采集的常规数据之外的所有数据。可能有许多的外部数据源例如人口统计、信用卡、竞争对手信息和财务信息。但是通常情况下,外部数据源是企业从外部信息提供商购买的。






本文转自baoqiangwang51CTO博客,原文链接:http://blog.51cto.com/baoqiangwang/309763 ,如需转载请自行联系原作者
相关文章
|
8月前
|
存储
云数据仓库ADB存储节点信息?
云数据仓库ADB存储节点信息?
80 1
|
5月前
|
存储 数据管理 BI
揭秘数据仓库的奥秘:数据究竟如何层层蜕变,成为企业决策的智慧源泉?
【8月更文挑战第26天】数据仓库是企业管理数据的关键部分,其架构直接影响数据效能。通过分层管理海量数据,提高处理灵活性及数据一致性和安全性。主要包括:数据源层(原始数据)、ETL层(数据清洗与转换)、数据仓库层(核心存储与管理)及数据服务层(提供分析服务)。各层协同工作,支持高效数据管理。未来,随着技术和业务需求的变化,数仓架构将持续优化。
90 3
|
5月前
|
存储 NoSQL 关系型数据库
MPP架构数据仓库使用问题之Visibility bitmap表被删除的文件信息是如何记录的
MPP架构数据仓库使用问题之Visibility bitmap表被删除的文件信息是如何记录的
|
8月前
|
存储 机器学习/深度学习 数据采集
【专栏】在数字化时代,数据仓库和数据湖成为企业管理数据的关键工具
【4月更文挑战第27天】在数字化时代,数据仓库和数据湖成为企业管理数据的关键工具。数据仓库是经过规范化处理的结构化数据集合,适合支持已知业务需求;而数据湖存储原始多类型数据,提供数据分析灵活性。数据仓库常用于企业决策、财务分析,而数据湖适用于大数据分析、机器学习和物联网数据处理。企业需根据自身需求选择合适的数据存储方式,以挖掘数据价值并提升竞争力。理解两者异同对企业的数字化转型至关重要。
146 2
|
6月前
|
SQL 存储 运维
云原生数据仓库使用问题之如何查看分区表的分区信息
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
|
SQL 存储 分布式计算
Serverless数据仓库探索,助力企业敏捷数据分析
本文介绍了如何通过通过Serverless的OLAP产品,帮助企业升级至更加敏捷的分析平台架构,大幅简化架构复杂度并提高分析效率。
Serverless数据仓库探索,助力企业敏捷数据分析
|
8月前
|
SQL 存储 数据挖掘
Serverless数据仓库实践,助力企业敏捷数据分析
现代的云原生数据仓库架构传统的云数据仓库需要用户购买一个预置的数据资源进行7*24的长时间运行;这种方式对于当下崇尚敏捷创业者来说使用负担较大,对于探索类或成长型业务缺少灵活的使用模式以满足低成本数据分析诉求;随着这个问题被越来越多的企业关注,Serverless的使用方式开始逐渐被各大厂商提及,B...
Serverless数据仓库实践,助力企业敏捷数据分析
|
SQL 存储 分布式计算
Serverless数据仓库实践,助力企业敏捷数据分析
敏捷云原生数据仓库架构传统的云数据仓库需要用户购买一个预置的数据资源进行7*24的长时间运行;这种方式对于当下崇尚敏捷创业者来说使用负担较大,对于探索类或成长型业务缺少灵活的使用模式以满足低成本数据分析诉求;随着这个问题被越来越多的企业关注,Serverless的使用方式开始逐渐被各大厂商提及,Big Query, Snowflake,Redshift等都进行了类似的布局,而国内的数仓产品还处于探
Serverless数据仓库实践,助力企业敏捷数据分析
|
存储 关系型数据库 数据挖掘
一份【疫情礼包】请查收,云数据仓库AnalyticDB PostgreSQL为中国企业加油
疫情肆虐下,企业的生存面临着前所未有的挑战。 AnalyticDB PostgreSQL 希望为中国企业贡献一份力量!
375 1
|
存储 Cloud Native NoSQL
企业数据如何存储?阿里云云原生数据仓库大揭秘 | 开发者社区精选文章合集(九)
面对海量数据,如何存储?如何保证存储数据不丢不错?本合集带你揭秘阿里云云原生数据仓库核心技术!
企业数据如何存储?阿里云云原生数据仓库大揭秘 | 开发者社区精选文章合集(九)

热门文章

最新文章