前 言
概述
数据虚拟化是一种转化异构数据库集合和文件的技术,这种技术使得这些数据看起来像一种集成的数据。在用于商务智能系统时,它可以使数据架构更简单、更便宜,最重要的是更敏捷。新的报告和分析需求可以更快实施,现有系统可以更容易改变。这就需要增加敏捷性:一方面,商务用户需要其系统提供更多的敏捷性,因为他们的世界已经开始改变;另一方面,商务智能的新形式,如运营报告、大数据分析、360氨ǜ妗⒆灾癖ǜ婧吞剿餍苑治觯际堑鼻暗男枨蟆1臼橹铝τ谑菪槟饣际跻约叭绾斡行У卦谏涛裰悄芟低持欣酶眉际酢R虼巳梦颐谴悠鸬憧迹有槟饣肌?
在IT行业,我们已经进入了虚拟化时代。似乎这一行业中的任何东西都可以虚拟化,包括内存、外存、网络和数据中心。虚拟化技术很热门,比如云技术的普及也可以归类为虚拟化技术。虚拟化技术就是热点,并且在一段时间内都将是技术的焦点。
所有虚拟化技术和概念的共同点是它们封装了某个资源。任何虚拟化解决方案都隐藏了可用资源的数量、资源的位置以及获取资源所需的API等。但不要将虚拟化与一些电脑游戏所提供的虚拟世界混淆。这些游戏提供了一些虚拟的东西,但它们并没有封装特定的资源。
本书将解释一种特定形式的虚拟化:数据虚拟化。简而言之,数据虚拟化意味着将数据以集成的方式提供给应用程序,而不管所有数据是否分布在多个数据库中,是否以不同格式存储,是否可通过不同的数据库语言进行访问。数据虚拟化技术将这些不同的数据存储作为一个逻辑数据库呈现给应用程序。虽然数据虚拟化产品和技术已经存在了一段时间,但是大约在2009年,它才逐步得到了应有的关注。因为它对解决方案的影响—增加的敏捷性,所以越来越多的组织正在采用虚拟化技术,似乎可以认为21世纪的第二个十年将成为数据虚拟化的十年。
数据虚拟化可以部署在需要检索和操作数据的所有类型的信息系统中,例如经典数据输入系统、基于因特网的系统、面向服务的系统、主数据管理系统和商务智能系统。本书的重点是商务智能系统。数据虚拟化可用于整合来自各种数据源的数据,包括数据仓库、数据集市和生产型数据库。它有潜力改变我们开发商务智能系统的方式。数据虚拟化将成为大多数这类系统的心脏。
简而言之,数据虚拟化允许我们使用更简单和更灵活的架构构建商务智能系统。如果你想知道怎么做和为什么,本书就是为你而写的!本书将详细描述数据虚拟化产品的工作原理、技术应用、应该做什么和不做什么,以及在商务智能系统中应用它的好处。
谁应该阅读这本书?
本书适合以下人群:
负责开发和管理数据仓库和商务智能环境的商务智能专家,以及那些想知道如何通过应用数据虚拟化技术来简化系统或实现更灵活的商务智能系统的人。
信息管理专家,想知道数据虚拟化对其职业的影响,以及数据虚拟化将如何影响信息管理、数据管理、数据库设计、数据清洗和数据分析等活动。
主数据管理专家,负责创建主数据管理系统,并希望了解如何从部署数据虚拟化中受益。
数据架构师,负责设计数据的整体系统架构,用来向特定组织的任何机构提供所需要的数据。
数据库管理员,必须了解数据虚拟化服务器的特性和限制,用于确定如何以及在何处可以有效且高效地应用此技术。
设计师、分析师和顾问,必须直接或间接处理数据虚拟化,以及想知道数据虚拟化所能做的和不能做的。
学生,想要学习数据虚拟化技术,以及理解数据虚拟化技术与其他数据处理相关技术的区别。
预备知识
关于数据仓库、商务智能和数据库技术的一般性知识是必需的。
术语和定义
遗憾的是,数据虚拟化和数据仓库领域中使用的所有术语并非都是明确定义的,这一点在本书中讲得很清楚。为了避免混淆,我们试图清晰地定义大多数术语。但是,我们不能保证本书中的定义与你的定义一致。
造成这种混乱的原因很多。第一个原因是,供应商纯粹为了区分自己的产品和竞争对手的产品而经常提出新的术语,但营销人员不定义术语,他们只使用这些术语并用一般术语来描述产品。在大家意识到这一点之前,我们都在使用那些定义不明确或根本没有定义的术语。第二个原因是,这个领域发展非常迅速,在较短的时间内就可能要为新思维创造某种术语,并提出权衡性定义。结果,我们可能会匆忙地选择一个术语,而经过仔细检查后才发现它并不合适。
目 录
第1章 数据虚拟化导论
1.1 引言
1.2 商务智能世界正在改变
1.3 虚拟化简介
1.4 什么是数据虚拟化
1.5 数据虚拟化与相关概念
1.5.1 数据虚拟化与封装和信息隐藏
1.5.2 数据虚拟化与抽
1.5.3 数据虚拟化与数据联合
1.5.4 数据虚拟化与数据集成
1.5.5 数据虚拟化与企业信息集成
1.6 数据虚拟化的定义
1.7 数据虚拟化的技术优势
1.8 数据虚拟化的不同实现
1.9 数据虚拟化服务器概述
1.10 开放式与封闭式数据虚拟化服务器
1.11 数据集成的其他方式
1.12 数据虚拟化服务模型
1.13 数据虚拟化的历史
1.14 示例数据库:世界一流电影
1.15 本书结构
第2章 商务智能和数据仓库
2.1 引言
2.2 什么是商务智能
2.3 管理层次与决策制定
2.4 商务智能系统
2.5 商务智能系统的数据存储
2.5.1 数据仓库
2.5.2 数据集市
2.5.3 数据中转区
2.5.4 可操作数据存
2.5.5 个人数据存储
2.5.6 不同类型数据存储的对比
2.6 标准化模式、星形模式和雪花模式
2.6.1 标准化模式
2.6.2 非标准化模式
2.6.3 星形模式
2.6.4 雪花模式
2.7 提取-转换-装载、提取-装载-转换和复制
2.7.1 提取-转换-装载
2.7.2 提取-装载-转换
2.7.3 复制
2.8 商务智能架构总览
2.9 报告和分析的新形式
2.9.1 运营报告和分析
2.9.2 深度和大数据分析
2.9.3 自助式报告和分析
2.9.4 无限制的自组织分析
2.9.5 360
2.9.6 探索性分析
2.9.7 基于文本的分析
2.10 传统商务智能系统的劣势
2.11 总结
第3章 数据虚拟化服务器:构造模块
3.1 引言
3.2 数据虚拟化服务器的高层架构
3.3 导入源表和定义封装器
3.4 定义虚拟表和映射
3.5 虚拟表和映射的例子
3.6 虚拟表和数据建模
3.7 嵌套虚拟表和共享规范
3.8 导入非关系数据
3.8.1 XML和JSON文档
3.8.2 Web服务
3.8.3 电子表格
3.8.4 NoSQL数据库
3.8.5 多维数据集和MDX
3.8.6 半结构化数据
3.8.7 非结构化数据
3.9 发布虚拟表
3.10 互联网数据模型
3.11 可更新的虚拟表和事务管理