《数据虚拟化:商务智能系统的数据架构与管理》一 导读

简介: 遗憾的是,数据虚拟化和数据仓库领域中使用的所有术语并非都是明确定义的,这一点在本书中讲得很清楚。为了避免混淆,我们试图清晰地定义大多数术语。但是,我们不能保证本书中的定义与你的定义一致。

b9d86fc6039950fad8c12876793bcbe1d63b16c5

前  言

概述
数据虚拟化是一种转化异构数据库集合和文件的技术,这种技术使得这些数据看起来像一种集成的数据。在用于商务智能系统时,它可以使数据架构更简单、更便宜,最重要的是更敏捷。新的报告和分析需求可以更快实施,现有系统可以更容易改变。这就需要增加敏捷性:一方面,商务用户需要其系统提供更多的敏捷性,因为他们的世界已经开始改变;另一方面,商务智能的新形式,如运营报告、大数据分析、360氨ǜ妗⒆灾癖ǜ婧吞剿餍苑治觯际堑鼻暗男枨蟆1臼橹铝τ谑菪槟饣际跻约叭绾斡行У卦谏涛裰悄芟低持欣酶眉际酢R虼巳梦颐谴悠鸬憧迹有槟饣肌?
在IT行业,我们已经进入了虚拟化时代。似乎这一行业中的任何东西都可以虚拟化,包括内存、外存、网络和数据中心。虚拟化技术很热门,比如云技术的普及也可以归类为虚拟化技术。虚拟化技术就是热点,并且在一段时间内都将是技术的焦点。
所有虚拟化技术和概念的共同点是它们封装了某个资源。任何虚拟化解决方案都隐藏了可用资源的数量、资源的位置以及获取资源所需的API等。但不要将虚拟化与一些电脑游戏所提供的虚拟世界混淆。这些游戏提供了一些虚拟的东西,但它们并没有封装特定的资源。
本书将解释一种特定形式的虚拟化:数据虚拟化。简而言之,数据虚拟化意味着将数据以集成的方式提供给应用程序,而不管所有数据是否分布在多个数据库中,是否以不同格式存储,是否可通过不同的数据库语言进行访问。数据虚拟化技术将这些不同的数据存储作为一个逻辑数据库呈现给应用程序。虽然数据虚拟化产品和技术已经存在了一段时间,但是大约在2009年,它才逐步得到了应有的关注。因为它对解决方案的影响—增加的敏捷性,所以越来越多的组织正在采用虚拟化技术,似乎可以认为21世纪的第二个十年将成为数据虚拟化的十年。
数据虚拟化可以部署在需要检索和操作数据的所有类型的信息系统中,例如经典数据输入系统、基于因特网的系统、面向服务的系统、主数据管理系统和商务智能系统。本书的重点是商务智能系统。数据虚拟化可用于整合来自各种数据源的数据,包括数据仓库、数据集市和生产型数据库。它有潜力改变我们开发商务智能系统的方式。数据虚拟化将成为大多数这类系统的心脏。
简而言之,数据虚拟化允许我们使用更简单和更灵活的架构构建商务智能系统。如果你想知道怎么做和为什么,本书就是为你而写的!本书将详细描述数据虚拟化产品的工作原理、技术应用、应该做什么和不做什么,以及在商务智能系统中应用它的好处。
谁应该阅读这本书?
本书适合以下人群:
负责开发和管理数据仓库和商务智能环境的商务智能专家,以及那些想知道如何通过应用数据虚拟化技术来简化系统或实现更灵活的商务智能系统的人。
信息管理专家,想知道数据虚拟化对其职业的影响,以及数据虚拟化将如何影响信息管理、数据管理、数据库设计、数据清洗和数据分析等活动。
主数据管理专家,负责创建主数据管理系统,并希望了解如何从部署数据虚拟化中受益。
数据架构师,负责设计数据的整体系统架构,用来向特定组织的任何机构提供所需要的数据。
数据库管理员,必须了解数据虚拟化服务器的特性和限制,用于确定如何以及在何处可以有效且高效地应用此技术。
设计师、分析师和顾问,必须直接或间接处理数据虚拟化,以及想知道数据虚拟化所能做的和不能做的。
学生,想要学习数据虚拟化技术,以及理解数据虚拟化技术与其他数据处理相关技术的区别。
预备知识
关于数据仓库、商务智能和数据库技术的一般性知识是必需的。
术语和定义
遗憾的是,数据虚拟化和数据仓库领域中使用的所有术语并非都是明确定义的,这一点在本书中讲得很清楚。为了避免混淆,我们试图清晰地定义大多数术语。但是,我们不能保证本书中的定义与你的定义一致。
造成这种混乱的原因很多。第一个原因是,供应商纯粹为了区分自己的产品和竞争对手的产品而经常提出新的术语,但营销人员不定义术语,他们只使用这些术语并用一般术语来描述产品。在大家意识到这一点之前,我们都在使用那些定义不明确或根本没有定义的术语。第二个原因是,这个领域发展非常迅速,在较短的时间内就可能要为新思维创造某种术语,并提出权衡性定义。结果,我们可能会匆忙地选择一个术语,而经过仔细检查后才发现它并不合适。

目  录

第1章 数据虚拟化导论
1.1 引言
1.2 商务智能世界正在改变
1.3 虚拟化简介
1.4 什么是数据虚拟化
1.5 数据虚拟化与相关概念
1.5.1 数据虚拟化与封装和信息隐藏
1.5.2 数据虚拟化与抽
1.5.3 数据虚拟化与数据联合
1.5.4 数据虚拟化与数据集成
1.5.5 数据虚拟化与企业信息集成
1.6 数据虚拟化的定义
1.7 数据虚拟化的技术优势
1.8 数据虚拟化的不同实现
1.9 数据虚拟化服务器概述
1.10 开放式与封闭式数据虚拟化服务器
1.11 数据集成的其他方式
1.12 数据虚拟化服务模型
1.13 数据虚拟化的历史
1.14 示例数据库:世界一流电影
1.15 本书结构

第2章 商务智能和数据仓库
2.1 引言
2.2 什么是商务智能
2.3 管理层次与决策制定
2.4 商务智能系统
2.5 商务智能系统的数据存储
2.5.1 数据仓库
2.5.2 数据集市
2.5.3 数据中转区
2.5.4 可操作数据存
2.5.5 个人数据存储
2.5.6 不同类型数据存储的对比
2.6 标准化模式、星形模式和雪花模式
2.6.1 标准化模式
2.6.2 非标准化模式
2.6.3 星形模式
2.6.4 雪花模式
2.7 提取-转换-装载、提取-装载-转换和复制
2.7.1 提取-转换-装载
2.7.2 提取-装载-转换
2.7.3 复制
2.8 商务智能架构总览
2.9 报告和分析的新形式
2.9.1 运营报告和分析
2.9.2 深度和大数据分析
2.9.3 自助式报告和分析
2.9.4 无限制的自组织分析
2.9.5 360
2.9.6 探索性分析
2.9.7 基于文本的分析
2.10 传统商务智能系统的劣势
2.11 总结

第3章 数据虚拟化服务器:构造模块
3.1 引言
3.2 数据虚拟化服务器的高层架构
3.3 导入源表和定义封装器
3.4 定义虚拟表和映射
3.5 虚拟表和映射的例子
3.6 虚拟表和数据建模
3.7 嵌套虚拟表和共享规范
3.8 导入非关系数据
3.8.1 XML和JSON文档
3.8.2 Web服务
3.8.3 电子表格
3.8.4 NoSQL数据库
3.8.5 多维数据集和MDX
3.8.6 半结构化数据
3.8.7 非结构化数据
3.9 发布虚拟表
3.10 互联网数据模型
3.11 可更新的虚拟表和事务管理

相关实践学习
MySQL基础-学生管理系统数据库设计
本场景介绍如何使用DMS工具连接RDS,并使用DMS图形化工具创建数据库表。
相关文章
|
2月前
|
运维 监控 数据可视化
产品测评 | 大模型时代下全场景数据消费平台的智能BI—Quick BI深度解析
Quick BI是阿里云旗下的全场景数据消费平台,助力企业实现数据驱动决策。用户可通过连接多种数据源(如本地文件、数据库等)进行数据分析,并借助智能小Q助手以对话形式查询数据或搭建报表。平台支持数据可视化、模板快速构建视图等功能,但目前存在不支持JSON格式文件、部分功能灵活性不足等问题。整体而言,Quick BI在数据分析与展示上表现出强大能力,适合业务类数据处理,未来可在智能化及运维场景支持上进一步优化。
|
3月前
|
人工智能 自然语言处理 数据可视化
大模型+BI:一场关乎企业未来生死的数据智能卡位战 | 【瓴羊数据荟】数据MeetUp第四期
随着大模型技术突破,全球企业迎来数据智能革命。Gartner预测,到2027年,中国80%的企业将采用多模型生成式AI策略。然而,数据孤岛与高门槛仍阻碍价值释放。
137 8
大模型+BI:一场关乎企业未来生死的数据智能卡位战 | 【瓴羊数据荟】数据MeetUp第四期
|
3月前
|
SQL 人工智能 自然语言处理
颠覆传统BI认知:Quick BI如何用“傻瓜式”操作重塑数据决策?
Quick BI是阿里云推出的一款零代码+AI数据分析工具,专为业务人员设计。通过简洁的界面和强大的功能,它让数据“开口说话”。从Excel秒变智能资产,到拖拽式构建高定看板,再到自然语言查询与预测分析,菜鸟也能轻松上手。企业微信集成、移动端优化等功能,助力实时决策。Quick BI打破技术壁垒,推动数据民主化,让每个岗位都能用业务语言对话数据,实现真正的数据驱动转型。
|
3月前
|
数据可视化 数据挖掘 BI
基于烟草零售商订单数据的Quick BI体验报告
Quick BI旨在通过智能的数据分析和可视化能力帮助企业构建高效的分析系统。在我初步了解该产品后,发现它不仅支持创建美观的仪表板、复杂的电子表格以及动态大屏,还能够无缝集成到现有的业务流程中,极大地提升了工作效率。尤其对于需要频繁展示数据分析结果给管理层或客户的场景来说,Quick BI提供了一个便捷且专业的解决方案。
|
3月前
|
数据可视化 数据挖掘 BI
Quick BI评测报告:从IT开发视角评测“全场景数据消费式BI平台”
Quick BI评测报告:从IT开发视角评测“全场景数据消费式BI平台”
109 0
|
4月前
|
人工智能 BI 自然语言处理
【瓴羊数据荟】 共话AI×Data的企业应用进化,瓴羊「数据荟」MeetUp城市行上海场顺利收官!
瓴羊「数据荟」Meet Up城市行系列活动第四期活动将于3月7日在上海举办,由中国信息通信研究院与阿里巴巴瓴羊专家联袂呈现,共同探讨AI时代的数据应用实践与企业智能DNA的革命性重构。
190 0
【瓴羊数据荟】  共话AI×Data的企业应用进化,瓴羊「数据荟」MeetUp城市行上海场顺利收官!
|
11月前
|
监控 数据可视化 数据挖掘
干货|FESCO Adecco外企德科:Quick BI打造战略管理“观数台”(1)
干货|FESCO Adecco外企德科:Quick BI打造战略管理“观数台”
263 4
|
6月前
|
供应链 监控 安全
基于Quick BI的多部门组织下的数据共享及管理方案
本文介绍了企业在使用Quick BI时面临的数据共享与安全控制需求,涵盖技术、财务、销售等部门的具体挑战,并提出了基于角色组授权、工作空间隔离、行级权限管理等解决方案,确保数据既能高效共享又能安全可控。
358 5
基于Quick BI的多部门组织下的数据共享及管理方案
|
7月前
|
人工智能 算法 BI
聚焦AI与BI融合,引领数智化新潮流 | 【瓴羊数据荟】瓴羊数据Meet Up城市行第一站完美收官!
当BI遇见AI,洞见变得触手可及 —— 瓴羊「数据荟」数据Meet Up城市行·杭州站启幕,欢迎参与。
845 5
聚焦AI与BI融合,引领数智化新潮流 | 【瓴羊数据荟】瓴羊数据Meet Up城市行第一站完美收官!
|
11月前
|
人工智能 关系型数据库 分布式数据库
PolarDB产品使用问题之如何将自有BI系统接入NL2BI的Web前端
PolarDB产品使用合集涵盖了从创建与管理、数据管理、性能优化与诊断、安全与合规到生态与集成、运维与支持等全方位的功能和服务,旨在帮助企业轻松构建高可用、高性能且易于管理的数据库环境,满足不同业务场景的需求。用户可以通过阿里云控制台、API、SDK等方式便捷地使用这些功能,实现数据库的高效运维与持续优化。