关于数据仓库 — 总体工具介绍

本文涉及的产品
云数据库 RDS SQL Server,独享型 2核4GB
简介:
数据仓库项目是以关系数据库为依托,以数据仓库理论为指导、以 OLAP为多层次多视角分析,以 ETL工具进行数据集成、整合、清洗、加载转换,以前端工具进行前端报表展现浏览,以反复叠代验证为生命周期的综合处理过程。最终目标是为了达到整合企业信息信息,把数据转换成信息、知识,提供决策支持。
 
 
数据仓库不是一门纯粹的技术,如果从 Oracle、 SQLServer等专业数据库的角度去学习,就有失偏颇了。数据仓库应该是一种体系结构,它的核心是在于对于数据的整合,通过抽丝剥茧把企业原始数据进行集成、归类、分析,从而提供了企业决策分析需要的 KPI。
数据库和数据仓库从物理设计角度应该是一致的,都是基于传统的关系数据库理论,而且这两者有融合的趋势。 SQLServer,Sybase,DB2,Oracle都是传统的关系数据库,同时只要经过认真的数据模型设计或者参数设置也可以变成很好的数据仓库实体;与此同时数据仓库也在基于自身的特点不断地进行发展演变,例如 SybaseIQ、 Terradata就是完全的数据仓库,用它来设计 OLTP系统显然是存在各种问题的。
OLAP也逐渐被融合到数据库和数据仓库产品中来,例如微软的 Analysis Service 和 DB2的 OLAP Server,通过自身提供的专用接口可以加快多维数据的转换处理。当然象 Essbase这样纯粹的 OLAP也是非常优秀的产品,实际上 80%以上的大型 OLAP都是采用 Essbase的。
说到 ETL,一般市场上最重要最全面的还是 Informatica,但是关系数据库厂商通过自身的吸取和发展得以改进后,仍旧在不断蚕食这一市场,最常见的是与 SQLServer搭配的 SSIS和 Oracle的 OWB。
报表工具呢,还是原来的几个专业工具厂商, Hyperion, BO, Congos, Brio,当然价格也不菲,如果想用便宜的还是请选用微软的 ReportService吧。
 
 
 
分类 
 产品名称 
 描述 
 
数据库 
 SQLServer 
 适合 Windows 平台 
满足中小型数据库和数据仓库应用 
 
Sybase 
 适合 Windows 、 Unix 平台 
满足中小型数据库和数据仓库应用 
 
DB2 
 适合 Unix 平台 
满足大型、超大数据库和数据仓库应用 
 
Oracle 
 适合 Windows 、 Unix 平台 
满足大型、超大数据库和数据仓库应用 
 
数据仓库 
 Terradata Datawarehouse 
 适合 Unix 平台 
满足大型、超大数据仓库应用 
 
DB2 Datawarehouse 
 适合 Unix 平台 
满足大型、超大数据仓库应用 
 
SybaseIQ 
 适合 Unix 平台 
满足大型、超大数据仓库应用 
 
OLAP 
 MS OLAP Analysis Service 
 适合 Windows 平台 
满足中小型数据仓库应用 
 
Hyperion Essbase OLAP Server 
 适合 Unix 平台 
满足大型、超大数据仓库应用 
 
IBM DB2 OLAP Server 
 适合 Unix 平台 
满足大型、超大数据仓库应用 
 
SAS OLAP Server 
 未知 
 
ETL 
 Informatica 
 适合 Unix 、 Windows 平台 
专业、全面的、强大的 ETL 工具 
 
Oracle Warehouse Builder 
 适合 Unix 、 Windows 平台 
对 Oracle 比较适用的 ETL 工具 
 
MSServer Integration Serivces 
 适合 Windows 平台 
对 SQLServer 比较适用的 ETL 工具 
 
BO Data Integrator 
 未知 
 
前端工具 
 BO Crystal Report 
 主要适合关系型报表 
提供微 Cube 功能满足 OLAP 建模需要 
 
Hyperion Enterprise 
 主要适合关系型、 OLAP 报表 
依托 Essbase 的 OLAP 功能 
 
Brio Performance Suite 
 未知 
 
MicroStrategy 
 未知 
 
Congos 
 未知 
 
MSSQLServer Report Service 
 主要适合 MSSQLServer 平台 





本文转自baoqiangwang51CTO博客,原文链接:http://blog.51cto.com/baoqiangwang/309753 ,如需转载请自行联系原作者
相关实践学习
数据库实验室挑战任务-初级任务
本场景介绍如何开通属于你的免费云数据库,在RDS-MySQL中完成对学生成绩的详情查询,执行指定类型SQL。
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
7天前
|
存储 机器学习/深度学习 数据采集
【专栏】在数字化时代,数据仓库和数据湖成为企业管理数据的关键工具
【4月更文挑战第27天】在数字化时代,数据仓库和数据湖成为企业管理数据的关键工具。数据仓库是经过规范化处理的结构化数据集合,适合支持已知业务需求;而数据湖存储原始多类型数据,提供数据分析灵活性。数据仓库常用于企业决策、财务分析,而数据湖适用于大数据分析、机器学习和物联网数据处理。企业需根据自身需求选择合适的数据存储方式,以挖掘数据价值并提升竞争力。理解两者异同对企业的数字化转型至关重要。
|
2天前
|
SQL 分布式计算 关系型数据库
【数据仓库与联机分析处理】数据仓库工具Hive
【数据仓库与联机分析处理】数据仓库工具Hive
20 6
|
11月前
|
SQL 架构师 数据处理
带你读《升舱 - 数据仓库升级交付标准白皮书》——4.4交付内容工具化
带你读《升舱 - 数据仓库升级交付标准白皮书》——4.4交付内容工具化
233 0
|
数据采集 canal SQL
一篇文章搞懂数据仓库:常用ETL工具、方法
一篇文章搞懂数据仓库:常用ETL工具、方法
一篇文章搞懂数据仓库:常用ETL工具、方法
|
SQL 存储 分布式计算
数据仓库工具之Hive的架构原理
数据仓库工具之Hive的架构原理
|
SQL 运维 数据库
课时10: 1月28日-06-数据库生态工具&阿里云数据仓库解决方案及案例
课时10: 1月28日-06-数据库生态工具&阿里云数据仓库解决方案及案例
252 0
课时10: 1月28日-06-数据库生态工具&阿里云数据仓库解决方案及案例

热门文章

最新文章