数据仓库的概念是针对以下基本需求产生的: 公司的业务系统很多,业务系统的历史数据不方便查询。不同的业务系统往往管理部门不同,地域不同。 能不能将所有这些数据集中起来, 再淘淘有没有有意义的业务规律。 数据仓库数据库往往很大,因为公司所有的数据集中得越多,越能淘到有价值的发现。例如数据仓库的数据随便就可能在10G以上。 数据仓库的组成十分繁杂,既有业务系统的历史数据,又有人事、财务数据,业务系统数据,还要自己建一些基础性的数据,例如,公共假期数据、地理信息、国家信息等等。 数据仓库概念包含从业务生产系统采集数据的程序, 这个程序还不能影响业务系统的运行(属于ETL过程), 数据仓库包括业务系统长期的历史数据,例如 5 年,用来分析(ODS数据)。数据仓库包括针对某相业务值 (例如销售量) 重新打上标签的业务流水数据。 (事实表和维度表)。 数据仓库概念还包含报表生成工具(BI工具)。这些工具能够达到几年前DSS(决策分析)的效果。 数据仓库的客户历史资量的分析,也许又与 CRM系统粘点边。 总之,一个公司想针对已有的历史业务数据,充分的利用它们,那么就上数据仓库项目。 至于哪些吓唬人的大写字母的组合, 只是达到这个目标的科学技术罢了。 牢记住数据仓库的基本需求,不要被大数据分析软件供应商吓着。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。