1.5商业智能
1.商业智能基础概念
商业智能(BI)数据仓库、OLAP(联机分析处理)和数据挖掘等技术的综合运用,商业智能技术提供让企业迅速分析数据的技术和方法,包括收集、管理和分析数据,将数据转化为有用的信息,然后分发到企业各处,一般由数据仓库、联机分析处理、数据挖掘、数据备份和恢复等部分组成,为了保证数据的正确性,需要经过抽取、转换和装载,RTL过程,将知识呈现给管理者,为管理者的决策过程提供支持。
2.主要功能
数据仓库:高效的数据存储和访问方式,例如中心是数据仓库和分布式数据仓库,能够很好的支持容灾和备份方案
数据ETL:支持多平台、多数据存储格式的数据组织,帮助形成支撑决策要求的参考内容
数据统计输出报表:报表能快速地完成数据统计的设计与展示,包括统计数据表央视和统计图展示,支持灵活的数据填报和针对非技术人员设计的解决方案,能自动地完成输出内容的发布
分析能力:可以通过业务规则形成分析内容并且展示样式丰富,具有一定的交互要求,例如预警和趋势分析等,要支持多维度的OLAP,实现纬度变化、旋转、数据切片和数据钻取等,帮助做出正确的判断和决策
3.三个层次
在基于CRM(客户关系管理系统)ERP(企业资源计划系统)和OA(办公自动化系统)系统特点即业务人员或用户对数据库大量的进行增删改查操作=>联机事务处理(OLTP),在收集到大量数据后,如何将数据转化为业务人员能看懂的有效信息,利用信息进行辅助决策。
商业智能实现的三个层次
数据报表
如何把数据库存在数据转化为业务人员需要信息,大部分是建立报表系统,报表系统是BI的低端实现,随着数据增多,传统报表也面临更多问题诸如数据太多,信息太少;难以交互分析,了解各种组合;难以挖掘出潜在的规则;难以追溯历史,形成数据孤岛
多维数据分析
需要多维数据库作支撑,数据分析系统总体架构分为:源系统、数据仓库、多维数据库和客户端
源系统:包括所有OLTP系统,搭建BI系统不需要更改现有系统
数据仓库:数据大集中,通过数据抽取,把数据从源系统不断抽取出来,一般建议在关系型数据库上,符合星型结构模型
多维数据库:数据仓库的数据经过多维建模,形成立方体结构,每个立方体描述以各业务主体
客户端:把多维立方体中的信息丰富多彩的展示给用户
数据挖掘
任何数据库中挖掘信息的过程都叫做数据挖掘,数据挖掘就是BI,简单讲数据源经过清洗和转换等成为适合于挖掘的数据集,通过固定形式的数据集完成知识提炼,以合适的知识模式进一步分析决策工作,数据挖掘是从特定形式的数据集中提炼知识的过程。
4.商业智能的软件工具集合
终端用户查询和报告工具
专门用来支持初级用户的原始数据访问,不包括专业成品报告生成工具
数据仓库(data warehouse)和数据集市(data Mart)
数据转换、管理和存取方面的预配置软件,包括业务模型
数据挖掘软件(data mining)
使用诸如神经网络、规则归纳等技术,发现数据之间的关系,做出基于数据的推断
OLAP工具
OLAP概念
OLTP属于传统的关系数据库的主要应用,主要是用于基本的日常事务处理,OLAP是数据仓库的主要应用,主要是支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果,同时提供多维数据观环境,也被称为多维分析
维的概念
OLAP目标是满足决策支持或满足多维环境下特定的查询和报表需求,技术核心是维的概念,OLAP工具是针对特定问题的联机数据访问与分析,多维分析是指对以多维形式组织起来的数据采取切片、切块、钻取和旋转等各种分析动作,以求剖析数据,使用户能从多个角度、多侧面地观察数据库中的数据,从而深入理解包含在数据中的信息
钻取:改变维的层次,变换分析的粒度,包含向上钻取(减少维度)和向下钻取(增加维度)
切片和切块:在一部分维上选定值后,关心度量数据在剩余维上的分布,剩余的维只有两个是切片,三个是切块
旋转:变换维的方向,在表格中重新安排维的位置,比如行列互换
OLAP的实现方法
根据存储数据的方式不同可以分为ROLAP、 MOLAP、HOLAP
ROLAP:基于关系数据库的OLAP实现,以关系数据库为核心,以关系型结构进行多维数据的表示和存储,ROLAP将多维数据库的多维结构划分为两类表,分为事实表存储数据和维的关键字,另一个是维表对每个维至少使用一个表来存放维的层次、成员类别等维的标书信息,维表和事实表通过主关键字和外关键字联系在一起,形成星型模型,扩展称为雪花模式
MOLAP 表示基于多维数据组织的 OLAP 实现,使用多维数组存储数据,在MOLAP中对“立方块”的“旋转”“切块”和“切片”是产生多维数据报表
HOLAP 表示基于混合数据组织的 OLAP 实现,如低层是关系型的,高层是多维矩阵型的。这种方式具有更好的灵活性。
5.实施商业智能步骤
商业智能项目的实施步骤分为以下6步:需求分析,数据仓库建模,数据抽取,建立商业智能分析报表,用户培训和数据模拟测试,系统改进和完善