中项集管师学习-第一章:商业智能(1.5)

本文涉及的产品
云原生数据仓库AnalyticDB MySQL版,基础版 8ACU 100GB 1个月
简介: 中项必过!

1.5商业智能

1.商业智能基础概念

商业智能(BI)数据仓库、OLAP(联机分析处理)和数据挖掘等技术的综合运用,商业智能技术提供让企业迅速分析数据的技术和方法,包括收集、管理和分析数据,将数据转化为有用的信息,然后分发到企业各处,一般由数据仓库、联机分析处理、数据挖掘、数据备份和恢复等部分组成,为了保证数据的正确性,需要经过抽取、转换和装载,RTL过程,将知识呈现给管理者,为管理者的决策过程提供支持。

2.主要功能

数据仓库:高效的数据存储和访问方式,例如中心是数据仓库和分布式数据仓库,能够很好的支持容灾和备份方案

数据ETL:支持多平台、多数据存储格式的数据组织,帮助形成支撑决策要求的参考内容

数据统计输出报表:报表能快速地完成数据统计的设计与展示,包括统计数据表央视和统计图展示,支持灵活的数据填报和针对非技术人员设计的解决方案,能自动地完成输出内容的发布

分析能力:可以通过业务规则形成分析内容并且展示样式丰富,具有一定的交互要求,例如预警和趋势分析等,要支持多维度的OLAP,实现纬度变化、旋转、数据切片和数据钻取等,帮助做出正确的判断和决策

3.三个层次

在基于CRM(客户关系管理系统)ERP(企业资源计划系统)和OA(办公自动化系统)系统特点即业务人员或用户对数据库大量的进行增删改查操作=>联机事务处理(OLTP),在收集到大量数据后,如何将数据转化为业务人员能看懂的有效信息,利用信息进行辅助决策。

image.png

商业智能实现的三个层次

数据报表

如何把数据库存在数据转化为业务人员需要信息,大部分是建立报表系统,报表系统是BI的低端实现,随着数据增多,传统报表也面临更多问题诸如数据太多,信息太少;难以交互分析,了解各种组合;难以挖掘出潜在的规则;难以追溯历史,形成数据孤岛

多维数据分析

需要多维数据库作支撑,数据分析系统总体架构分为:源系统、数据仓库、多维数据库和客户端

源系统:包括所有OLTP系统,搭建BI系统不需要更改现有系统

数据仓库:数据大集中,通过数据抽取,把数据从源系统不断抽取出来,一般建议在关系型数据库上,符合星型结构模型

多维数据库:数据仓库的数据经过多维建模,形成立方体结构,每个立方体描述以各业务主体

客户端:把多维立方体中的信息丰富多彩的展示给用户

数据挖掘

任何数据库中挖掘信息的过程都叫做数据挖掘,数据挖掘就是BI,简单讲数据源经过清洗和转换等成为适合于挖掘的数据集,通过固定形式的数据集完成知识提炼,以合适的知识模式进一步分析决策工作,数据挖掘是从特定形式的数据集中提炼知识的过程。

4.商业智能的软件工具集合

终端用户查询和报告工具

专门用来支持初级用户的原始数据访问,不包括专业成品报告生成工具

数据仓库(data warehouse)和数据集市(data Mart)

数据转换、管理和存取方面的预配置软件,包括业务模型

数据挖掘软件(data mining)

使用诸如神经网络、规则归纳等技术,发现数据之间的关系,做出基于数据的推断

OLAP工具

OLAP概念

OLTP属于传统的关系数据库的主要应用,主要是用于基本的日常事务处理,OLAP是数据仓库的主要应用,主要是支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果,同时提供多维数据观环境,也被称为多维分析

维的概念

OLAP目标是满足决策支持或满足多维环境下特定的查询和报表需求,技术核心是维的概念,OLAP工具是针对特定问题的联机数据访问与分析,多维分析是指对以多维形式组织起来的数据采取切片、切块、钻取和旋转等各种分析动作,以求剖析数据,使用户能从多个角度、多侧面地观察数据库中的数据,从而深入理解包含在数据中的信息

钻取:改变维的层次,变换分析的粒度,包含向上钻取(减少维度)和向下钻取(增加维度)

切片和切块:在一部分维上选定值后,关心度量数据在剩余维上的分布,剩余的维只有两个是切片,三个是切块

旋转:变换维的方向,在表格中重新安排维的位置,比如行列互换

OLAP的实现方法

根据存储数据的方式不同可以分为ROLAP、    MOLAP、HOLAP

ROLAP:基于关系数据库的OLAP实现,以关系数据库为核心,以关系型结构进行多维数据的表示和存储,ROLAP将多维数据库的多维结构划分为两类表,分为事实表存储数据和维的关键字,另一个是维表对每个维至少使用一个表来存放维的层次、成员类别等维的标书信息,维表和事实表通过主关键字和外关键字联系在一起,形成星型模型,扩展称为雪花模式

MOLAP 表示基于多维数据组织的 OLAP 实现,使用多维数组存储数据,在MOLAP中对“立方块”的“旋转”“切块”和“切片”是产生多维数据报表

HOLAP 表示基于混合数据组织的 OLAP 实现,如低层是关系型的,高层是多维矩阵型的。这种方式具有更好的灵活性。

5.实施商业智能步骤

商业智能项目的实施步骤分为以下6步:需求分析,数据仓库建模,数据抽取,建立商业智能分析报表,用户培训和数据模拟测试,系统改进和完善





相关实践学习
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
目录
相关文章
|
XML Java 数据格式
深入理解 Spring IoC 和 DI:掌握控制反转和依赖注入的精髓
在本文中,我们将介绍 IoC(控制反转)和 DI(依赖注入)的概念,以及如何在 Spring 框架中实现它们。
796 0
报错:tk.mybatis.mapper.provider.EmptyProvider中缺少selectOne方法!
报错:tk.mybatis.mapper.provider.EmptyProvider中缺少selectOne方法!
329 0
|
11月前
|
人工智能 缓存 并行计算
【AI系统】CPU 计算本质
本文深入探讨了CPU计算性能,分析了算力敏感度及技术趋势对CPU性能的影响。文章通过具体数据和实例,解释了算力计算方法、数据加载与计算的平衡点,以及如何通过算力敏感度分析优化性能瓶颈。同时,文章还讨论了服务器、GPU和超级计算机等不同计算平台的性能发展趋势,强调了优化数据传输速率和加载策略的重要性。
480 4
|
11月前
|
安全 前端开发 网络安全
网络空间安全之一个WH的超前沿全栈技术深入学习之路(2-1):渗透测试行业术语扫盲)作者——LJS
网络空间安全之一个WH的超前沿全栈技术深入学习之路(2-1):渗透测试行业术语扫盲)作者——LJS
|
存储 关系型数据库 MySQL
基于python django 医院管理系统,多用户功能,包括管理员、用户、医生,数据库MySQL
本文介绍了一个基于Python Django框架开发的医院管理系统,该系统设计了管理员、用户和医生三个角色,具备多用户功能,并使用MySQL数据库进行数据存储和管理。
537 4
基于python django 医院管理系统,多用户功能,包括管理员、用户、医生,数据库MySQL
|
C#
C#一分钟浅谈:委托与事件的实现方式
本文详细介绍了C#编程中委托与事件的基础知识及应用场景。首先解释了委托的概念,包括定义与使用方法;接着介绍了事件这一基于委托的特殊类型,展示了如何在类中定义事件及跨类订阅与处理事件;最后讨论了常见问题如事件未处理异常、重复订阅及内存泄漏等,并提出了相应的解决方案。通过本文,读者将全面掌握委托与事件的使用技巧,提升应用程序的设计与开发水平。
340 7
|
安全 Java 数据安全/隐私保护
构建高效网站后台:权限管理系统设计与实现
【7月更文挑战第5天】在现代Web应用开发中,权限管理是后台系统不可或缺的一部分,它确保了系统的安全性与用户数据的隐私。良好的权限管理系统能够精细控制不同用户角色对功能模块及数据资源的访问权限,从而提升系统的灵活性和安全性。本文将深入探讨权限管理的基本概念、设计思路,并通过一个简单的代码示例展示如何在Web后台中实现基本的权限控制逻辑。
779 2
|
数据可视化 PyTorch Serverless
Python 性能分析的几个方法,找到你代码中的那个她
我们在编写了一个脚本在笔记本上处理一些数据,然后去喝杯咖啡或者上了个厕所,15分钟后回来时发现进度才完成不到10%。 我们的脑袋里面就会发问:为什么这么慢?究竟是在哪个部分是慢的?是读取数据、处理数据还是保存数据?如何让它变快?它真的很慢吗? 有了这个疑问我们尝试去解决这个问题,下面我们介绍几个 python 性能分析的工具。
|
机器学习/深度学习 安全 测试技术
【Docker项目实战】在Docker环境下使用RustScan端口扫描工具
【6月更文挑战第9天】在Docker环境下使用RustScan端口扫描工具
369 5
|
Java 测试技术 数据处理
Java一分钟之-TestNG:高级测试框架
【6月更文挑战第4天】TestNG是Java的高级测试框架,扩展了JUnit,支持数据驱动、参数化、测试分组、依赖和并行测试,提高自动化测试效率。本文介绍了TestNG的核心特性,如`@DataProvider`和`@Parameters`注解,以及常见问题和解决策略,如正确使用测试生命周期方法和处理数据驱动测试中的数据。通过示例展示了如何进行数据驱动测试,帮助读者更好地理解和应用TestNG。
502 0
Java一分钟之-TestNG:高级测试框架