6.数据库完整性约束
三种:(提升数据可靠性)
- 实体完整性约束:使用数据库的时候给数据表定义主键,实体完整性是用于保证关系数据库中每个元组都是可区分的,唯一的。
- 参照完整性约束:外键的完整性约束 。其实就是外键
- 用户自定义完整性约束:用户可以设定这个属性,这个值的情况。针对某一具体关系数据库的约束条件称为用户定义的完整性,它反映某一具体应用所涉及的数据必须满足的语意要求。
触发器:可以写脚本来约束数据库数据的要求。
7.分布式数据库
7.1 数据库安全
措施 | 说明 |
用户标识和鉴定 | 最外层的安全保护措施,可以使用用户账户、口令及随机数检验等方式 |
存取控制 | 对用户进行授权,包括操作类型(如查找、插入、删除、修改等动作)和数据对象(主要是数据范围)的权限 |
密码存储和传输 | 对远程中断信息用密码传输 |
视图的保护 | 对视图进行授权 |
审计 | 使用一个专用文件或数据库,自动将用户对数据库的所有操作记录下来 |
7.2 数据备份
- 热冷备份概念:
- 冷备份也称静态备份,是将数据库正常关闭,再停止状态下,将数据库的文件全部备份(复制)下来。
- 热备份也称为动态备份,是利用备份软件,在数据库正常运行的状态下,将数据库种的数据文件备份出来。
- 优缺点
- 根据备份数据的量来分为:
- 完全备份:备份所有的数据
- 差量备份:仅备份上一次完全备份之后变化的数据
- 增量备份:备份上一次备份之后变化的数据
- 在下面的概念中,海量是全部的,静态就是不运行状态,动态就是运行状态,转储就是换个地方储存,
- 静态海量转储:在系统中无运行事务时进行,每次转储全部数据库
- 静态增量转储:在系统中无运行事务时进行,每次只转储上一次转储后更新过的数据。
- 动态海量转储:转储期间允许对数据库进行存取或修改,每次转储全部数据库
- 动态增量转储:转储期间允许对数据库进行存取或修改,每次只转储上一次转储后更新过的数据。
- 日志文件:事务日志是针对数据库改变所做的记录,它可以记录针对数据库的任何操作,并将记录结构保存在独立的文件中
7.3数据库故障与修复
故障关系 | 故障原因 | 解决办法 |
事务本身的可预期故障 | 本身逻辑 | 在程序中预先设置Rollback语句 |
事务本身的不可预期故障 | 算术溢出、违反存储保护 | 由DBMS的恢复子系统通过日志,撤销事务对数据库的修改,回退到事务初始状态 |
系统故障 | 系统停止运转 | 通常使用检查点法 |
介质故障 | 外存被破坏 | 一般使用日志重做服务 |
8.数据仓库与数据挖掘
8.1数据仓库的特点
- 面向主题
- 集成的
- 相对稳定的(非易失的)
- 反映历史变化(随着时间变化)
8.2数据仓库的的建立
8.3 数据挖掘方法分类
- 方法:
- 决策树
- 神经网络
- 遗传算法
- 关联规则挖掘算法
- 分类
- 关联分析:挖掘出隐藏在数据间的相互关系
- 序列模式分析:侧重点是分析数据间的前后关系(因果关系)
- 分类分析:为每一个记录赋予一个标记再按标记分类。
- 聚类分析:分类分析法的逆过程
8.4 反规范化技术
由于规范化会使表不断的拆分,从而导致数据表过多。这样虽然减少了数据冗余,提高了增、删、改的速度,但会增减查询的工作量。系统需要多次连接,才能进行查询操作,使得系统效率大大下降。
- 技术手段
- 增减派生性冗余列
- 增加冗余列
- 重新组表
- 分割表
以牺牲空间和规范化为代价提高一些查询的速度
8.5 大数据
对海量数据处理的一些相关技术
数据量大,速度要快,要有多样性,要有一定的价值。
- 传统数据与大数据的对比
比较难度 | 传统数据 | 大数据 |
数据量 | GB或TB级 | PB级或以上 |
数据分析需求 | 现有数据的分析与检测 | 深度分析(关联分析、回归分析) |
硬件平台 | 高端服务器 | 集群平台 |
- 大数据处理系统应该具有的重要特征
- 高度可扩展性
- 高性能
- 高度容错
- 支持异构环境
- 较短的分析延迟
- 易用且开放的接口
- 较低成本
- 向下兼容性
以上是在学习时做的笔记,后续在做题过程中可能会继续补充