3. 范式
范式是符合某一种级别的关系模式的集合。下图就是表现范式级别(低范式包含高范式)。
满足高范式的同时,也一定满足低范式。
3.1 一范式——1NF
一关系模式 R 的所有属性都是不可分的基本数据项(即表中不能再有表)。则 R∈1NF
s。第一范式是对关系模式的最低要求,如果一个关系模式不满足 1NF 则不能称为关系模式。
例如,以下这个关系就不满足 1NF,因为“成绩”还能在分为“期中成绩”和“期末成绩”。
当然,S-L-C
满足 1NF,它中的元素都是不能再分。
3.2 二范式——2NF
若R∈1NF
,并且不存在非主属性部分依赖于R的候选码,则 R∈2NF
。
这里还有很多的说法,还可以说每一个非主属性都完全函数依赖于 R 的候选码。
例如上述例子
sdept 和 sloc 部分函数依赖于 S-L-C 的候选码 (sno,cno),所以 S-L-C 不满足 2NF。
则会出现问题:
1.插入异常:假设学号 sno=123,专业 sdept=IS,宿舍 sloc=N 的学生还没有选课(则表示 cno 为空),则该学生无法将学生信息录入进系统。(因为 cno 为主属性,不能为空)。
2.删除异常:假设一学生只选了一节课,但是现在他想将这门课退了,则将需要将这门课在这名学生系统中删除,但是在删除时,会把该学生的其它信息也会删除(因为 cno 为主属性)。
3.数据冗余大:假设一学生选了10节课,则 sdept 和 sloc 也会重复 10 次。
4.修改复杂:因为数据冗余大,则修改也会复杂。
所以 S-L-C 不是一个很好的关系模式,所以我们需要将 S-L-C 分解,消除 sdept 和 sloc 对(sno,cno)的部分函数依赖。
得到 S-C 和 S-L,其中 S-C 的候选码为(sno , cno),非主属性 grade 完全函数依赖于(sno , cno)所以 S-C∈2NF,同理非 S-L 的非主属性 sdept 完全函数依赖于候选码 sno,同理,sloc 完全函数依赖于候选码 sno,所以 S-L∈2NF。
分解完毕,现在就解决上述的问题了。
综上,2NF 要注意非主属性对候选码的函数依赖,如果存在着部分函数依赖,则不满足 2NF,反之,满足 2NF。
3.3 三范式——3NF
简单的说,在满足 2NF 的基础上,关系模式中不存在传递函数依赖。
例如在上述例子中的 S-L,存在 sno→sdept
,sdept→sloc
,并且有 sno→sloc
,所以存在函数传递依赖,不满足 3NF。
并且在2NF任然存在问题,以上述S-L为例:
插入异常:若刚成立一个专业(sdept),但是还没有学生(sno),则无法向数据库中录入sdept 和 sloc。
删除异常:若一个专业的学生全部毕业,需要将学号删除时,则 sdept 和 sloc 也会被删除。
数据冗余大:若同一个专业的学生住在一起(即 sloc 都相同),就会有很多的 sloc 重复。
修改复杂:因为数据冗余大,所以要修改时很复杂。
所以 S-L 也不是一个很好的关系模式,需要将其分解,也就是让 S-L 满足3NF。
解决办法:消除传递函数依赖。
这样就解决了 2NF 存在的问题了。
这里补充一个知识点:
- 所有高范式成立,则低范式也一定成立,即若
R∈3NF
,则一定R∈2NF
。 - 若
R∈3NF
,则 R 的每一个非主属性既不部分函数依赖于候选码,也不传递函数依赖于候选码。
3.4 BCNF
没有任何属性(主属性和非主属性)对候选码的部分函数依赖和传递函数依赖。
以下例子,
因为候选码为(S,T)和(S,J),所以主属性为(S,T,J),不存在非主属性。所以一定满足3NF。
但是这里存在 主属性对候选码的部分函数依赖,所以不满足 BCNF。
3.5 4NF 和 5NF
当然还有 4NF 和 5NF,原理和以上的一样,不是很重要。
这里就简单的了解一下,
4NF:当 R∈BCNF
,消除非平凡且非函数依赖的多值依赖。
5NF:当 R∈4NF
,消除不是由候选码所蕴含的连接依赖。如果关系模式R中的每一个连接依赖均由 R 的候选码所隐含
总结
在范式的学习中,一定要把知识点弄清,例如部分函数依赖,完全函数依赖,候选码,主属性等等。把原理搞懂了,很有利于后面的学习。其实搞懂了范式还是非常简单的。