解析范式(1NF-4NF)

本文涉及的产品
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
简介: 最近又翻了下《数据库系统概论》,看了一节很基本的关于范式的介绍,虽然很理论化,但还是有必要了解一下

一、1NF

1.1 1NF的定义:

关系数据库中的关系是要满足一定要求的,满足不同程度要求的为不同的范式。满足最低要求是第一范式(1NF),1NF的定义如下:
1NF:关系中的每一个分量必须是一个不可分的数据项。
通俗地说,第一范式就是表中不允许有小表的存在。比如,对于如下的员工表,就不属于第一范式:
image

上表中,出现了属性薪资又被分为基本工资和补贴两个子属性,就好像表中又分割了一个小表,这就不属于第一范式。如果将基本工资和补贴合并,那么该表符合1NF。

1.2 1NF存在的问题

1NF是最低一级的范式,范式程度不高,存在很多的问题。比如用一个单一的关系模式学生来描述学校的教务系统:
学生(学号,学生姓名,所在系,系主任姓名,课程号,成绩)
学生表
image

假如选定学号为主键,这个表满足第一范式,但是存在如下问题:
·数据冗余:
一个系有很多的学生,同一个系的学生的系主任是相同的,所以系主任名会重复出现。
·更新复杂:
当一个系换了一个系主任后,对应的这个表必须修改与该系学生有关的每个元组。
·插入异常:
如果一个系刚成立,没有任何学生,那么这个无法把这个系的信息插入表中。
·删除异常:
如果一个系的学生都毕业了,那么在删除该系学生信息时,这个系的信息也丢了。

二、2NF

2.1 2NF的定义:

2NF的定义如下:

如果关系R属于1NF,且每一个非主属性完全函数依赖于任何一个候选码,则R属于2NF。

通俗地说,2NF就是在1NF的基础上,表中的每一个非主属性不会依赖复合主键中的某一个列。

按照定义,上面的学生表就不满足2NF,因为学号不能完全确定课程号和成绩(每个学生可以选多门课)。将学生表分解为:学生(学号,学生姓名,系编号),系(系编号,系名,系主任),选课(学号,课程号,成绩)。每张表均属于2NF。

新定义一张表:销售表(产品id,地区id,价格,产品名),同一个产品在不同地区价格不同。这个表就不属于2NF,因为非主属性产品名不是完全函数依赖于主键,而是完全依赖于产品id,即表中存在非主属性对主键的部分依赖。将销售表分解:产品(产品id,产品名),销售表(产品id,地区id,价格)。每张表均属于2NF。

2.2 2NF存在的问题:

下面举例说明2NF存在的相应问题。

对于公司里的员工管理,每个员工只能属于一个部门,每个部门可以有多个员工,定义如下关系模式:

员工管理表(员工id,员工名,所属部门id,部门经理);

对应的表:

image

存在的问题:
1、删除异常:
如果某个部门的人都跳槽了,那么在删除这些员工的同时也丢失了这个部门的信息。
2、修改复杂:
如果一个员工换了一个部门,不但要修改所属部门,还要修改部门经理这个属性列。
3、插入异常:
如果公司新成立了一个部门,但是目前没有招收员工,那么这个部门信息也无法插入到这个表中,因为没有主键。

三、3NF

3.1 3NF的定义:

3NF的严格定义如下:

关系模式R属于1NF,若R中不存在这样的码X,属性组Y及非主属性Z,使得X函数确定Y、Y函数确定Z成立,Y不能函数确定X,则称R是属于3范式的。

通俗地说,就是在满足1NF的基础上,表中不存在非主属性对码的传递依赖。也就是说表中非主属性不会间接地依赖于码。

如上面的员工管理表就不属于3NF,因为非主属性部门经理依赖于所属部门,所属部门依赖于员工id,即部门经理传递依赖于员工id。将员工管理表分解:员工管理(员工id,员工名,部门名),部门(部门名,部门经理)。则每张表均属于3NF。

3.2 3NF存在的问题:

现在有这样的一个场景:对于一个工程(ENO)的实施,每个工程需要多个零件,每个供应商(SNO)只生产一个零件(PNO)且受工厂规模所限只能同时供应一个工程,每个工程使用的同一个零件都来自同一个生产商。

定义关系模式:SPE(SNO,PNO,ENO)。

image

上表中存在如下函数依赖:
(ENO,PNO)→SNO
(ENO,SNO)→PNO
SNO→PNO
SPE是属于3NF的,因为根据定义,表中不存在非主属性对码的传递依赖和部分依赖。但是这张表存在如下的问题:
1、插入异常:
如果有一个新的工厂建立了,但是这家工厂还没有接到任何订单,那么无法将这个工厂信息插入到SPE中,因为缺少了主属性ENO。
2、删除异常:
如果某个供应商只给一个工程提供零件,现在这个工程不再需要这个零件了。那么PNO就要删除,而PNO是主属性,整个元组都被删除了,这样就丢失了一个供应商信息。

四、BCNF

4.1 BCNF的定义:

BCNF比3NF更进一步,可以认为是扩充的3NF,其定义如下:

关系模式R属于1NF,若X函数确定Y(且X不包含Y)时X必含有码,则R属于BCNF。

翻译成人话,就是在第一范式的基础上,若关系R中的每一个决定因素都必含有码,则关系R属于BCNF。

很显然,上面的SPE表不属于BCNF,因为SPE中存在一个决定因素SNO,SNO不含有码。将SPE表分解:SP(SNO,PNO),SE(SNO,ENO)。则每张表均属于BCNF。

4.2 BCNF存在的问题:

仍以上面的工程实施场景为例:假设每个供应商可以生产多个零件,可以供应给多个工程,一个工程需要多个零件,但同一个工程的同一个零件必须来自同一个供应商。

那么关系SPE(SNO,PNO,ENO)对应的表数据可能是如下:
image

此时表SPE存在如下的函数依赖:
(PNO,ENO)→SNO

根据BCNF的定义,此时表SPE属于BCNF。但是这样的关系模式仍具有不好的地方:数据冗余度太大。假如供应商S3生产了n个零件,每个零件供应给m个工程,那么显然S3要在表中重复m*n次。

五、4NF

5.1 4NF的定义:

严格定义如下:
关系模式R属于1NF,对于R中的每一个非平凡多值依赖X→→Y(X不包含Y),X都含有码,则R属于4NF。

通俗地说,对于有三个属性的表,给定属性A一个值,剩余两个列之间不存在多对多的关系。例如,在上面的SPE表中,给定SNO=S1,PNO和ENO之间很明显存在多对多的关系,故上表是不属于4NF的。

根据4NF的定义可知,4NF所允许的非平凡的多值依赖实际上就是函数依赖,4NF就是消除表中的非平凡多值依赖关系。

5.2 4NF存在的问题:

一般地,4NF属于规范程度比较高的范式了。但是考虑到连接依赖的话,4NF中也仍存在数据冗余,插入、修改、删除异常等问题。如果消除了4NF中的连接依赖,则达到了5NF的关系模式;5NF范式化已经很高了,实际工作中很少会遇到这么高的范式表,这里就不再叙述了。

六、范式的相关总结:

如果只考虑函数依赖,那么BCNF范式最彻底,已消除插入和删除的异常。而3NF的不彻底性表现在表中可能存在主属性对码的部分依赖和传递依赖。

如果考虑到多值依赖,那么4NF范式是规范程度最高的。但4NF中可能存在连接依赖的关系,而5NF可以消除连接依赖。

在数据库中,有时并不是规范化程度越高越好,有时候也需要逆范式化设计表。因为范式越高,产生的表就越多,一个简单的查询需求就可能涉及到多张表的关联,影响查询效率。一般地,数据库中的表都在3NF。

目录
相关文章
|
23天前
|
监控 Cloud Native 持续交付
云原生技术深度解析:重塑现代应用开发与部署范式####
本文深入探讨了云原生技术的核心概念、关键技术组件及其在现代软件开发中的重要性。通过剖析容器化、微服务架构、持续集成/持续部署(CI/CD)等关键技术,本文旨在揭示云原生技术如何促进应用的敏捷性、可扩展性和高可用性,进而推动企业数字化转型进程。不同于传统摘要仅概述内容要点,本部分将融入具体案例分析,直观展示云原生技术在实际应用中的显著成效与挑战应对策略,为读者提供更加丰富、立体的理解视角。 ####
|
3月前
|
开发者 Java
JSF EL 表达式:乘技术潮流之风,筑简洁开发之梦,触动开发者心弦的强大语言
【8月更文挑战第31天】JavaServer Faces (JSF) 的表达式语言 (EL) 是一种强大的工具,允许开发者在 JSF 页面和后台 bean 间进行简洁高效的数据绑定。本文介绍了 JSF EL 的基本概念及使用技巧,包括访问 bean 属性和方法、数据绑定、内置对象使用、条件判断和循环等,并分享了最佳实践建议,帮助提升开发效率和代码质量。
50 0
|
3月前
|
前端开发 API 开发者
【前端数据革命】React与GraphQL协同工作:从理论到实践全面解析现代前端数据获取的新范式,开启高效开发之旅!
【8月更文挑战第31天】本文通过具体代码示例,介绍了如何利用 GraphQL 和 React 搭建高效的前端数据获取系统。GraphQL 作为一种新型数据查询语言,能精准获取所需数据、提供强大的类型系统、统一的 API 入口及实时数据订阅功能,有效解决了 RESTful API 在复杂前端应用中遇到的问题。通过集成 Apollo Client,React 应用能轻松实现数据查询与实时更新,大幅提升性能与用户体验。文章详细讲解了从安装配置到查询订阅的全过程,并分享了实践心得,适合各层次前端开发者学习参考。
37 0
|
6月前
|
人工智能 IDE Devops
通义灵码技术解析,打造 AI 原生开发新范式
本文第一部分先介绍 AIGC 对软件研发的根本性影响,从宏观上介绍当下的趋势;第二部分将介绍 Copilot 模式,第三部分是未来软件研发 Agent 产品的进展。
72758 7
|
10天前
|
监控 Java 应用服务中间件
高级java面试---spring.factories文件的解析源码API机制
【11月更文挑战第20天】Spring Boot是一个用于快速构建基于Spring框架的应用程序的开源框架。它通过自动配置、起步依赖和内嵌服务器等特性,极大地简化了Spring应用的开发和部署过程。本文将深入探讨Spring Boot的背景历史、业务场景、功能点以及底层原理,并通过Java代码手写模拟Spring Boot的启动过程,特别是spring.factories文件的解析源码API机制。
35 2
|
1月前
|
缓存 Java 程序员
Map - LinkedHashSet&Map源码解析
Map - LinkedHashSet&Map源码解析
70 0
|
1月前
|
算法 Java 容器
Map - HashSet & HashMap 源码解析
Map - HashSet & HashMap 源码解析
57 0
|
1月前
|
存储 Java C++
Collection-PriorityQueue源码解析
Collection-PriorityQueue源码解析
62 0
|
1月前
|
安全 Java 程序员
Collection-Stack&Queue源码解析
Collection-Stack&Queue源码解析
84 0
下一篇
无影云桌面