【MySQL】数据库的设计规范(重点:三大范式)

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: 本文重点介绍MySQL的三大范式、反范式化和巴斯范式的一些问题。

【大家好,我是爱干饭的猿,本文重点介绍MySQL的三大范式、反范式化和巴斯范式的一些问题。

后续会继续分享MySQL和其他重要知识点总结,如果喜欢这篇文章,点个赞👍,关注一下吧】

上一篇文章:《【MySQL】索引优化与查询优化(重点:索引失效的11种情况)》


目录

🥯1. 范 式

1.1 范式简介

1.2 范式都包括哪些

1.3 键和相关属性的概念

1.4 第一范式(1st NF)

1.5 第二范式(2nd NF)

1.6 第三范式(3rd NF)

1.7 小结

🥯2. 反范式化

2.1 概述

2.2 反范式的新问题

2.3 反范式的适用场景

🥯3. BCNF(巴斯范式)


🥯1.范 式

1.1范式简介

在关系型数据库中,关于数据表设计的基本原则、规则就称为范式。可以理解为,一张数据表的设计结构需要满足的某种设计标准的级别。要想设计一个结构合理的关系型数据库,必须满足一定的范式。

1.2范式都包括哪些

目前关系型数据库有六种常见范式,按照范式级别,从低到高分别是:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,又称完美范式)

1.3键和相关属性的概念

这里有两个表:

球员表(player):球员编号 | 姓名 | 身份证号 | 年龄 | 球队编号

球队表(team):球队编号 | 主教练 | 球队所在地

    • 超键:对于球员表来说,超键就是包括球员编号或者身份证号的任意组合,比如(球员编号)(球员编号,姓名)(身份证号,年龄)等。
    • 候选键:就是最小的超键,对于球员表来说,候选键就是(球员编号)或者(身份证号)。
    • 主键:我们自己选定,也就是从候选键中选择一个,比如(球员编号)。
    • 外键:球员表中的球队编号。
    • 主属性非主属性:在球员表中,主属性是(球员编号)(身份证号),其他的属性(姓名)(年龄)(球队编号)都是非主属性。

    1.4第一范式(1st NF)

    第一范式主要是确保数据表中每个字段的值必须具有原子性,也就是说数据表中每个字段的值为不可再次拆分的最小数据单位。

    1.5第二范式(2nd NF)

    第二范式要求,在满足第一范式的基础上,还要满足数据表里的每一条数据记录,都是可唯一标识的。而且所有非主键字段,都必须完全依赖主键,不能只依赖主键(联合主键)的一部分。如果知道主键的所有属性的值,就可以检索到任何元组(行)的任何属性的任何值。

    举例1

    成绩表 (学号,课程号,成绩)关系中,(学号,课程号)可以决定成绩,但是学号不能决定成绩,课程号也不能决定成绩,所以“(学号,课程号)→成绩就是 完全依赖关系

    如果只是部分依赖主键:

    1. 数据冗余 :如果一个球员可以参加 m 场比赛,那么球员的姓名和年龄就重复了 m-1 次。一个比赛

    也可能会有 n 个球员参加,比赛的时间和地点就重复了 n-1 次。

    2. 插入异常 :如果我们想要添加一场新的比赛,但是这时还没有确定参加的球员都有谁,那么就没

    法插入。

    3. 删除异常 :如果我要删除某个球员编号,如果没有单独保存比赛表的话,就会同时把比赛信息删

    除掉。

    4. 更新异常 :如果我们调整了某个比赛的时间,那么数据表中所有这个比赛的时间都需要进行调

    整,否则就会出现一场比赛时间不同的情况。

    1NF 告诉我们字段属性需要是原子性的,而 2NF 告诉我们一张表就是一个独立的对象,一张表只

    表达一个意思。

    1.6第三范式(3rd NF)

    第三范式是在第二范式的基础上,确保数据表中的每一个非主键字段都和主键字段直接相关,也就是说,要求数据表中的所有非主键字段不能依赖于其他非主键字段(即,不能存在非主属性A依赖于非主属性B,非主属性B依赖于主键C的情况,即存在"A-->B-->C"的决定关系)通俗地讲,该规则的意思是所有非主键属性之间不能有依赖关系,必须相互独立不能存在依赖传递

    举例1

    部门信息表 :每个部门有部门编号(dept_id)、部门名称、部门简介等信息。

    员工信息表 :每个员工有员工编号、姓名、部门编号。

    列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。

    如果不存在部门信息表,则根据第三范式(3NF)也应该构建它,否则就会有大量的数据冗余。

    若员工信息表为 :每个员工有员工编号、姓名、部门编号、部门名称。

    则部门名称就依赖部门编号,部门编号依赖员工编号(即存在"A-->B-->C"的决定关系),造成不满足第三范式。

    1.7 小结

    关于数据表的设计,有三个范式要遵循。

    (1)第一范式(1NF),确保每列保持原子性

    数据库的每一列都是不可分割的原子数据项,不可再分的最小数据单元,而不能是集合、数组、记录等非原子数据项。

    (2)第二范式(2NF),确保每列都和主键完全依赖

    尤其在复合主键的情况向下,非主键部分不应该依赖于部分主键。

    (3)第三范式(3NF),确保每列都和主键直接相关,而不是间接相关

    范式的优点:数据的标准化有助于消除数据库中的数据冗余,第三范式(3NF)通常被认为在性能、拓展性和数据完整性方面达到了最好的平衡。

    范式的缺点:范式的使用,可能降低查询的效率。因为范式等级越高,设计出来的数据表就越多、越精细,数据的冗余度就越低,进行数据查询的时候就可能需要关联多张表,这不但代价昂贵,也可能使一些索引策略无效

    范式只是提出了设计的标准,实际上设计数据表时,未必一定要符合这些标准。开发中,我们会出现为了性能和读取效率违反范式化的原则,通过增加少量的冗余或重复的数据来提高数据库的读性能,减少关联查询,join表的次数,实现空间换取时间的目的。因此在实际的设计过程中要理论结合实际,灵活运用。

    🥯2.反范式化

    2.1概述

    规范化vs性能

      1. 为满足某种商业目标 , 数据库性能比规范化数据库更重要
      2. 在数据规范化的同时 , 要综合考虑数据库的性能
      3. 通过在给定的表中添加额外的字段,以大量减少需要从中搜索信息所需的时间
      4. 通过在给定的表中插入计算列,以方便查询

      2.2反范式的新问题

        • 存储空间变大
        • 一个表中字段做了修改,另一个表中冗余的字段也需要做同步修改,否则数据不一致
        • 若采用存储过程来支持数据的更新、删除等额外操作,如果更新频繁,会非常消耗系统资源
        • 数据量小的情况下,反范式不能体现性能的优势,可能还会让数据库的设计更加复杂

        2.3反范式的适用场景

        当冗余信息有价值或者能大幅度提高查询效率的时候,我们才会采取反范式的优化。

        1.增加冗余字段的建议

        1)这个冗余字段不需要经常进行修改

        2)这个冗余字段查询的时候不可或缺

        2.历史快照、历史数据的需要

        在现实生活中,我们经常需要一些冗余信息,比如订单中的收货人信息,包括姓名、电话和地址等。每次发生的订单收货信息都属于历史快照,需要进行保存,但用户可以随时修改自己的信息,这时保存这些冗余信息是非常有必要的。

        反范式优化也常用在数据仓库的设计中,因为数据仓库通常存储历史数据,对增删改的实时性要求不强,对历史数据的分析需求强。这时适当允许数据的冗余度,更方便进行数据分析。

        🥯3. BCNF(巴斯范式)

        主属性(仓库名)对于候选键(管理员,物品名)是部分依赖的关系,这样就有可能导致异常情况。因此引入BCNF,它在3NF的基础上消除了主属性对候选键的部分依赖或者传递依赖关系

        即非主属性不能相互依赖(BCNF),非主属性也不能相互依赖(2NF)。

        如果在关系R中,U为主键,A属性是主键的一个属性,若存在A->Y,Y为主属性,则该关系不属于BCNF。


        分享到此,感谢大家观看!!!

        如果你喜欢这篇文章,请点赞关注吧,或者如果你对文章有什么困惑,可以私信我。

        🏓🏓🏓

        相关实践学习
        如何快速连接云数据库RDS MySQL
        本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
        全面了解阿里云能为你做什么
        阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
        相关文章
        |
        3天前
        |
        存储 Oracle 关系型数据库
        数据库传奇:MySQL创世之父的两千金My、Maria
        《数据库传奇:MySQL创世之父的两千金My、Maria》介绍了MySQL的发展历程及其分支MariaDB。MySQL由Michael Widenius等人于1994年创建,现归Oracle所有,广泛应用于阿里巴巴、腾讯等企业。2009年,Widenius因担心Oracle收购影响MySQL的开源性,创建了MariaDB,提供额外功能和改进。维基百科、Google等已逐步替换为MariaDB,以确保更好的性能和社区支持。掌握MariaDB作为备用方案,对未来发展至关重要。
        13 3
        |
        3天前
        |
        安全 关系型数据库 MySQL
        MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!
        《MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!》介绍了MySQL中的三种关键日志:二进制日志(Binary Log)、重做日志(Redo Log)和撤销日志(Undo Log)。这些日志确保了数据库的ACID特性,即原子性、一致性、隔离性和持久性。Redo Log记录数据页的物理修改,保证事务持久性;Undo Log记录事务的逆操作,支持回滚和多版本并发控制(MVCC)。文章还详细对比了InnoDB和MyISAM存储引擎在事务支持、锁定机制、并发性等方面的差异,强调了InnoDB在高并发和事务处理中的优势。通过这些机制,MySQL能够在事务执行、崩溃和恢复过程中保持
        18 3
        |
        3天前
        |
        SQL 关系型数据库 MySQL
        数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog
        《数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog》介绍了如何利用MySQL的二进制日志(Binlog)恢复误删除的数据。主要内容包括: 1. **启用二进制日志**:在`my.cnf`中配置`log-bin`并重启MySQL服务。 2. **查看二进制日志文件**:使用`SHOW VARIABLES LIKE 'log_%';`和`SHOW MASTER STATUS;`命令获取当前日志文件及位置。 3. **创建数据备份**:确保在恢复前已有备份,以防意外。 4. **导出二进制日志为SQL语句**:使用`mysqlbinlog`
        22 2
        |
        10天前
        |
        SQL 关系型数据库 MySQL
        数据库数据恢复—Mysql数据库表记录丢失的数据恢复方案
        Mysql数据库故障: Mysql数据库表记录丢失。 Mysql数据库故障表现: 1、Mysql数据库表中无任何数据或只有部分数据。 2、客户端无法查询到完整的信息。
        |
        16天前
        |
        关系型数据库 MySQL 数据库
        Python处理数据库:MySQL与SQLite详解 | python小知识
        本文详细介绍了如何使用Python操作MySQL和SQLite数据库,包括安装必要的库、连接数据库、执行增删改查等基本操作,适合初学者快速上手。
        115 15
        |
        17天前
        |
        关系型数据库 MySQL 数据库
        数据库数据恢复—MYSQL数据库文件损坏的数据恢复案例
        mysql数据库文件ibdata1、MYI、MYD损坏。 故障表现:1、数据库无法进行查询等操作;2、使用mysqlcheck和myisamchk无法修复数据库。
        |
        21天前
        |
        SQL 关系型数据库 MySQL
        MySQL导入.sql文件后数据库乱码问题
        本文分析了导入.sql文件后数据库备注出现乱码的原因,包括字符集不匹配、备注内容编码问题及MySQL版本或配置问题,并提供了详细的解决步骤,如检查和统一字符集设置、修改客户端连接方式、检查MySQL配置等,确保导入过程顺利。
        |
        29天前
        |
        关系型数据库 MySQL 数据库
        GBase 数据库如何像MYSQL一样存放多行数据
        GBase 数据库如何像MYSQL一样存放多行数据
        |
        1月前
        |
        SQL 关系型数据库 MySQL
        12 PHP配置数据库MySQL
        路老师分享了PHP操作MySQL数据库的方法,包括安装并连接MySQL服务器、选择数据库、执行SQL语句(如插入、更新、删除和查询),以及将结果集返回到数组。通过具体示例代码,详细介绍了每一步的操作流程,帮助读者快速入门PHP与MySQL的交互。
        40 1
        |
        1月前
        |
        SQL 关系型数据库 MySQL
        go语言数据库中mysql驱动安装
        【11月更文挑战第2天】
        62 4