【MySQL】数据库的设计规范(重点:三大范式)

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 本文重点介绍MySQL的三大范式、反范式化和巴斯范式的一些问题。

【大家好,我是爱干饭的猿,本文重点介绍MySQL的三大范式、反范式化和巴斯范式的一些问题。

后续会继续分享MySQL和其他重要知识点总结,如果喜欢这篇文章,点个赞👍,关注一下吧】

上一篇文章:《【MySQL】索引优化与查询优化(重点:索引失效的11种情况)》


目录

🥯1. 范 式

1.1 范式简介

1.2 范式都包括哪些

1.3 键和相关属性的概念

1.4 第一范式(1st NF)

1.5 第二范式(2nd NF)

1.6 第三范式(3rd NF)

1.7 小结

🥯2. 反范式化

2.1 概述

2.2 反范式的新问题

2.3 反范式的适用场景

🥯3. BCNF(巴斯范式)


🥯1.范 式

1.1范式简介

在关系型数据库中,关于数据表设计的基本原则、规则就称为范式。可以理解为,一张数据表的设计结构需要满足的某种设计标准的级别。要想设计一个结构合理的关系型数据库,必须满足一定的范式。

1.2范式都包括哪些

目前关系型数据库有六种常见范式,按照范式级别,从低到高分别是:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,又称完美范式)

1.3键和相关属性的概念

这里有两个表:

球员表(player):球员编号 | 姓名 | 身份证号 | 年龄 | 球队编号

球队表(team):球队编号 | 主教练 | 球队所在地

    • 超键:对于球员表来说,超键就是包括球员编号或者身份证号的任意组合,比如(球员编号)(球员编号,姓名)(身份证号,年龄)等。
    • 候选键:就是最小的超键,对于球员表来说,候选键就是(球员编号)或者(身份证号)。
    • 主键:我们自己选定,也就是从候选键中选择一个,比如(球员编号)。
    • 外键:球员表中的球队编号。
    • 主属性非主属性:在球员表中,主属性是(球员编号)(身份证号),其他的属性(姓名)(年龄)(球队编号)都是非主属性。

    1.4第一范式(1st NF)

    第一范式主要是确保数据表中每个字段的值必须具有原子性,也就是说数据表中每个字段的值为不可再次拆分的最小数据单位。

    1.5第二范式(2nd NF)

    第二范式要求,在满足第一范式的基础上,还要满足数据表里的每一条数据记录,都是可唯一标识的。而且所有非主键字段,都必须完全依赖主键,不能只依赖主键(联合主键)的一部分。如果知道主键的所有属性的值,就可以检索到任何元组(行)的任何属性的任何值。

    举例1

    成绩表 (学号,课程号,成绩)关系中,(学号,课程号)可以决定成绩,但是学号不能决定成绩,课程号也不能决定成绩,所以“(学号,课程号)→成绩就是 完全依赖关系

    如果只是部分依赖主键:

    1. 数据冗余 :如果一个球员可以参加 m 场比赛,那么球员的姓名和年龄就重复了 m-1 次。一个比赛

    也可能会有 n 个球员参加,比赛的时间和地点就重复了 n-1 次。

    2. 插入异常 :如果我们想要添加一场新的比赛,但是这时还没有确定参加的球员都有谁,那么就没

    法插入。

    3. 删除异常 :如果我要删除某个球员编号,如果没有单独保存比赛表的话,就会同时把比赛信息删

    除掉。

    4. 更新异常 :如果我们调整了某个比赛的时间,那么数据表中所有这个比赛的时间都需要进行调

    整,否则就会出现一场比赛时间不同的情况。

    1NF 告诉我们字段属性需要是原子性的,而 2NF 告诉我们一张表就是一个独立的对象,一张表只

    表达一个意思。

    1.6第三范式(3rd NF)

    第三范式是在第二范式的基础上,确保数据表中的每一个非主键字段都和主键字段直接相关,也就是说,要求数据表中的所有非主键字段不能依赖于其他非主键字段(即,不能存在非主属性A依赖于非主属性B,非主属性B依赖于主键C的情况,即存在"A-->B-->C"的决定关系)通俗地讲,该规则的意思是所有非主键属性之间不能有依赖关系,必须相互独立不能存在依赖传递

    举例1

    部门信息表 :每个部门有部门编号(dept_id)、部门名称、部门简介等信息。

    员工信息表 :每个员工有员工编号、姓名、部门编号。

    列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。

    如果不存在部门信息表,则根据第三范式(3NF)也应该构建它,否则就会有大量的数据冗余。

    若员工信息表为 :每个员工有员工编号、姓名、部门编号、部门名称。

    则部门名称就依赖部门编号,部门编号依赖员工编号(即存在"A-->B-->C"的决定关系),造成不满足第三范式。

    1.7 小结

    关于数据表的设计,有三个范式要遵循。

    (1)第一范式(1NF),确保每列保持原子性

    数据库的每一列都是不可分割的原子数据项,不可再分的最小数据单元,而不能是集合、数组、记录等非原子数据项。

    (2)第二范式(2NF),确保每列都和主键完全依赖

    尤其在复合主键的情况向下,非主键部分不应该依赖于部分主键。

    (3)第三范式(3NF),确保每列都和主键直接相关,而不是间接相关

    范式的优点:数据的标准化有助于消除数据库中的数据冗余,第三范式(3NF)通常被认为在性能、拓展性和数据完整性方面达到了最好的平衡。

    范式的缺点:范式的使用,可能降低查询的效率。因为范式等级越高,设计出来的数据表就越多、越精细,数据的冗余度就越低,进行数据查询的时候就可能需要关联多张表,这不但代价昂贵,也可能使一些索引策略无效

    范式只是提出了设计的标准,实际上设计数据表时,未必一定要符合这些标准。开发中,我们会出现为了性能和读取效率违反范式化的原则,通过增加少量的冗余或重复的数据来提高数据库的读性能,减少关联查询,join表的次数,实现空间换取时间的目的。因此在实际的设计过程中要理论结合实际,灵活运用。

    🥯2.反范式化

    2.1概述

    规范化vs性能

      1. 为满足某种商业目标 , 数据库性能比规范化数据库更重要
      2. 在数据规范化的同时 , 要综合考虑数据库的性能
      3. 通过在给定的表中添加额外的字段,以大量减少需要从中搜索信息所需的时间
      4. 通过在给定的表中插入计算列,以方便查询

      2.2反范式的新问题

        • 存储空间变大
        • 一个表中字段做了修改,另一个表中冗余的字段也需要做同步修改,否则数据不一致
        • 若采用存储过程来支持数据的更新、删除等额外操作,如果更新频繁,会非常消耗系统资源
        • 数据量小的情况下,反范式不能体现性能的优势,可能还会让数据库的设计更加复杂

        2.3反范式的适用场景

        当冗余信息有价值或者能大幅度提高查询效率的时候,我们才会采取反范式的优化。

        1.增加冗余字段的建议

        1)这个冗余字段不需要经常进行修改

        2)这个冗余字段查询的时候不可或缺

        2.历史快照、历史数据的需要

        在现实生活中,我们经常需要一些冗余信息,比如订单中的收货人信息,包括姓名、电话和地址等。每次发生的订单收货信息都属于历史快照,需要进行保存,但用户可以随时修改自己的信息,这时保存这些冗余信息是非常有必要的。

        反范式优化也常用在数据仓库的设计中,因为数据仓库通常存储历史数据,对增删改的实时性要求不强,对历史数据的分析需求强。这时适当允许数据的冗余度,更方便进行数据分析。

        🥯3. BCNF(巴斯范式)

        主属性(仓库名)对于候选键(管理员,物品名)是部分依赖的关系,这样就有可能导致异常情况。因此引入BCNF,它在3NF的基础上消除了主属性对候选键的部分依赖或者传递依赖关系

        即非主属性不能相互依赖(BCNF),非主属性也不能相互依赖(2NF)。

        如果在关系R中,U为主键,A属性是主键的一个属性,若存在A->Y,Y为主属性,则该关系不属于BCNF。


        分享到此,感谢大家观看!!!

        如果你喜欢这篇文章,请点赞关注吧,或者如果你对文章有什么困惑,可以私信我。

        🏓🏓🏓

        相关实践学习
        如何在云端创建MySQL数据库
        开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
        全面了解阿里云能为你做什么
        阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
        相关文章
        |
        11天前
        |
        前端开发 C# 设计模式
        “深度剖析WPF开发中的设计模式应用:以MVVM为核心,手把手教你重构代码结构,实现软件工程的最佳实践与高效协作”
        【8月更文挑战第31天】设计模式是在软件工程中解决常见问题的成熟方案。在WPF开发中,合理应用如MVC、MVVM及工厂模式等能显著提升代码质量和可维护性。本文通过具体案例,详细解析了这些模式的实际应用,特别是MVVM模式如何通过分离UI逻辑与业务逻辑,实现视图与模型的松耦合,从而优化代码结构并提高开发效率。通过示例代码展示了从模型定义、视图模型管理到视图展示的全过程,帮助读者更好地理解并应用这些模式。
        27 0
        |
        11天前
        |
        SQL 数据采集 关系型数据库
        |
        11天前
        |
        数据库 关系型数据库 MySQL
        惊!Hibernate与MySQL的绝密优化技巧大揭秘,让你的数据库飞起来!
        【8月更文挑战第31天】在企业应用开发中,结合使用持久层框架Hibernate与数据库管理系统MySQL可显著提升数据库交互效率。本文探讨了多项优化策略,包括配置二级缓存、采用单向关联减少JOIN操作、优化HQL查询语句以及合理使用MySQL索引。通过具体示例,文章详细讲解了如何实施这些优化措施,以期为企业应用提供更高效稳定的数据支持。
        21 0
        |
        11天前
        |
        SQL 关系型数据库 MySQL
        SQL Server、MySQL、PostgreSQL:主流数据库SQL语法异同比较——深入探讨数据类型、分页查询、表创建与数据插入、函数和索引等关键语法差异,为跨数据库开发提供实用指导
        【8月更文挑战第31天】SQL Server、MySQL和PostgreSQL是当今最流行的关系型数据库管理系统,均使用SQL作为查询语言,但在语法和功能实现上存在差异。本文将比较它们在数据类型、分页查询、创建和插入数据以及函数和索引等方面的异同,帮助开发者更好地理解和使用这些数据库。尽管它们共用SQL语言,但每个系统都有独特的语法规则,了解这些差异有助于提升开发效率和项目成功率。
        70 0
        |
        21天前
        |
        SQL 关系型数据库 MySQL
        【揭秘】MySQL binlog日志与GTID:如何让数据库备份恢复变得轻松简单?
        【8月更文挑战第22天】MySQL的binlog日志记录数据变更,用于恢复、复制和点恢复;GTID为每笔事务分配唯一ID,简化复制和恢复流程。开启binlog和GTID后,可通过`mysqldump`进行逻辑备份,包含binlog位置信息,或用`xtrabackup`做物理备份。恢复时,使用`mysql`命令执行备份文件,或通过`innobackupex`恢复物理备份。GTID模式下的主从复制配置更简便。
        90 2
        |
        16天前
        |
        弹性计算 关系型数据库 数据库
        手把手带你从自建 MySQL 迁移到云数据库,一步就能脱胎换骨
        阿里云瑶池数据库来开课啦!自建数据库迁移至云数据库 RDS原来只要一步操作就能搞定!点击阅读原文完成实验就可获得一本日历哦~
        |
        19天前
        |
        关系型数据库 MySQL 数据库
        RDS MySQL灾备服务协同解决方案构建问题之数据库备份数据的云上云下迁移如何解决
        RDS MySQL灾备服务协同解决方案构建问题之数据库备份数据的云上云下迁移如何解决
        |
        16天前
        |
        人工智能 小程序 关系型数据库
        【MySQL】黑悟空都掌握的技能,数据库隔离级别全攻略
        本文以热门游戏《黑神话:悟空》为契机,深入浅出地解析了数据库事务的四种隔离级别:读未提交、读已提交、可重复读和串行化。通过具体示例,展示了不同隔离级别下的事务行为差异及可能遇到的问题,如脏读、不可重复读和幻读等。此外,还介绍了在MySQL中设置隔离级别的方法,包括全局和会话级别的调整,并通过实操演示了各隔离级别下的具体效果。本文旨在帮助开发者更好地理解和运用事务隔离级别,以提升数据库应用的一致性和性能。
        95 2
        【MySQL】黑悟空都掌握的技能,数据库隔离级别全攻略
        |
        21天前
        |
        数据可视化 关系型数据库 MySQL
        Mysql8 如何在 Window11系统下完成跳过密钥校验、完成数据库密码的修改?
        这篇文章介绍了如何在Windows 11系统下跳过MySQL 8的密钥校验,并通过命令行修改root用户的密码。
        Mysql8 如何在 Window11系统下完成跳过密钥校验、完成数据库密码的修改?
        |
        19天前
        |
        SQL 关系型数据库 MySQL
        【MySQL 慢查询秘籍】慢SQL无处遁形!实战指南:一步步教你揪出数据库性能杀手!
        【8月更文挑战第24天】本文以教程形式深入探讨了MySQL慢SQL查询的分析与优化方法。首先介绍了如何配置MySQL以记录执行时间过长的SQL语句。接着,利用内置工具`mysqlslowlog`及第三方工具`pt-query-digest`对慢查询日志进行了详细分析。通过一个具体示例展示了可能导致性能瓶颈的查询,并提出了相应的优化策略,包括添加索引、缩小查询范围、使用`EXPLAIN`分析执行计划等。掌握这些技巧对于提升MySQL数据库性能具有重要意义。
        50 1

        热门文章

        最新文章