【SQL Server】数据库开发指南(一)数据库设计

本文涉及的产品
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
云数据库 RDS SQL Server,基础系列 2核4GB
简介: 在实际的软件项目中,如果系统中需要存储的数据量比较大,需要设计的表比较多,表与表之间的关系比较复杂,那我们就需要进行规范的数据库设置。如果不经过数据库的设计,我们构建的数据库不合理、不恰当,那么数据库的维护、运行效率会有很大的问题。这将直接影响到项目的运行性和可靠性。

@[toc]

一、数据库设计的必要性

在实际的软件项目中,如果系统中需要存储的数据量比较大,需要设计的表比较多,表与表之间的关系比较复杂,那我们就需要进行规范的数据库设置。如果不经过数据库的设计,我们构建的数据库不合理、不恰当,那么数据库的维护、运行效率会有很大的问题。这将直接影响到项目的运行性和可靠性。

二、什么是数据库设计

数据库设计是指在建立数据库之前,通过分析和规划,确定数据模型、数据结构、数据表、数据关系、数据约束等一系列数据库的组成要素,以及如何存储、检索和维护数据的方法。

数据库设计实际上就是规划和结构化数据库中的数据对象以及这些数据对象之间的关系过程。

三、数据库设计的重要性

  • 不经过设计的数据库或是设计糟糕的数据库很可能导致

    1. 数据库运行效率地下
    2. 更新、删除、添加数据出现问题
  • 良好设计的数据库

    1. 执行效率高
    2. 使应用程序更便于开发
    3. 扩展性好
    4. 维护性好

数据库设计是建立可靠、高效、易于维护的数据库系统的基础,它可以确保数据一致性,提高数据访问效率。

五、数据模型

数据模型就像是数据间联系的一个轮廓图,整个模型就像一个框架。

如果按照记录间联系的表示方式,对数据模型进行分类,可以分为:层次模型、网状模型、关系模型。前两种又称为格式化数据模型。数据模型的好坏直接影响到数据库的性能,所以数据模型的选择是数据库设计的首要任务。

5.1 实体-关系(E-R)数据模型

E-R数据模型(Entity - Relationship data model),即实体 - 关系数据模型。E-R数据模型不同于传统的关系数据模型,它不是面向实现,而是面向现实物体的。它是最常用的数据建模技术之一,用于设计关系型数据库系统。E-R数据模型是一种图形化方法,是一种用于描述实体、属性和它们之间关系的方法。

5.2 实体(Entity)

数据是用来描述现实中的物体的,而描述的对象都是形形色色的,有具体的、也有抽象的;有物理上存在的、也有概念性的。凡是可以互相区别而且可以被人们认识的事、物、概念等统统抽象为实体。多个相同的类型的实体可以称为实体集(Entity set)。因此,在E-R数据模型中,也有型与值之分;实体可以作为型来定义,每个实体可以是它的实例和值。

5.3 属性(Attribute)

实体一般具体若干特征,这些特征称为实体的属性。而每个属性都有自己的取值范围,在E-R数据模型中称为值集(value set)。在同一实体集中,每个实体的属性及其值集都是相同的,但可能取不同的值。属性对应数据库表的列。

5.5 关系(Relationship)

实体之间会有各种关系,这些关系抽象为联系。不但实体可以有属性,关系也可以有属性。

六、数据库设计步骤

数据库设计可以分为以下几个阶段

  1. 需求分析阶段:分析客户的业务需求,特别是数据方面的需求
  2. 概要设计阶段:绘制数据库的E-R图,并确认需求文档的正确性和完整性,E-R图是项目的设计人员、开发人员、测试人员,以及和客户进行沟通的重要凭据
  3. 详细设计阶段:将概要设计阶段的E-R图转换为数据库表,进行逻辑设计,确定各个表之间的主外键关系,运用数据库的三范式进行审核,并进行技术评审。最后决定选哪种数据库(Oracle、SQLServer、MySQL)来建库、建表。

6.1 需求分析阶段:数据库系统分析

需求分析阶段的重点是调查、收集、分析客户的业务数据需求以及数据的安全性、完整性需求等。

需求分析步骤:

  1. 确认业务需求
  2. 标识关系实体
  3. 标识每个实体的具有的属性
  4. 确认实体之间的关系

6.2 概要设计阶段:绘制 E-R 图

作为数据库设计者,你需要和项目组内其他成员分享你的设计思路,共同研讨数据库设计的合理性、安全性、完整性,并确认是否符合客户的业务需求。那么使用 E-R 图,这种图形化的表示方式最为直观。

6.2.1 E-R 图中的实体、属性和关系

在 E-R 数据模型中,实体被表示为矩形,属性被表示为椭圆形,关系被表示为菱形。实体代表现实世界中的一个对象或概念,属性是实体的特征或属性,而关系是实体之间的连接。

image

上面的简单 E-R 图可以看出学生和饭卡之间的关系。在上图中可以看出:用矩形表示实体实体是一般名词椭圆表示属性一般也是名词菱形表示关系一般是动词

6.2.2 映射基数

映射基数表示可以通过关系与该实体的个数。对于实体集 A 和 B 之间的二元关系,可能的映射基数有:

6.2.2.1 一对一关系

也就是 A 实体中最多只有一个 B 实体的关联,而 B 实体的最多只有一个 A 实体的关联。用 E-R 图表示:

在这里插入图片描述

6.2.2.2 一对多关系

A 实体可以与 B 实体任意数量的进行关联,B 中的实体最多与 A 中的一个实体关联。E-R 图表示:

在这里插入图片描述

6.2.2.3 多对一关系

3、 多对一:A 实体最多与一个 B 实体进行关联,而 B 实体可以和任意多个A实体进行关联。E-R 图表示:

在这里插入图片描述

6.2.2.5 多对多关系

4、 多对多:A 实体可以有多个 B 实体,而B实体也可以有任意多个 A 实体。E-R 图表示:

image

6.2.3 E-R 总结

E-R 图可以以图形化的方式将数据库的整个逻辑结构表示出来,组成部分有:

  1. 矩形表示实体集
  2. 椭圆表示属性
  3. 菱形表示关系
  4. 直线用来连接实体集与属性、实体集和关系
  5. 直线、箭头表示实体集之间映射基数
注意在上述关系图中,箭头所指的方向基数为1,也可以都没有箭头,在关系线上用1表示即可

6.3 详细设计阶段:将 E-R 图转换为表

步骤如下:

  1. 将各个实体转换为对应的表,将各属性转换为对应的列
    对于 E-R 图中的每个实体,创建一张对应的表,表名应该与实体名相同或者相似。每个表应该包含与实体相关的所有属性,这些属性应该被转换为表的列。
  2. 标识每张表的主键
    每张表都需要一个主键来唯一标识表中的每一行。通常情况下,实体中的一个属性会被选定为主键。如果没有合适的属性可以用作主键,则可以为表添加一个自增长的整数列作为主键。
  3. 将实体之间的关系转换为表与表之间的主外键关系
    对于 E-R 图中的每个关系,需要将它们转换为表与表之间的主外键关系。每个关系将在其对应的表中生成一个外键列。该列将引用另一个表中的主键列。

更多详细关于 E-R 图的画法以及介绍推荐可以参看:数据库系统设计原理--E-R模型

七、数据库设计规范化

7.1 数据库设计中经常出现的问题

  1. 数据冗余大
  2. 插入数据异常
  3. 删除异常
  4. 更新异常

7.2 规范设计

一个较好的关系数据库模型,它的每个关系中的属性一定要满足某种内在的语义条件,即要按一定的规范设计关系模型,这就是设计的规范化。

在数据库设计时,有一些专门的规则,称为数据库的设计范式,遵循这些规则,就可以创建出良好的数据库,数据库著名的三大范式理论:

  1. 第一范式(1NF)

第一范式是满足关系数据库模型所要遵循的最基本的条件范式,几关系中的每个属性必须是不可再分的简单项,不能是属性组合,即属性的取值是不可拆分的原子值。

  1. 第二范式(2NF)

第二范式是在第一范式的基础上,确保表中的每列都和主键相关。其定义是如果一个关系满足1NF,并且除了主键关系外的其他列都依赖于该主键,则满足第二范式。

  1. 第三范式(3NF)

第三范式是在第二范式的基础上进行的,第三范式的目标是确保每列都和主键列直接相关,而不是间接相关的。其定义是:如果一个关系满足2NF,并且除主键外的其他列都不传递依赖于该主键。

更多关于范式的介绍,请参阅:[ 数据库原理 ] 举例讲解数据库范式(1NF、2NF、3NF、BCNF)与不满足数据库范式的影响

7.3 规范化和性能关系

为了满足三大范式,数据库的性能可能会有一定程度的降低。所以,在实际数据库设计中,我们既要尽量满足三大范式,从而避免数据冗余和各种数据库的操作异常,同时也要考虑数据的访问性能。有时候,为了提高数据库的访问效率,适当的允许少量数据冗余咧存在,才是最适合的数据库设计方案。

相关实践学习
使用SQL语句管理索引
本次实验主要介绍如何在RDS-SQLServer数据库中,使用SQL语句管理索引。
SQL Server on Linux入门教程
SQL Server数据库一直只提供Windows下的版本。2016年微软宣布推出可运行在Linux系统下的SQL Server数据库,该版本目前还是早期预览版本。本课程主要介绍SQLServer On Linux的基本知识。 相关的阿里云产品:云数据库RDS SQL Server版 RDS SQL Server不仅拥有高可用架构和任意时间点的数据恢复功能,强力支撑各种企业应用,同时也包含了微软的License费用,减少额外支出。 了解产品详情: https://www.aliyun.com/product/rds/sqlserver
目录
相关文章
|
26天前
|
SQL 缓存 监控
大厂面试高频:4 大性能优化策略(数据库、SQL、JVM等)
本文详细解析了数据库、缓存、异步处理和Web性能优化四大策略,系统性能优化必知必备,大厂面试高频。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
大厂面试高频:4 大性能优化策略(数据库、SQL、JVM等)
|
6天前
|
SQL 关系型数据库 MySQL
MySQL导入.sql文件后数据库乱码问题
本文分析了导入.sql文件后数据库备注出现乱码的原因,包括字符集不匹配、备注内容编码问题及MySQL版本或配置问题,并提供了详细的解决步骤,如检查和统一字符集设置、修改客户端连接方式、检查MySQL配置等,确保导入过程顺利。
|
12天前
|
SQL 数据库
gbase 8a 数据库 SQL优化案例-关联顺序优化
gbase 8a 数据库 SQL优化案例-关联顺序优化
|
26天前
|
SQL 存储 Linux
从配置源到数据库初始化一步步教你在CentOS 7.9上安装SQL Server 2019
【11月更文挑战第8天】本文介绍了在 CentOS 7.9 上安装 SQL Server 2019 的详细步骤,包括系统准备、配置安装源、安装 SQL Server 软件包、运行安装程序、初始化数据库以及配置远程连接。通过这些步骤,您可以顺利地在 CentOS 系统上部署和使用 SQL Server 2019。
|
27天前
|
SQL 存储 Linux
从配置源到数据库初始化一步步教你在CentOS 7.9上安装SQL Server 2019
【11月更文挑战第7天】本文介绍了在 CentOS 7.9 上安装 SQL Server 2019 的详细步骤,包括系统要求检查与准备、配置安装源、安装 SQL Server 2019、配置 SQL Server 以及数据库初始化(可选)。通过这些步骤,你可以成功安装并初步配置 SQL Server 2019,进行简单的数据库操作。
|
1月前
|
SQL 数据采集 监控
局域网监控电脑屏幕软件:PL/SQL 实现的数据库关联监控
在当今网络环境中,基于PL/SQL的局域网监控系统对于企业和机构的信息安全至关重要。该系统包括屏幕数据采集、数据处理与分析、数据库关联与存储三个核心模块,能够提供全面而准确的监控信息,帮助管理者有效监督局域网内的电脑使用情况。
19 2
|
2月前
|
存储 数据挖掘 数据库
数据库数据恢复—SQLserver数据库ndf文件大小变为0KB的数据恢复案例
一个运行在存储上的SQLServer数据库,有1000多个文件,大小几十TB。数据库每10天生成一个NDF文件,每个NDF几百GB大小。数据库包含两个LDF文件。 存储损坏,数据库不可用。管理员试图恢复数据库,发现有数个ndf文件大小变为0KB。 虽然NDF文件大小变为0KB,但是NDF文件在磁盘上还可能存在。可以尝试通过扫描&拼接数据库碎片来恢复NDF文件,然后修复数据库。
|
2月前
|
SQL JSON Java
没有数据库也能用 SQL
SPL(Structured Process Language)是一款开源软件,允许用户直接对CSV、XLS等文件进行SQL查询,无需将数据导入数据库。它提供了标准的JDBC驱动,支持复杂的SQL操作,如JOIN、子查询和WITH语句,还能处理非标准格式的文件和JSON数据。SPL不仅简化了数据查询,还提供了强大的计算能力和友好的IDE,适用于多种数据源的混合计算。
|
2月前
|
SQL 数据库
SQL数据库基础语法入门
[link](http://www.vvo.net.cn/post/082935.html)
|
2月前
|
SQL 存储 关系型数据库
mysql 数据库空间统计sql
mysql 数据库空间统计sql
47 0