数据库技术-数据库概念设计

简介: 数据库技术-数据库概念设计

数据库结构设计

数据库概念设计

一个设计良好的数据库,在很大程度上决定了系统的成功与否。

概念设计是数据库设计的核心环节。通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型。

1、数据库概念设计的目标

定义和描述应用领域设计的数据范围

①获取信息模型

②描述数据的属性特征

③描述数据之间的关系

④定义和描述数据的约束

⑤说明数据的安全性要求

⑥支持用户的各种数据处理需求

⑦保证信息模型能转化成数据库的逻辑结构(即数据库模式)。

2、过程:

(1)明确建模目标(模型覆盖范围)

(2)定义实体集(自底向上标识和定义实体集)

(3)定义联系(实体间关联关系)


(4)建立信息模型(构造ER模型)

(5)确定实体集属性(属性描述一个实体集的特征或性质)

(6)对信息模型进行集成与优化(检查和消除命名不一致、结构不一致等)

概念设计是DB设计的核心环节。概念数据模型是对现实世界的抽象和模拟。


3、概念模型设计

概念设计目前采用最广泛的是ER建模方法。将现实世界抽象为具有属性的实体及联系。

1976年,Peter.Chen提出E-R模型(Entity- Relationship Model),即实体联系模型,用E-R图来描述数据库的概念模型。

观点:世界是由一组称作实体的基本对象和这些对象之间的联系构成的。


与E-R模型有关的概念

实体(Entity)或实例(Instance)

客观存在并可相互区分的事物叫实体。

如学生张三、工人李四、计算机系、数据库概论。

实体集(Entity Set)

同型实体的集合称为实体集。

如全体学生。

属性(Attribute)

实体所具有的某一特性。一个实体可以由若干个属性来刻画。每个属性的取值范围称为域。

例如,学生可由学号、姓名、年龄、系、年级等组成。

码(Key):

实体集中唯一标识每一个实体的属性或属性组合。

用来区别同一实体集中的不同实体的称作主码。(主键)

一个实体集中任意两个实体在主码上的取值不能相同。

如学号是学生实体的主码。(主键)

联系(Relationship)

描述实体之间的相互关系。

如学生与老师间的授课关系,学生与学生间有班长关系。

联系也可以有属性,如学生与课程之间有选课联系,每个选课联系都有一个成绩作为其属性。

同类联系的集合称为联系集。

实体间的联系有三类:

实体之间的联系的数量,即一个实体通过一个联系集能与另一实体集相关联的实体的数目。

一对一联系(1:1)

如:“系”与“系主任”(一个系只有一个系主任,一个系主任只负责管理一个系)

一对多联系(1:n )

如:“系”与“学生”(一个系招收若干学生,一个学生只属于一个系)

多对多联系(m:n)

如:“学生”与“课程”(一名学生可选修多门课程,每门课程可被多名学生选修)image.png

1、逻辑设计的任务:

将概念模型(如ER图)转化为DBMS支持的数据模型(如关系模型),并对其进行优化。

2、逻辑设计的依据和阶段目标:

image.png 

关系模型

有三种主要的数据模型:层次模型、网状模型、关系模型。其中关系模型简单灵活,并有着坚实的理论基础,已成为当前最流行的数据模型。

关系模型就是用二维表格结构来表示实体及实体之间联系的模型。

关系的描述称为关系模式(Relation Schema)。关系模式由五部分组成,即它是一个五元组:R(U, D, DOM, F)


R:关系名    U:组成该关系的属性名集合     D:属性组U中属性所来自的域    DOM:属性到域的映射    F:属性组U上的一组数据依赖

由于D、DOM对模式设计的关系不大,这里把关系模式简化为一个三元组:

R<U, F>,当且仅当U上的一个关系R满足F时,R称为关系模式R<U,F>的一个关系。


1、关系数据库设计的核心:关系模式的设计。
2、关系模式的设计目标:按照一定的原则从数量众多而又相互关联的数据中,构造出一组既能较好地反映现实世界,而又有良好的操作性能的关系模式。


数据依赖

定义:

设R(U)是一个属性集U上的关系模式,X和Y是U的子集。若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等,而在Y上的属性值不等,则称“X函数确定Y”或“Y函数依赖于X”,记作X→Y。

数据依赖

关系内部属性与属性之间的一种约束关系,是现实世界属性间相互联系的抽象

数据的内在性质

语义的体现,完整性约束的表现形式

限定属性的取值范围,如年龄<60,定义属性间值的相互关联(主要体现于值的相等与否),这就是数据依赖


数据依赖的类型

函数依赖(Functional Dependency,FD)普遍存在于生活中,这种依赖关系类似于数学中的函数y=f(x),自变量x确定之后,相应的函数值y也就唯一地确定了。如关系:公民(身份证号,姓名,地址,工作单位)身份证号一确定,则其地址就唯一确定,因此地址函数依赖身份证号。而姓名一确定,不一定能确定地址。


多值依赖(Multivalued Dependency,MD)

教师号可能多值依赖课程号,因为给定一个(课程号,参考书号)的组合,可能有对应多个教师号。这是因为多个老师可以使用相同或不同的参考书上同一门课。

简单点讲,函数就是唯一确定的关系;多值依赖却不能唯一确定。


候选码、主码、外码

我们已经知道,如果某属性组的值能唯一确定整个元组的值,则称该属性组为候选码或侯选关键字。

例如:(学号,姓名,性别,年龄)中,学号是关键字,(学号,姓名)不是关键字,性别不是关键字。

候选码如果有多个,可以选其中的一个作为主码(Primary Key) 。


数据规范化

关系数据库的设计主要是关系模式设计。关系模式设计的好坏直接影响到数据库设计的成败。将关系模式规范化,是设计较好的关系模式的惟一途径。

关系模式的规范化主要是由关系范式来完成的。

关系模式的规范化:把一个低一级的关系模式分解为高一级关系模式的过程。        

关系数据库的规范化理论是数据库逻辑设计的工具。

目的:尽量消除插入、删除异常,修改复杂,数据冗余的问题。


范式

范式:关系模式满足的约束条件称为范式。根据满足规范化的程度不同,范式由低到高分为1NF,2NF,3NF,BCNF,4NF,5NF。

1NF:如果关系模式R,其所有属性都是不可再分的基本数据项,则称R属于第一范式,R∈1NF。


相关文章
|
1月前
|
数据库 索引
深入探索数据库索引技术:回表与索引下推解析
【10月更文挑战第15天】在数据库查询优化的领域中,回表和索引下推是两个核心概念,它们对于提高查询性能至关重要。本文将详细解释这两个术语,并探讨它们在数据库操作中的作用和影响。
50 3
|
1月前
|
数据库 索引
深入理解数据库索引技术:回表与索引下推详解
【10月更文挑战第23天】 在数据库查询性能优化中,索引的使用是提升查询效率的关键。然而,并非所有的索引都能直接加速查询。本文将深入探讨两个重要的数据库索引技术:回表和索引下推,解释它们的概念、工作原理以及对性能的影响。
60 3
|
2月前
|
存储 NoSQL 关系型数据库
数据库技术深度解析:从基础到进阶
【10月更文挑战第17天】数据库技术深度解析:从基础到进阶
78 0
|
1月前
|
负载均衡 网络协议 数据库
选择适合自己的数据库多实例负载均衡技术
【10月更文挑战第23天】选择适合自己的数据库多实例负载均衡技术需要全面考虑多种因素。通过深入的分析和评估,结合自身的实际情况,能够做出明智的决策,为数据库系统的高效运行提供有力保障。
111 61
|
1月前
|
SQL Java 数据库连接
在Java应用中,数据库访问常成为性能瓶颈。连接池技术通过预建立并复用数据库连接,有效减少连接开销,提升访问效率
在Java应用中,数据库访问常成为性能瓶颈。连接池技术通过预建立并复用数据库连接,有效减少连接开销,提升访问效率。本文介绍了连接池的工作原理、优势及实现方法,并提供了HikariCP的示例代码。
47 3
|
1月前
|
缓存 负载均衡 监控
数据库多实例的负载均衡技术深入
【10月更文挑战第23天】数据库多实例负载均衡技术是确保数据库系统高效运行的重要手段。通过合理选择负载均衡策略、实时监控实例状态、不断优化调整,能够实现资源的最优分配和系统性能的提升。在实际应用中,需要根据具体情况灵活运用各种负载均衡技术,并结合其他相关技术,以满足不断变化的业务需求。
|
1月前
|
Java 数据库连接 数据库
优化之路:Java连接池技术助力数据库性能飞跃
在Java应用开发中,数据库操作常成为性能瓶颈。频繁的数据库连接建立和断开增加了系统开销,导致性能下降。本文通过问题解答形式,深入探讨Java连接池技术如何通过复用数据库连接,显著减少连接开销,提升系统性能。文章详细介绍了连接池的优势、选择标准、使用方法及优化策略,帮助开发者实现数据库性能的飞跃。
30 4
|
1月前
|
Java 数据库连接 数据库
深入探讨Java连接池技术如何通过复用数据库连接、减少连接建立和断开的开销,从而显著提升系统性能
在Java应用开发中,数据库操作常成为性能瓶颈。本文通过问题解答形式,深入探讨Java连接池技术如何通过复用数据库连接、减少连接建立和断开的开销,从而显著提升系统性能。文章介绍了连接池的优势、选择和使用方法,以及优化配置的技巧。
30 1
|
1月前
|
SQL Java 数据库连接
打破瓶颈:利用Java连接池技术提升数据库访问效率
在Java应用中,数据库访问常成为性能瓶颈。连接池技术通过预建立并复用数据库连接,避免了频繁的连接建立和断开,显著提升了数据库访问效率。常见的连接池库包括HikariCP、C3P0和DBCP,它们提供了丰富的配置选项和强大的功能,帮助优化应用性能。
52 2
|
2月前
|
存储 SQL NoSQL
数据库技术深度探索:从关系型到NoSQL的演变
【10月更文挑战第21天】数据库技术深度探索:从关系型到NoSQL的演变
59 1