开发者社区> 王小王-123> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

数据库技术-数据库概念设计

简介: 数据库技术-数据库概念设计
+关注继续查看

数据库结构设计

数据库概念设计

一个设计良好的数据库,在很大程度上决定了系统的成功与否。

概念设计是数据库设计的核心环节。通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型。

1、数据库概念设计的目标

定义和描述应用领域设计的数据范围

①获取信息模型

②描述数据的属性特征

③描述数据之间的关系

④定义和描述数据的约束

⑤说明数据的安全性要求

⑥支持用户的各种数据处理需求

⑦保证信息模型能转化成数据库的逻辑结构(即数据库模式)。

2、过程:

(1)明确建模目标(模型覆盖范围)

(2)定义实体集(自底向上标识和定义实体集)

(3)定义联系(实体间关联关系)


(4)建立信息模型(构造ER模型)

(5)确定实体集属性(属性描述一个实体集的特征或性质)

(6)对信息模型进行集成与优化(检查和消除命名不一致、结构不一致等)

概念设计是DB设计的核心环节。概念数据模型是对现实世界的抽象和模拟。


3、概念模型设计

概念设计目前采用最广泛的是ER建模方法。将现实世界抽象为具有属性的实体及联系。

1976年,Peter.Chen提出E-R模型(Entity- Relationship Model),即实体联系模型,用E-R图来描述数据库的概念模型。

观点:世界是由一组称作实体的基本对象和这些对象之间的联系构成的。


与E-R模型有关的概念

实体(Entity)或实例(Instance)

客观存在并可相互区分的事物叫实体。

如学生张三、工人李四、计算机系、数据库概论。

实体集(Entity Set)

同型实体的集合称为实体集。

如全体学生。

属性(Attribute)

实体所具有的某一特性。一个实体可以由若干个属性来刻画。每个属性的取值范围称为域。

例如,学生可由学号、姓名、年龄、系、年级等组成。

码(Key):

实体集中唯一标识每一个实体的属性或属性组合。

用来区别同一实体集中的不同实体的称作主码。(主键)

一个实体集中任意两个实体在主码上的取值不能相同。

如学号是学生实体的主码。(主键)

联系(Relationship)

描述实体之间的相互关系。

如学生与老师间的授课关系,学生与学生间有班长关系。

联系也可以有属性,如学生与课程之间有选课联系,每个选课联系都有一个成绩作为其属性。

同类联系的集合称为联系集。

实体间的联系有三类:

实体之间的联系的数量,即一个实体通过一个联系集能与另一实体集相关联的实体的数目。

一对一联系(1:1)

如:“系”与“系主任”(一个系只有一个系主任,一个系主任只负责管理一个系)

一对多联系(1:n )

如:“系”与“学生”(一个系招收若干学生,一个学生只属于一个系)

多对多联系(m:n)

如:“学生”与“课程”(一名学生可选修多门课程,每门课程可被多名学生选修)image.png

 1、逻辑设计的任务:

将概念模型(如ER图)转化为DBMS支持的数据模型(如关系模型),并对其进行优化。

 2、逻辑设计的依据和阶段目标:

image.png 

关系模型

有三种主要的数据模型:层次模型、网状模型、关系模型。其中关系模型简单灵活,并有着坚实的理论基础,已成为当前最流行的数据模型。

关系模型就是用二维表格结构来表示实体及实体之间联系的模型。

关系的描述称为关系模式(Relation Schema)。关系模式由五部分组成,即它是一个五元组:R(U, D, DOM, F)


R:关系名    U:组成该关系的属性名集合     D:属性组U中属性所来自的域    DOM:属性到域的映射    F:属性组U上的一组数据依赖

由于D、DOM对模式设计的关系不大,这里把关系模式简化为一个三元组:

R<U, F>,当且仅当U上的一个关系R满足F时,R称为关系模式R<U,F>的一个关系。


1、关系数据库设计的核心:关系模式的设计。
2、关系模式的设计目标:按照一定的原则从数量众多而又相互关联的数据中,构造出一组既能较好地反映现实世界,而又有良好的操作性能的关系模式。


数据依赖

定义:

设R(U)是一个属性集U上的关系模式,X和Y是U的子集。若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等,而在Y上的属性值不等,则称“X函数确定Y”或“Y函数依赖于X”,记作X→Y。

数据依赖

关系内部属性与属性之间的一种约束关系,是现实世界属性间相互联系的抽象

数据的内在性质

语义的体现,完整性约束的表现形式

限定属性的取值范围,如年龄<60,定义属性间值的相互关联(主要体现于值的相等与否),这就是数据依赖


数据依赖的类型

函数依赖(Functional Dependency,FD)普遍存在于生活中,这种依赖关系类似于数学中的函数y=f(x),自变量x确定之后,相应的函数值y也就唯一地确定了。如关系:公民(身份证号,姓名,地址,工作单位)身份证号一确定,则其地址就唯一确定,因此地址函数依赖身份证号。而姓名一确定,不一定能确定地址。


多值依赖(Multivalued Dependency,MD)

教师号可能多值依赖课程号,因为给定一个(课程号,参考书号)的组合,可能有对应多个教师号。这是因为多个老师可以使用相同或不同的参考书上同一门课。

简单点讲,函数就是唯一确定的关系;多值依赖却不能唯一确定。


候选码、主码、外码

我们已经知道,如果某属性组的值能唯一确定整个元组的值,则称该属性组为候选码或侯选关键字。

例如:(学号,姓名,性别,年龄)中,学号是关键字,(学号,姓名)不是关键字,性别不是关键字。

候选码如果有多个,可以选其中的一个作为主码(Primary Key) 。


数据规范化

关系数据库的设计主要是关系模式设计。关系模式设计的好坏直接影响到数据库设计的成败。将关系模式规范化,是设计较好的关系模式的惟一途径。

关系模式的规范化主要是由关系范式来完成的。

关系模式的规范化:把一个低一级的关系模式分解为高一级关系模式的过程。        

关系数据库的规范化理论是数据库逻辑设计的工具。

目的:尽量消除插入、删除异常,修改复杂,数据冗余的问题。


范式

范式:关系模式满足的约束条件称为范式。根据满足规范化的程度不同,范式由低到高分为1NF,2NF,3NF,BCNF,4NF,5NF。

1NF:如果关系模式R,其所有属性都是不可再分的基本数据项,则称R属于第一范式,R∈1NF。


版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
数据库技术-数据库需求分析、数据流概念
数据库技术-数据库需求分析、数据流概念
15 0
数据库必知概念
数据库必知概念
36 0
数据挖掘-概念
概念 加权算术均值: 众数:集合中出现最频繁的值。一般具有两个或更多众数的数据集是多峰(multimodal)的。
843 0
数据库设计
<p><br></p> <p><br></p> <p></p> <p class="p0" style="margin-top:0pt; margin-bottom:0pt; padding-top:0px; padding-bottom:0px; font-family:Helvetica,Tahoma,Arial,sans-serif; font-size:14px; line-
2116 0
数据挖掘中的概念描述
数据挖掘一般可分为描述型数据挖掘和预测型数据挖掘,概念描述讲的就是描述型数据挖掘。 一、概念描述基本知识 1.1 两种类型的数据挖掘 从数据分析角度出发,数据挖掘可分为两种类型: 描述型数据挖掘:以简洁概要方式描述数据 预测型数据挖掘:预测性数据挖掘则是通过对所提供数据集应用特定方法分析所获得的一个或一组数据模型,并将该模型用于预测未来新数据的有关性质。
1008 0
数据库设计
数据库的设计既要满足用户的需求,又与给定的应用环境密切相关,因此必须采用系统化、规范化的设计方法,按需求分析、概念设计、逻辑设计、物理设计四个阶段展开。 需求分析就是分析用户的要求,是数据库设计的基础。
972 0
+关注
王小王-123
快乐代码,精彩人生!
268
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载