前言
前文讲了关系模型,以及设计一个关系模型所考虑的三个角度:数据结构、完整性约束以及操作方式。
对于关系模型来说:数据结构就是关系。完整性约束有:1、主体完整性 2、参照完整性 3、用户完整性
接下去我们来研究关系模型中的操作方式,也就是我们在关系模型中能对关系做哪些操作以及用什么方法去表示这些操作
总结来看研究操作方式就是研究两个问题:1、表示方法 2、操作种类
以下练习题数据库关系参照下图:
关系模型的操作方式
问题1——表示方法
操作表示方法比较
对于关系模型的操作类型的表示通常有两种:1、SQL语言描述 2、关系代数描述
两者的关系如下:
关系代数通过符号化、数学化的语言,来描述数据库的行为关系,相当于简化版的 SQL。比如并,交,差,笛卡尔积,除法,选择,投影等等。
SQL 则是结构化查询语句,相比于关系代数,更方便被计算机识别的一种查询语言。
更加严谨的说法(摘录自《数据库系统概念》)
关系数据模型有三种等价的操作语言:关系代数、SQL、关系演算(元组关系演算和域关系演算)。
它们的非过程化程度依次递增,主要应用领域也不同.SQL是关系数据库的标准语言,关系代数和关系演算是它的理论基础.大多商用的DBMS先把用户提交的SQL查询转化成等价的扩展关系代数表达式,在执行之前需要根据等价规则对其优化。
所以,我们先从简单的入手,先从关系代数的角度去描述对关系数据库的操作
关系代数对于空值的处理
选择:保留确定为真的元组
投影等:不确定为真的NULL值也会保留
关系模型数据语言特点
总结
一、操作对象以及所得结果都是关系
二、 操作符单一,语言类型单一
三、非过程化语言,只要描述目的需求,并不说明如何做
问题2——操作种类
基本运算
选择、投影、更名、笛卡尔积、集合并、集合差
选择:对行进行操作,可以理解为选择满足要求的记录
投影:选择满足要求的属性 ,可以理解为对列进行操作,结果会去掉相同的元组
笛卡尔积: 关系之间做笛卡尔积结果就是:关系之间组合出所有可能
不难得到R和S的笛卡尔积的记录数量等于R的记录数*S的记录数
特殊的:
如果遇到两个关系中存在同名属性,关系代数会自动在属性名前面加上关系名
课堂小练习——下面哪条语句执行效率更高?
答案是:第二条语句(先选择再笛卡尔积再选择,效率高于笛卡尔积后选择)(可以从算法时间复杂度来理解,前者把后者中部分的乘复杂度转为了加复杂度)
并运算:本质就是把两个关系里面的元组合并到一个新的关系里面,但是要求两个关系相容。
相容有两个要求:1、两个关系的属性数量相同。2、两个关系上对应属性的数据类型相同。
差运算: 所有出现在一个关系而不在另一个关系中的元组集合,同样要求R和S必须是相容的
课堂小练习
答案:方案一、方案三(方案二这种是在一对多关系中的典型错误)
更名运算:对关系代数表达式的运算结果进行更名,创建新副本+更名3。返回结果为E的运算结果
课堂练习1:
查询数学成绩比王红同学数学成绩高的学生姓名
优化后结果: 优化本质:先筛选再笛卡尔积、
课堂练习2:
利用自然连接=笛卡尔积+筛选的本质进行处理
课堂练习3:
(具体数据库示例见前言)
注意:自然连接=笛卡尔积+选择条件+选择后列合并。本题中选c2的同学学号,和选c1的同学学号进行自然连接,得到的就是两者都选的同学学号
课堂练习4:
此处的更名是必要的
课堂练习3:
(具体数据库示例见前言)
注意:自然连接=笛卡尔积+选择条件+选择后列合并。本题中选c2的同学学号,和选c1的同学学号进行自然连接,得到的就是两者都选的同学学号
其他运算
集合交、θ连接、自然连接、除、赋值
θ连接:本质就是笛卡尔积+选择条件。先进行笛卡尔积运算得到新的关系,然后对这个关系进行选择得到最终结果(选择条件可以自己写)
自然连接:本质就是笛卡尔积 +选择条件+选择后列合并(选择条件就是相同属性名的值要求相等)+删除重复的属性
集合交:集合交运算可以用集合并运算和集合差运算来代替 ,同样参与交运算的关系必须是相容的
课堂小练习
答案是:方案2(方案1的结果是空集合)
赋值运算:操作完成后把操作结果赋值给新的关系
除运算: 解决关系之间的包含问题,除运算=属性除+元组除。对于R/S,属性除就是直接在R中去掉S中的属性,元组除就是留下象集能够除尽S的元组。
象集与除运算:
举个例子:
课堂练习1:
查询选修了全部课程的学生的学号(数据库关系示例见前言)
课堂练习2:
查询至少选修了C1和C2课程的学生学号(数据库关系示例见前言)
正确答案是 方案一
方案二得到的是选修C1和C2并成绩相同的同学
课堂练习3:
除运算与基本运算的转化:
拓展关系
外连接
原因:
在进行自然连接时(T、TC、C关系进行),由于TC、C中的原因导致T中部分元组并没有显示出来,而有时我们想要即使存在NULL的属性也要显示元组
定义:
外连接:在自然连接时因失配发生信息丢失,利用外连接可以让其中一方关系附加一个取值全为空的元组。本质就是:外连接=自然连接+失配的元组
形式:
左侧关系中失配的元组:在和右侧关系的匹配中失败的元组,保留下左侧关系+空值关系
其他两个同理
例子:
聚集函数
定义 :
计算给定关系的统计信息(求和、求平均、求方差等),返回单一值。聚集函数的关系可以说多重集(一个元组可以出现多次),利用name-distinct可以使用去除重复元组的聚集函数
种类:
1、sum求和:
2、 avg平均值:
3、max/min最大最小值:
4、count计数:
聚集函数(分组)
定义:
将一个关系中的元组分为若干个组,并在组内使用聚集函数
示例:
课堂练习:
正确答案为:方案一
总结
本文的所有知识点、图片均来自《数据库系统概念》(黑宝书)、山东大学李晖老师PPT。不可用于商业用途转发。
本篇已经码了五个多小时了,算是最完整最长篇幅的一篇数据库关系代数的文章了
如果能帮助到大家,大家可以点点赞、收收藏呀~