第一章
1.试述数据、数据库、数据库管理系统、数据库系统的概念
数据是数据库中存储的基本对象。数据与其语义是不可分的。
数据库是长期存储在计算机内,有组织的、可共享的大量数据的集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。
数据库管理系统(DBMS)是位于用户与操作系统之间的一层数据管理软件。数据库管理系统是计算机的基础软件。
数据库系统(DBS)是由数据库、数据库管理系统(及其应用开发工具)、应用程序和数据库管理员(DBA)组成的存储、管理、处理和维护数据的系统。
6.数据库管理系统的主要功能有哪些?
数据定义功能;数据组织、存储和管理;数据操纵功能;数据库的事务管理和运行管理;数据库的建立和维护功能;其他功能。
15.论述数据库系统的三级模式,并说明这种结构的优点是什么。
数据库系统的三级模式结构是指数据库系统是由外模式、模式和内模式三级构成。
数据库系统的三级模式是对数据的三个抽象级别,它把数据的具体组织留给DBMS管理,使用户能逻辑抽象地处理数据,而不必关心数据在计算机中的表示和存储。为了能够在内部实现这三个抽象层次的联系和转换,数据库系统在这三级模式之间提供了两层映像:外模式/模式映像和模式/内模式映像。正是这两层映像保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。
17.什么叫数据与程序的物理独立性?什么叫数据与程序的逻辑独立性?为什么数据库系统具有数据与程序的独立性?
物理独立性是指用户的应用程序与数据库中数据的物理存储是相互独立的。
逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立 的。
数据与程序之间的独立性是的数据的定义和描述可以从应用程序中分离出去。另外,由于数据的存取由数据库管理系统管理,从而简化了应用程序的编制,大大减少了应用程序的维护和修改。
18.试述数据库系统的组成。
硬件平台及数据库;软件;人员。
第二章
3.定义并理解下列术语,说明它们之间的联系与区别:
(2)主码,候选码,外码;
(3)关系模式,关系,关系数据库。
(2)若关系中的某一属性组的值能唯一的标识一个元组,而其子集不能,则称该属性组为候选码。若一个关系有多个候选码,则选定其中一个为主码。设F是基本关系R的一个或一组属性,但不是关系R的码。如果F与基本关系S的主码Ks相对应,则称F是基本关系R的外码。
(3)关系的描述称为关系模式。关系是关系模式在某一时刻的状态或内容。关系模式时静态的、稳定的,而关系是动态的、随时间不断变化的。所有关系的集合构成一个关系数据库。关系数据库的型也称为关系数据库模式,是对关系数据库的描述,关系数据库的值是这些关系模式在某一时刻对应的关系的集合,通常就称为关系数据库。
6.
第三章
1.试述SQL的特点。
综合统一;高度非过程化;面向集合的操作方式;以同一种语法结构提供多种使用方式;语言简洁,易学易用。
6.什么是基本表?什么是视图?两者的区别和联系是什么?
基本表是本身独立存在的表,在SQL中一个关系就对应一个表。
视图是从一个或几个基本表(或视图)导出的表。是一个虚表。
7.试述视图的优点。
视图能够简化用户的操作;
视图使用户能以多种角度看待同一数据;
视图对重构数据库提供了一定程度的逻辑独立性;
视图能够对机密数据提供安全保护。
第四章
1.什么是数据库的安全性?
数据库的安全性是指保护数据库以防止不合法使用所造成的数据泄露、更改或破坏。
4.试述实现数据库安全性控制的常用方法和技术。
实现数据库安全性控制的常用方法和技术有:
1) 用户标识和鉴别:该方法由系统提供一定的方式让用户标识自己的名字或身份。每次用户要求进入系统时,由系统进行核对,通过鉴定后才提供系统的使用权。
2) 存取控制:通过用户权限定义和合法权检查确保只有合法权限的用户访问数据库,所有未被授权的人员无法存取数据。例如CZ 级中的自主存取控制( DAC ) , Bl 级中的强制存取控制(MAC )。
3) 视图机制:为不同的用户定义视图,通过视图机制把要保密的数据对无权存取的用户隐藏起来,从而自动地对数据提供一定程度的安全保护。
4) 审计:建立审计日志,把用户对数据库的所有操作自动记录下来放入审计日志中,DBA 可以利用审计跟踪的信息,重现导致数据库现有状况的一系列事件,找出非法存取数据的人、时间和内容等。
5) 数据加密:对存储和传输的数据进行加密处理,从而使得不知道解密算法的人无法获知数据的内容。
5.什么是数据库中的自主存取控制方法和强制存取控制方法?
自主存取控制方法:定义各个用户对不同数据对象的存取权限。当用户对数据库访问时首先检查用户的存取权限。防止不合法用户对数据库的存取。
强制存取控制方法:每一个数据对象被(强制地)标以一定的密级,每一个用户也被(强制地)授予某一个级别的许可证。系统规定只有具有某一许可证级别的用户才能存取某一个密级的数据对象。
第五章
1.什么是数据库的完整性?
数据库的完整性是指数据的正确性和相容性。
2.数据库的完整性概念与数据库的安全性概念有什么区别和联系?
数据的完整性和安全性是两个不同的概念,但是有一定的联系。 前者是为了防止数据库中存在不符合语义的数据,防止错误信息的输入和输出,即所谓垃圾进垃圾出所造成的无效操作和错误结果。后者是保护数据库防止恶意的破坏和非法的存取。也就是说,安全性措施的防范对象是非法用户和非法操作,完整性措施的防范对象是不合语义的数据。
7.在关系系统中,当操作违反实体完整性、参照完整性和用户定义完整性约束时,一般是如何分别进行处理的?
对于违反实体完整性和用户定义的完整性的操作一般都采用拒绝执行的方式进行处理。而对于违反参照完整性的操作,并不都是简 单地拒绝执行,有时要根据应用语义执行一些附加的操作,以保证数据库的正确性。
第六章
1 .理解并给出下列术语的定义:
函数依赖、部分函数依赖、完全函数依赖、传递依赖、候选码、主码、外码、全码(all-key)、1NF、ZNF、3NF、BCNF、多值依赖、4NF。
第七章
1.试述数据库设计过程
数据库设计的6个基本步骤:需求分析阶段、概念结构设计阶段、逻辑结构设计阶段、物理结构设计阶段、数据库实施阶段、数据库运行和维护阶段。
4.数据字典的内容和作用是什么?
数据字典通常包括数据项、数据结构、数据流、数据存储和处理过程几部分。其中数据项是数据的最小组成单位,若干个数据项可以组成一个数据结构。数据字典通过对数据项和数据结构的定义来描述数据流、数据存储的逻辑内容。
第十章
1.试述事务的概念及事务的4个特性。恢复技术能保证事务的哪些特性?
事务(Transaction)是用户定义的一个数据库操作序列,这些操作要么全做,要么全不做,是一个不可分割的工作单位。事务的ACID特性:原子性(Atomicity);一致性(Consistency);隔离性(Isolation);持续性(Durability )。恢复技术能保证事务的原子性、持续性。
3.登记日志文件时为什么必须先写日志文件,后写数据库?
写数据库和写日志文件是两个不同的操作,在这两个操作之间可能发生故障。如果先写了数据库修改,而在日志文件中没有登记下这个修改,则以后就无法恢复这个修改了。如果先写日志,但没有修改数据库,按日志文件恢复时只不过是多执行一次不必要的UNDO操作,并不会影响数据库的正确性。
6.针对不同的故障,试给出恢复的策略和方法。(即如何进行事务故障的恢复,如何进行系统故障的恢复,以及如何进行介质故障的恢复。)
事务故障恢复:由恢复子系统应利用日志文件撤消(UNDO)此事务已对数据库进行的修改。事务故障的恢复由系统自动完成,不需要用户干预。
事务故障恢复步骤:
反向扫描文件日志(即从最后向前扫描日志文件),查找该事务的更新操作。
对该事务的更新操作执行逆操作。即将日志记录中。
继续反向扫描日志文件,查找该事务的其他更新操作,并做同样处理。
如此处理下去,直至读到此事务的开始标记,事务故障恢复就完成了。
系统故障恢复: ①Undo 故障发生时未完成的事务;②Redo 已完成的事务。系统故障的恢复由系统在重新启动时自动完成,不需要用户干预。
系统故障恢复步骤:
1.正向扫描日志文件,找出在故障发生前已经提交的事务队列(REDO队列)和未完成的事务队列(UNDO队列)。
2.对撤销队列中的各个事务进行UNDO处理。
进行UNDO处理的方法是,反向扫描日志文件,对每个UNDO事务的更新操作执行逆操作,即将日志记录中“更新前的值”写入数据库。
3.对重做队列中的各个事务进行REDO处理。
进行REDO处理的方法是:正向扫描日志文件,对每个REDO事务重新执行日志文件登记的操作。即将日志记录中“更新后的值”写入数据库。
介质故障的恢复方法:重装数据库,然后重做已完成的事务。
介质故障恢复的步骤:
1.装入最新的数据库后备副本(离故障发生时刻最近的转储副本),使数据库恢复到转储时的一致性状态。
2.装入相应的日志文件副本(转储结束时刻的日志文件副件),重做已完成的事务。即首先扫描日志文件,找出故障发生时已提交的事务的标识,将其记入重做队列;然后正向扫描日志文件,对重做队列中的所有事务进行重做处理。即将日志记录中“更新后的值”写入数据库。
第十一章
1.在数据库中为什么要并发控制?并发控制技术能保证事务的哪些特性?
数据库是共享资源,通常有许多个事务同时在运行。当多个事务并发地存取数据库时就会产生多个事务同时存取同一数据的情况。若对并发操作不加控制就可能会存取和存储不正确的数据,破坏事务的一致性和数据库的一致性。所以数据库管理系统必须提供并发控制机制。
并发控制技术能保证事务的隔离性和一致性。
2.并发操作可能会产生哪几类数据不一致?用什么方可能避免各种不一致的情况?
丢失修改(lost update);不可重复读(non-repeatable read);读“脏”数据(dirty read)。
并发控制的主要技术有封锁、时间戳、乐观控制法和多版本并发控制等。
3.什么是封锁?基本的封锁类型有几种?试述它们的含义。
封锁就是事务T在对某个数据对象(例如表、记录等)操作之前,先向系统发出请求,对其加锁。加锁后事务T就对该数据对象有了一定的控制,在事务T释放它的锁之前,其它的事务不能更新此数据对象。
基本封锁类型:排它锁(eXclusive lock,简记为X锁)和共享锁(Share lock,简记为S锁)。
排它锁又称为写锁,若事务T对数据对象A加上X锁,则只允许T读取和修改A,其它任何事务都不能再对A加任何类型的锁,直到T释放A上的锁。
共享锁又称为读锁,若事务T对数据对象A加上S锁,则其它事务只能再对A加S锁,而不能加X锁,直到T释放A上的S锁。
11.试证明若发生并发事务遵守的两段锁协议,则对这些事务的并发调度是可串行化的。